35,162 research outputs found
CHORUS Deliverable 2.1: State of the Art on Multimedia Search Engines
Based on the information provided by European projects and national initiatives related to multimedia search as well as domains experts that participated in the CHORUS Think-thanks and workshops, this document reports on the state of the art related to multimedia content search from, a technical, and socio-economic perspective.
The technical perspective includes an up to date view on content based indexing and retrieval technologies, multimedia search in the context of mobile devices and peer-to-peer networks, and an overview of current evaluation and benchmark inititiatives to measure the performance of multimedia search engines.
From a socio-economic perspective we inventorize the impact and legal consequences of these technical advances and point out future directions of research
Composite structural motifs of binding sites for delineating biological functions of proteins
Most biological processes are described as a series of interactions between
proteins and other molecules, and interactions are in turn described in terms
of atomic structures. To annotate protein functions as sets of interaction
states at atomic resolution, and thereby to better understand the relation
between protein interactions and biological functions, we conducted exhaustive
all-against-all atomic structure comparisons of all known binding sites for
ligands including small molecules, proteins and nucleic acids, and identified
recurring elementary motifs. By integrating the elementary motifs associated
with each subunit, we defined composite motifs which represent
context-dependent combinations of elementary motifs. It is demonstrated that
function similarity can be better inferred from composite motif similarity
compared to the similarity of protein sequences or of individual binding sites.
By integrating the composite motifs associated with each protein function, we
define meta-composite motifs each of which is regarded as a time-independent
diagrammatic representation of a biological process. It is shown that
meta-composite motifs provide richer annotations of biological processes than
sequence clusters. The present results serve as a basis for bridging atomic
structures to higher-order biological phenomena by classification and
integration of binding site structures.Comment: 34 pages, 7 figure
Management of Scientific Images: An approach to the extraction, annotation and retrieval of figures in the field of High Energy Physics
El entorno de la informaciĂłn en la primera dĂ©cada del siglo XXI no tiene precedentes. Las barreras fĂsicas que han limitado el acceso al conocimiento están desapareciendo a medida que los mĂ©todos tradicionales de acceso a informaciĂłn se reemplazan o se mejoran gracias al uso de sistemas basados en computador. Los sistemas digitales son capaces de gestionar colecciones mucho más grandes de documentos, confrontando a los usuarios de informaciĂłn con la avalancha de documentos asociados a su tĂłpico de interĂ©s. Esta nueva situaciĂłn ha creado un incentivo para el desarrollo de tĂ©cnicas de minerĂa de datos y la creaciĂłn de motores de bĂşsqueda más eficientes y capaces de limitar los resultados de bĂşsqueda a un subconjunto reducido de los más relevantes. Sin embargo, la mayorĂa de los motores de bĂşsqueda en la actualidad trabajan con descripciones textuales. Estas descripciones se pueden extraer o bien del contenido o a travĂ©s de fuentes externas. La recuperaciĂłn basada en el contenido no textual de documentos es un tema de investigaciĂłn continua. En particular, la recuperaciĂłn de imágenes y el desentrañar la informaciĂłn contenida en ellas están suscitando un gran interĂ©s en la comunidad cientĂfica. Las bibliotecas digitales se sitĂşan en una posiciĂłn especial dentro de los sistemas que facilitan el acceso al conocimiento. ActĂşan como repositorios de documentos que comparten algunas caracterĂsticas comunes (por ejemplo, pertenecer a la misma área de conocimiento o ser publicados por la misma instituciĂłn) y como tales contienen documentos considerados de interĂ©s para un grupo particular de usuarios. Además, facilitan funcionalidades de recuperaciĂłn sobre las colecciones gestionadas. Normalmente, las publicaciones cientĂficas son las unidades más pequeñas gestionadas por las bibliotecas digitales cientĂficas. Sin embargo, en el proceso de creaciĂłn cientĂfica hay diferentes tipos de artefactos, entre otros: figuras y conjuntos de datos. Las figuras juegan un papel particularmente importante en el proceso de publicaciĂłn cientĂfica. Representan los datos en una forma gráfica que nos permite mostrar patrones sobre grandes conjuntos de datos y transmitir ideas complejas de un modo fácilmente entendible. Los sistemas existentes para bibliotecas digitales facilitan el acceso a figuras, pero solo como parte de los ficheros sobre los que se serializa la publicaciĂłn entera. El objetivo de esta tesis es proponer un conjunto de mĂ©todos ytĂ©cnicas que permitan transformar las figuras en productos de primera clase dentro del proceso de publicaciĂłn cientĂfica, permitiendo que los investigadores puedan obtener el máximo beneficio a la hora de realizar bĂşsquedas y revisiones de bibliografĂa existente. Los mĂ©todos y tĂ©cnicas propuestos están orientados a facilitar la adquisiciĂłn, anotaciĂłn semántica y bĂşsqueda de figuras contenidas en publicaciones cientĂficas. Para demostrar la completitud de la investigaciĂłn se han ilustrado las teorĂas propuestas mediante ejemplos en el campo de la FĂsica de PartĂculas (tambiĂ©n conocido como FĂsica de Altas EnergĂas). Para aquellos casos en los que se han necesitadoo en las figuras que aparecen con más frecuencia en las publicaciones de FĂsica de PartĂculas: los gráficos cientĂficos denominados en inglĂ©s con el tĂ©rmino plots. Los prototipos que propuestas más detalladas han desarrollado para esta tesis se han integrado parcialmente dentro del software Invenio (1) para bibliotecas digitales, asĂ como dentro de INSPIRE, una de las mayores bibliotecas digitales en FĂsica de PartĂculas mantenida gracias a la colaboraciĂłn de grandes laboratorios y centros de investigaciĂłn como son el CERN, SLAC, DESY y Fermilab. 1). http://invenio-software.org
Digital Image Access & Retrieval
The 33th Annual Clinic on Library Applications of Data Processing, held at the University of Illinois at Urbana-Champaign in March of 1996, addressed the theme of "Digital Image Access & Retrieval." The papers from this conference cover a wide range of topics concerning digital imaging technology for visual resource collections. Papers covered three general areas: (1) systems, planning, and implementation; (2) automatic and semi-automatic indexing; and (3) preservation with the bulk of the conference focusing on indexing and retrieval.published or submitted for publicatio
- …