48 research outputs found

    List of Clustered Permutations in Secondary Memory

    Get PDF
    Similarity search is a difficult problem and various indexing schemas have been defined to process similarity queries efficiently in many applications, including multimedia databases and other repositories handling complex objects. Metric indices support efficient similarity searches, but most of them are designed for main memory. Thus, they can handle only small datasets, suffering serious performance degradations when the objects reside on disk.Most real-life database applications require indices able to work on secondary memory. Among a plethora of indices, the List of Clustered Permutations (LCP) has shown to be competitive in main memory, since groups the permutations and establishes a criterion to discard whole clusters according the permutation of their centers. We introduce a secondary-memory variant of the LCP, which maintains the low number of distance evaluations when comparing the permutations themselves, and also needs a low number of I/O operations at construction and searching.XII Workshop Bases de Datos y Minería de Datos (WBDDM)Red de Universidades con Carreras en Informática (RedUNCI

    List of clustered permutations in secondary memory for proximity searching

    Get PDF
    Similarity search is a difficult problem and various indexing schemas have been defined to process similarity queries efficiently in many applications, including multimedia databases and other repositories handling complex objects. Metric indices support efficient similarity searches, but most of them are designed for main memory. Thus, they can handle only small datasets, suffering serious performance degradations when the objects reside on disk. Most reallife database applications require indices able to work on secondary memory. Among a plethora of indices, the List of Clustered Permutations (LCP) has shown to be competitive in main memory.We introduce a secondary-memory variant of the LCP, which maintains the low number of distance evaluations when comparing the permutations themselves, and also needs a low number of I/O operations at construction and searching.Facultad de Informátic

    List of clustered permutations in secondary memory for proximity searching

    Get PDF
    Similarity search is a difficult problem and various indexing schemas have been defined to process similarity queries efficiently in many applications, including multimedia databases and other repositories handling complex objects. Metric indices support efficient similarity searches, but most of them are designed for main memory. Thus, they can handle only small datasets, suffering serious performance degradations when the objects reside on disk. Most reallife database applications require indices able to work on secondary memory. Among a plethora of indices, the List of Clustered Permutations (LCP) has shown to be competitive in main memory.We introduce a secondary-memory variant of the LCP, which maintains the low number of distance evaluations when comparing the permutations themselves, and also needs a low number of I/O operations at construction and searching.Facultad de Informátic

    Distal Dynamic Spatial Approximation Forest

    Get PDF
    Querying large datasets by proximity, using a distance under the metric space model, has a large number of applications in multimedia, pattern recognition, statistics, etc. There is an ever growing number of indexes and algorithms for proximity querying, however there is only a handful of indexes able to perform well without user intervention to select parameters. One of such indexes is the Distal Spatial Approximation Tree (DiSAT) which is parameter-less and has demonstrated to be very efficient outperforming other approaches. The main drawback of the DiSAT is its static nature, that is, once built, it is difficult to add or to remove new elements. This drawback prevents the use of the DiSAT for many interesting applications. In this paper we overcome this weakness. We use a standard technique, the Bentley and Saxe algorithm, to produce a new index which is dynamic while retaining the simplicity and appeal for practitioners of the DiSAT. In order to improve the DiSAF performance, we do not attempt to directly apply the Bentley and Saxe technique, but we enhance its application by taking advantage of our deep knowledge of the DiSAT behavior.XIII Workshop Bases de datos y Minería de Datos (WBDMD).Red de Universidades con Carreras en Informática (RedUNCI

    Distal Dynamic Spatial Approximation Forest

    Get PDF
    Querying large datasets by proximity, using a distance under the metric space model, has a large number of applications in multimedia, pattern recognition, statistics, etc. There is an ever growing number of indexes and algorithms for proximity querying, however there is only a handful of indexes able to perform well without user intervention to select parameters. One of such indexes is the Distal Spatial Approximation Tree (DiSAT) which is parameter-less and has demonstrated to be very efficient outperforming other approaches. The main drawback of the DiSAT is its static nature, that is, once built, it is difficult to add or to remove new elements. This drawback prevents the use of the DiSAT for many interesting applications. In this paper we overcome this weakness. We use a standard technique, the Bentley and Saxe algorithm, to produce a new index which is dynamic while retaining the simplicity and appeal for practitioners of the DiSAT. In order to improve the DiSAF performance, we do not attempt to directly apply the Bentley and Saxe technique, but we enhance its application by taking advantage of our deep knowledge of the DiSAT behavior.XIII Workshop Bases de datos y Minería de Datos (WBDMD).Red de Universidades con Carreras en Informática (RedUNCI

    Uso de grafos geométricos para calcular join por similitud en espacios métricos

    Get PDF
    A diferencia de la aproximación para bases de datos tradicionales, la comunidad de Recuperación de Información siempre ha considerado los resultados de las búsquedas como una lista rankeada de objetos. Dada una consulta, algunos objetos son más relevantes a la especificación de la consulta que otros y los usuarios habitualmente están interesados en los objetos más relevantes, es decir los objetos cuyo ranking es más alto. Este paradigma de búsqueda recientemente se ha generalizado en un modelo en el cual un conjunto de objetos pueden sólo compararse de a pares a través de una medida de distancia que satisface las propiedades de un espacio métrico [CBNM2001], [Samet2005], [ZADB2006].Eje: Ingeniería de Software y Base de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Uso de grafos geométricos para calcular join por similitud en espacios métricos

    Get PDF
    A diferencia de la aproximación para bases de datos tradicionales, la comunidad de Recuperación de Información siempre ha considerado los resultados de las búsquedas como una lista rankeada de objetos. Dada una consulta, algunos objetos son más relevantes a la especificación de la consulta que otros y los usuarios habitualmente están interesados en los objetos más relevantes, es decir los objetos cuyo ranking es más alto. Este paradigma de búsqueda recientemente se ha generalizado en un modelo en el cual un conjunto de objetos pueden sólo compararse de a pares a través de una medida de distancia que satisface las propiedades de un espacio métrico [CBNM2001], [Samet2005], [ZADB2006].Eje: Ingeniería de Software y Base de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Recuperación de información multimedia

    Get PDF
    Las principales dificultades al momento de realizar una búsqueda multimedia son, por un lado, la dificultad de los usuarios de especificar sus intereses en forma clara y como una consulta bien definida, y por otro lado, el problema de la extracción de las características relevantes de los objetos multimedia. Además las respuestas se ven afectadas, entre otras cosas, por la forma de representación y almacenamiento de los datos y por el costo de la transferencia de los mismos ya sea entre distintos dispositivos de almacenamiento en la jerarquía de memorias, o sobre una red. Dada una consulta al sistema, el objetivo clave de un sistema de recuperación de información es recuperar la informacion que podría ser útil o relevante para el usuario. Por lo tanto, nuestra propuesta se enfoca en tratar de mejorar las herramientas de recuperación de información multimedia desarrollando nuevas técnicas capaces de soportar la interacción con el usuario, diseñando nuevas estructuras de datos (índices) capaces de manipular eficientemente datos multimedia y buscando representaciones que reflejen más adecuadamente las características de interés de los objetos multimedia.Eje: Bases de datos y minería de datosRed de Universidades con Carreras en Informática (RedUNCI

    List of Clustered Permutations in Secondary Memory

    Get PDF
    Similarity search is a difficult problem and various indexing schemas have been defined to process similarity queries efficiently in many applications, including multimedia databases and other repositories handling complex objects. Metric indices support efficient similarity searches, but most of them are designed for main memory. Thus, they can handle only small datasets, suffering serious performance degradations when the objects reside on disk.Most real-life database applications require indices able to work on secondary memory. Among a plethora of indices, the List of Clustered Permutations (LCP) has shown to be competitive in main memory, since groups the permutations and establishes a criterion to discard whole clusters according the permutation of their centers. We introduce a secondary-memory variant of the LCP, which maintains the low number of distance evaluations when comparing the permutations themselves, and also needs a low number of I/O operations at construction and searching.XII Workshop Bases de Datos y Minería de Datos (WBDDM)Red de Universidades con Carreras en Informática (RedUNCI

    Recuperación de información multimedia

    Get PDF
    Las principales dificultades al momento de realizar una búsqueda multimedia son, por un lado, la dificultad de los usuarios de especificar sus intereses en forma clara y como una consulta bien definida, y por otro lado, el problema de la extracción de las características relevantes de los objetos multimedia. Además las respuestas se ven afectadas, entre otras cosas, por la forma de representación y almacenamiento de los datos y por el costo de la transferencia de los mismos ya sea entre distintos dispositivos de almacenamiento en la jerarquía de memorias, o sobre una red. Dada una consulta al sistema, el objetivo clave de un sistema de recuperación de información es recuperar la informacion que podría ser útil o relevante para el usuario. Por lo tanto, nuestra propuesta se enfoca en tratar de mejorar las herramientas de recuperación de información multimedia desarrollando nuevas técnicas capaces de soportar la interacción con el usuario, diseñando nuevas estructuras de datos (índices) capaces de manipular eficientemente datos multimedia y buscando representaciones que reflejen más adecuadamente las características de interés de los objetos multimedia.Eje: Bases de datos y minería de datosRed de Universidades con Carreras en Informática (RedUNCI
    corecore