231 research outputs found

    Ptolemaic Indexing

    Full text link
    This paper discusses a new family of bounds for use in similarity search, related to those used in metric indexing, but based on Ptolemy's inequality, rather than the metric axioms. Ptolemy's inequality holds for the well-known Euclidean distance, but is also shown here to hold for quadratic form metrics in general, with Mahalanobis distance as an important special case. The inequality is examined empirically on both synthetic and real-world data sets and is also found to hold approximately, with a very low degree of error, for important distances such as the angular pseudometric and several Lp norms. Indexing experiments demonstrate a highly increased filtering power compared to existing, triangular methods. It is also shown that combining the Ptolemaic and triangular filtering can lead to better results than using either approach on its own

    CBR and MBR techniques: review for an application in the emergencies domain

    Get PDF
    The purpose of this document is to provide an in-depth analysis of current reasoning engine practice and the integration strategies of Case Based Reasoning and Model Based Reasoning that will be used in the design and development of the RIMSAT system. RIMSAT (Remote Intelligent Management Support and Training) is a European Commission funded project designed to: a.. Provide an innovative, 'intelligent', knowledge based solution aimed at improving the quality of critical decisions b.. Enhance the competencies and responsiveness of individuals and organisations involved in highly complex, safety critical incidents - irrespective of their location. In other words, RIMSAT aims to design and implement a decision support system that using Case Base Reasoning as well as Model Base Reasoning technology is applied in the management of emergency situations. This document is part of a deliverable for RIMSAT project, and although it has been done in close contact with the requirements of the project, it provides an overview wide enough for providing a state of the art in integration strategies between CBR and MBR technologies.Postprint (published version

    MONIL Language, an Alternative for Data Integration El Lenguaje MONIL, una Alternativa para la Integración de Datos

    Get PDF
    Abstract Data integration is a process of retrieving, merging and storing of data originated in heterogeneous sources of data. The main problem facing the data integration is the structural and semantic heterogeneity of participating data. A concern of research communities in computer sciences is the development of semi-automatic tools to assist the user in an effective way in the data integration processes. This paper introduces a programming language called MONIL, as an alternative to integrate data by means of design, storage and program execution. MONIL is based on the use of meta-data, conversion functions, a meta-model of integration and a scheme of integration suggestions. MONIL offers to the user a dedicated work environment with built-in semi-automatic tools supporting the integration process in three stages. Keywords: data integration, integration language, databases, metadata. Resumen La integración de datos es el proceso de extracción, mezcla y almacenamiento de datos provenientes de fuentes de datos heterogéneas. El problema principal que enfrenta la integración de datos es la heterogeneidad estructural y semántica de los datos que participan. Una preocupación en las comunidades de investigación de las ciencias computacionales, es el desarrollo de herramientas semiautomáticas que asistan a los usuarios de forma efectiva en los procesos de integración de datos. Este artículo presenta un lenguaje de programación llamado MONIL, como una alternativa para integrar datos mediante el diseño, almacenamiento y ejecución de programas. MONIL está basado en el uso de metadatos, funciones de conversión, un metamodelo de integración y un esquema de sugerencias de integración. MONIL ofrece al usuario un ambiente de trabajo dedicado con herramientas semiautomáticas integradas y que soportan un proceso de integración en tres etapas. Palabras claves: integración de datos, lenguaje de integración, bases de datos, bodegas de datos, metadatos

    Business Improvement Districts: A Systematic Review of an Urban Governance Model towards City Center Revitalization

    Get PDF
    For some time, business improvement districts (BIDs) have entered into the discourse and practice of academics and urban planners. This model for town centre revitalization was created in North America, whose success has led to its transfer to a growing number of countries. This evolution highlights the importance of BIDs as an urban planning practice, as well as an object of study for academics interested in new models for intervening in central urban areas. BIDs are public–private partnerships, framed within an entrepreneurial logic of urban management that aims to increase the cities’ competitiveness. In this article, we aim to unfold the main research subjects of the literature focused on BIDs. We develop a systematic review for said endeavor, resorting to the established PRISMA protocol. After the screening and analysis of selected articles, four main research subjects were documented: (i) urban governance; (ii) urban policies: mobility and transfer; (iii) activities/axis of intervention; and (iv) types of BIDs/places of intervention. The selected literature enhances the contradictory nature of BIDs, ranging from the economic revitalization of city centres to the occasional exclusionary stance, in which it is developed. Our analysis also points to the important role of different actors in all stages of the policy transfer and implementation.info:eu-repo/semantics/publishedVersio

    Parametrização da estrutura de dados métrica RLC

    Get PDF
    Dissertação para obtenção do Grau de Mestre em Engenharia InformáticaEm muitas aplicações, existe a necessidade de pesquisar objectos semelhantes ou próximos de um objecto dado. Exemplos desses objectos incluem imagens médicas ou de rostos, sequências de proteínas ou de ADN, palavras de uma língua ou trajectórias de furacões. As pesquisas por proximidade podem ser formalizadas no contexto de espaços métricos, onde a semelhança entre dois elementos do domínio é medida através da função de distância. Como, em geral, as bases de dados possuem muitos elementos e o cálculo da distância entre dois objectos é uma operação cara, foram desenvolvidas estruturas de dados que tentam minimizar o número de distâncias calculadas durante as pesquisas deste tipo, designadas por estruturas de dados métricas. Nesta tese, faz-se um levantamento dos espaços métricos mais frequentemente usados nos testes de desempenho das estruturas de dados métricas. Depois, descreve-se a evolução da estrutura de dados métrica Recursive Lists of Clusters (RLC), caracterizando-se as suas variantes. O desempenho da RLC, tal como o de qualquer estrutura de dados métrica parametrizada, depende fortemente dos valores dos seus parâmetros. O problema é que os valores mais adequados a cada espaço métrico têm sido encontrados por observação de resultados experimentais, tornando o processo de parametrização pouco fiável e muito moroso. Para atacar esta questão, propõe-se uma nova variante da RLC cujos valores dos parâmetros dependem de valores extraídos do espaço métrico. Os resultados experimentais, que envolvem quinze espaços métricos de diferentes domínios, mostram que a nova variante é mais eficiente do que a anterior

    Pesquisa de imagens de rosto

    Get PDF
    Dissertação de Mestrado em Engenharia InformáticaEm muitas aplicações existe a necessidade de obter da base de dados o conjunto de imagens de rosto semelhantes a uma dada imagem de consulta. Como forma de comparar imagens de rosto são usadas medidas de semelhança que permitem medir a similaridade entre duas imagens. A similaridade entre duas imagens é calculada com base nas características extraídas de cada imagem de rosto. No entanto, a alta dimensão das imagens de rosto leva a que a computação da medida de distância seja bastante pesada. Em bases de dados com um grande volume de dados, a pesquisa de imagens de rosto semelhantes a uma dada imagem de consulta pode tornar-se impraticável,principalmente se for realizada de forma exaustiva. Uma forma de agilizar a pesquisa por semelhança em espaços métricos é usando estruturas de dados métricas. Neste trabalho pretende-se avaliar a aplicabilidade e eficiência das estruturas de dados métricas na pesquisa por semelhança de imagens de rosto. Este trabalho envolveu um estudo das representações de imagens de rosto e das funções de distância entre imagens de rosto de modo a avaliar a aplicabilidade das estruturas de dados métricas, e uma avaliação da pesquisa por alcance com 8 estruturas de dados métricas em 4 bases de dados sobre 4 espaços métricos. Os resultados obtidos nesta avaliação permitem afirmar que as estruturas de dados métricas podem ser usadas neste domínio de aplicação e que na pesquisa por alcance a sua utilização minimiza significativamente o número de cálculos realizados face à pesquisa exaustiva, principalmente em bases de dados de grandes dimensões

    Phrase table pruning for Statistical Machine Translation

    Get PDF
    Phrase-Based Statistical Machine Translation systems model the translation process using pairs of corresponding sequences of words extracted from parallel corpora. These biphrases are stored in phrase tables that typically contain several millions such entries, making it di cult to assess their quality without going to the end of the translation process. Our work is based on the examplifying study of phrase tables generated from the Europarl data, from French to English. We give some statistical information about the biphrases contained in the phrase table, evaluate the coverage of previously unseen sentences and analyse the e ects of pruning on the translation

    Formulations and identification of algorithmic solutions for enabling opportunistic networks - M4.1

    Get PDF
    Milestone M4.1 del projecte Europeu OneFIT (ICT-2009-257385).This document contains a detailed description of the algorithms to be implemented to manage the opportunistic networks. There are defined according to the functional and system architecture (WP2) to fulfil the technical challenges. These algorithms will implemented during the WP4.2 and validated during the WP4.3Postprint (published version
    corecore