241 research outputs found

    XML Matchers: approaches and challenges

    Full text link
    Schema Matching, i.e. the process of discovering semantic correspondences between concepts adopted in different data source schemas, has been a key topic in Database and Artificial Intelligence research areas for many years. In the past, it was largely investigated especially for classical database models (e.g., E/R schemas, relational databases, etc.). However, in the latest years, the widespread adoption of XML in the most disparate application fields pushed a growing number of researchers to design XML-specific Schema Matching approaches, called XML Matchers, aiming at finding semantic matchings between concepts defined in DTDs and XSDs. XML Matchers do not just take well-known techniques originally designed for other data models and apply them on DTDs/XSDs, but they exploit specific XML features (e.g., the hierarchical structure of a DTD/XSD) to improve the performance of the Schema Matching process. The design of XML Matchers is currently a well-established research area. The main goal of this paper is to provide a detailed description and classification of XML Matchers. We first describe to what extent the specificities of DTDs/XSDs impact on the Schema Matching task. Then we introduce a template, called XML Matcher Template, that describes the main components of an XML Matcher, their role and behavior. We illustrate how each of these components has been implemented in some popular XML Matchers. We consider our XML Matcher Template as the baseline for objectively comparing approaches that, at first glance, might appear as unrelated. The introduction of this template can be useful in the design of future XML Matchers. Finally, we analyze commercial tools implementing XML Matchers and introduce two challenging issues strictly related to this topic, namely XML source clustering and uncertainty management in XML Matchers.Comment: 34 pages, 8 tables, 7 figure

    Client service capability matching

    Get PDF
    In order to tailor web-content to the requirements of a device, it is necessary to access information about the attributes of both the device and the web content Profiles containing such information from heterogeneous sources may use many different terms to represent the same concept (eg Resolution/Screen_Res/Res). This can present problems for applications which try to interpret the semantics of these terms In this thesis, we present an architecture which, when given profiles describing a device and web service, can identify terms that are present in an ontology of recognised terms in the domain of device capabilities and web service requirements The architecture can semi-automatically identify unknown terms by combining the results of several schemamatching applications. The ontology can be expanded based on end-user’s interaction with the semi-automatic matchers and thus over time the application’s ontology will grow to include previously unknown terms

    Mixing Biometric Data For Generating Joint Identities and Preserving Privacy

    Get PDF
    Biometrics is the science of automatically recognizing individuals by utilizing biological traits such as fingerprints, face, iris and voice. A classical biometric system digitizes the human body and uses this digitized identity for human recognition. In this work, we introduce the concept of mixing biometrics. Mixing biometrics refers to the process of generating a new biometric image by fusing images of different fingers, different faces, or different irises. The resultant mixed image can be used directly in the feature extraction and matching stages of an existing biometric system. In this regard, we design and systematically evaluate novel methods for generating mixed images for the fingerprint, iris and face modalities. Further, we extend the concept of mixing to accommodate two distinct modalities of an individual, viz., fingerprint and iris. The utility of mixing biometrics is demonstrated in two different applications. The first application deals with the issue of generating a joint digital identity. A joint identity inherits its uniqueness from two or more individuals and can be used in scenarios such as joint bank accounts or two-man rule systems. The second application deals with the issue of biometric privacy, where the concept of mixing is used for de-identifying or obscuring biometric images and for generating cancelable biometrics. Extensive experimental analysis suggests that the concept of biometric mixing has several benefits and can be easily incorporated into existing biometric systems

    A tool for ontology instance matching

    Get PDF
    Tese de mestrado em Informática, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2013A Web Semântica pretende fornecer formatos comuns para caracterizar semanticamente os dados publicados na Web, melhorando a interoperabilidade e integração de dados. A iniciativa Linked Data visa ligar dados relacionados que não foram previamente ligados. As ontologias têm um papel fundamental nisso, pois, fornecem vocabulários controlados, para caracterizar semanticamente os dados de uma forma inequívoca. Conforme definido por Gruber, uma ontologia é uma especificação de uma conceituação, que se destina a modelar um domínio em particular. A especificação de uma ontologia é composto por dois tipos de declarações: TBox (classes) e ABox (exemplares). TBox são classes que são interpretadas como um conjunto de indivíduos no domínio; ABox são exemplares que são interpretados como indivíduos particulares de um domínio. Al´em disso, uma ontologia também é composta por: Relacionamentos ou relações entre classes e/ou exemplares; Tipos de dados são partes particulares do domínio que especificam valores; Valores de dados são valores simples. Apesar de uma ontologia se destinar a modelar um domínio em particular, existem muitas ontologias de diferentes fontes a modelar o mesmo domínio, isto é, existe um problema de sobreposição. O problema de sobreposição consiste em ontologias distintas que representam as mesmas entidades de uma forma diferente. É, portanto, necessário criar processos capazes de encontrar as sobreposições e fundi-las. Emparelhamento de ontologias é geralmente aplicado para alinhar duas TBox de duas ontologias diferentes, ou seja, para encontrar relações ou correspondências entre as classes ontológicas. Há um caso particular de emparelhamento de ontologias, o Emparelhamento de Exemplares. O objetivo do emparelhamento de exemplares é alinhar dois ABox de duas ontologias diferentes, ou seja, encontrar as correspondências entre exemplares de diferentes ontologias. O Emparelhamento de Exemplares adota o princípio de que, quanto maior for a semelhança entre duas descriçõees de exemplares de duas ontologias distintas, maior é a probabilidade de estes exemplares representarem a mesma entidade de um determinado domínio. Por exemplo, no domínio político, vamos considerar o actual Presidente da Comissão Europeia, Durão Barroso e assumir que na Ontologia 1 tem um exemplar com o descritor: “José Manuel Durão Barroso”, e Ontologia 2 tem um exemplar com o descritor: “José Durão Barroso”. Portanto, é necessário implementar técnicas de emparelhamento de exemplares, para descobrir se estes dois exemplares destas duas ontologias diferentes correspondem à mesma pessoa/entidade, isto é, se eles emparelham. Os objectivos desta dissertação eram: Desenvolvimento de algoritmos de emparelhamento de exemplares que visou o desenvolvimento de algoritmos para o emparelhamento de ontologias ao nível dos seus exemplares, de forma a resolver problemas de emparelhamento de exemplares. O desenvolvimento de algoritmos foi baseado em técnicas de emparelhamento de exemplares já propostas por outros; Alinhamento de exemplares do mundo real Que visou a aplicação dos algoritmos desenvolvidos, para gerar emparelhamentos de alta qualidade em exemplares do mundo real, e avaliar a sua qualidade em termos de Precisão, Sensibilidade, Medida-F, Exatidão e Exatidão Unilateral; Desenvolvimento de um emparelhador de exemplares Web Que visou o desenvolvimento de uma ferramenta capaz de realizar emparelhamento de exemplares através da Web, incorporando os algoritmos desenvolvidos por mim. Os resultados alcançados por esta dissertação foram a produção de alinhamentos de exemplares, entre as ontologias POWER-DBpediaPT, POWER-Verbetes e POWERPOWER. Estas três ontologias contêm exemplares que representam entidades políticas. E também entre as ontologias provenientes do OAEI 2012. O OAEI (Ontology Alignment Evaluation Initiative), é um concurso internacional, realizado todos os anos, que entre vários tipos de competições, tem uma dedicada à avaliação de ferramentas e de técnicas de emparelhamento de exemplares. Para avaliar a qualidade dos alinhamentos produzidos foram implementadas as seguintes métricas: Precisão; Sensibilidade; Medida-F; Exatidão; e Exatidão Unilateral. Esta dissertação também produziu um emparelhador de exemplares disponível através da Web, que implementa as métricas mencionadas para avaliar os alinhamentos produzidos por ele. POWER (Politics Ontology for Web Entity Retrieval) é uma ontologia que modela o domínio da política portuguesa, que foi desenvolvida e fornecida pela grupo REACTION. Os seus exemplares foram alinhados com os das ontologias DBpediaPT e Verbetes. A DBpediaPT é uma ontologia que contém exemplares que representam entidades da DBpedia versão 3.8. Cada entidade é referida na versão Portuguesa da Wikipédia. Esta ontologia foi construída a partir de uma lista, fornecida pelo grupo REACTION. Verbetes é uma ontologia, cujos os exemplares representam entidades que têm pelo menos cinco ocorrências nas notícias agregadas pelo serviço SAPO Verbetes. Para avaliar o alinhamento POWER-DBpediaPT foi usada a métrica Exatidão Unilateral. Usando o algoritmo de emparelhamento FirstLastNamePlusJaccard, alcançou-se 97.29% de Exatidão Unilateral para o POWER, e 87.25% de Exatidão Unilateral para o DBpediaPT. Usando o algoritmo de emparelhamento Stratified 10-fold Cross-Validation, alcançou-se 99.11% de Exatidão Unilateral para o POWER, e 95.97% de Exatidão Unilateral para o DBpediaPT. Estes foram os melhores resultados conseguidos para este alinhamento. No caso do alinhamento POWER-Verbetes não foram calculadas métricas mas, fez-se uma avaliação manual pela minha parte e pela parte do grupo REACTION, e foi positiva. Além disso, porque o POWER contém exemplares duplicados, ou seja, dois ou mais exemplares a representarem a mesma entidade, foi efectuado o alinhamento POWER-POWER de forma a encontrar os exemplares duplicados. No caso do POWER, estas situações não podiam acontecer. O alinhamento foi entregue ao grupo REACTION, para eles poderem melhorar a sua ontologia. Estes dois alinhamentos, POWER-Verbetes e POWER-POWER, foram realizados pelo algoritmo de emparelhamento MachineLearning. Foram também realizados alinhamentos de exemplares entre as ontologias fornecidas pelo OAEI 2012. Estas ontologias encontram-se divididas em dois grupos: o Sandbox que contém onze ontologias; e o IIMB que contém oitenta ontologias. Os alinhamentos produzidos foram realizados dentro de cada grupo. Neste caso, os algoritmos de emparelhamento utilizados foram FirstLastNamePlusJaccard e o Stratified 10-fold Cross- Validation. Na maioria dos alinhamentos produzidos a Medida-F foi maior no segundo algoritmo do que no primeiro. Todas as ontologias cujos exemplares foram alinhados, e os seus respectivos alinhamentos e métricas, estão disponíveis através da ligação: http://lasige.di.fc.ul.pt/webtools/instancematcher/dissertation_work.zip. O emparelhador de exemplares Web, foi outra realização desta dissertação, e está disponível através da ligação: http://lasige.di.fc.ul.pt/webtools/instancematcher/. Este disponibiliza aos utilizadores dois algoritmos de emparelhamento: o FirstLastNamePlusJaccard; e o MachineLearning. Além disso, também permite que o utilizador escolha que tipo de alinhamentos quer. Um-para-um (em Inglês: one-to-one) ou muitos-para-muitos (em Inglês: many-to-many). No primeiro caso, cada exemplar só pode estar presente uma vez no alinhamento, isto é, não pode haver mais do que um emparelhamento por exemplar; no segundo caso, cada exemplar pode estar presente várias vezes no alinhamento, ou seja, pode haver mais do que um emparelhamento por exemplar. Os alinhamentos POWER-DBpediaPT e POWER-Verbetes foram um-para-um. E os alinhamentos OAEI 2012 e POWER-POWER foram muitos-para-muitos. Há ainda a opção Limiar (em Inglês: Threshold) que permite ao utilizador indicar qual é o valor mínimo dos alinhamentos devolvidos pelo emparelhador de exemplares Web. Em cada alinhamento de exemplares é atribuído um valor [0,1] pelos algoritmos de emparelhamento, que determina o grau de confiabilidade/certeza do alinhamento estabelecido. No alinhamento também se podem encontrar exemplares que emparelham para nada, ou seja, para NULL. Estes, são os exemplares para os quais o algoritmo de emparelhamento escolhido, não encontrou nenhum exemplar correspondente. Para que o emparelhador de exemplares Web devolva métricas que atestem a qualidade do alinhamento produzido, o utilizador tem que introduzir o alinhamento de referência (em Inglês: Reference Alignment). Este é um documento, que se assume, que contenha todos os emparelhamentos correctos entre os exemplares de duas ontologias. As métricas são calculadas aquando da comparação do alinhamento produzido com o alinhamento de referência. Existem ainda as opções POWER 2010 e OAEI 2012, que permitem indicar ao emparelhador de exemplares Web, que os exemplares a emparelhar são do POWER e do OAEI 2012. É também necessário que o utilizador insira os identificadores dos descritores dos exemplares, para que o emparelhador obtenha a informação necessária para poder efectuar os alinhamentos. Cada identificador tem que começar pelo prefixo http.An ontology is an object-based conceptualization of some particular domain. An ontology provides a shared controlled vocabulary to semantically characterize the data of the modelled domain. But it often happens that independently created ontologies model the same domain in different ways. This constitutes a problem because there may be entities being represented differently, therefore creating ambiguity and interoperability problems when linking related data characterized by two ontologies. So it is necessary to develop processes capable of matching the data. The matching can be made at the class level or at the instance level. The goal of the instance matching is to find the correspondences between instances from different ontologies, called instance alignments. The objective of this dissertation was the development of instance matching algorithms for generating instance alignments of real world instances. And the creation of an instance matcher Web tool, where the algorithms developed by me were incorporated. The outcome of this dissertation was the generation of instance alignments between POWER-DBpediaPT, POWER-Verbetes and POWER-POWER. All these three ontologies have instances representing political entities. Furthermore, it was generated instance alignments between ontologies from the OAEI 2012. OAEI (Ontology Alignment Evaluation Initiative), is an international contest, that has a track focus on evaluation of instance matching tools and techniques. To assess the quality of the instance alignments produced, it was implemented the metrics of Precision, Recall, F-measure, Accuracy and Unilateral Accuracy. Another outcome of this dissertation is the instance matcher tool, available through the Web. The tool implements two instance matchers. The FirstLastNamePlusJaccard which is based on element-level matching techniques, that uses the descriptors of the instances to correspond them. And the MachineLearning matcher that uses machine learning approaches to find those correspondences. This Web tool also assesses the instance alignments that it produces, because it implements the already mentioned metrics

    Motion control using optical flow of sparse image features

    Full text link
    Reactive motion planning and local navigation of robots remains a significant challenge in the motion control of robotic vehicles. This thesis presents new results on vision guided navigation using optical flow. By detecting key image features, calculating optical flow and leveraging time-to-transit (tau) as a feedback signal, control architectures can steer a vehicle so as to avoid obstacles while simultaneously using them as navigation beacons. Averaging and balancing tau over multiple image features successfully guides a vehicle along a corridor while avoiding looming objects in the periphery. In addition, the averaging strategy deemphasizes noise associated with rotationally induced flow fields, mitigating risks of positive feedback akin to the Larsen effect. A recently developed, biologically inspired, binary-key point description algorithm, FReaK, offers process speed-ups that make vision-based feedback signals achievable. A Parrot ARDrone2 has proven to be a reliable platform for testing the architecture and has demonstrated the control law's effectiveness in using time-to-transit calculations for real-time navigation

    Fingerabdruckswachstumvorhersage, Bildvorverarbeitung und Multi-level Judgment Aggregation

    Get PDF
    Im ersten Teil dieser Arbeit wird Fingerwachstum untersucht und eine Methode zur Vorhersage von Wachstum wird vorgestellt. Die Effektivität dieser Methode wird mittels mehrerer Tests validiert. Vorverarbeitung von Fingerabdrucksbildern wird im zweiten Teil behandelt und neue Methoden zur Schätzung des Orientierungsfelds und der Ridge-Frequenz sowie zur Bildverbesserung werden vorgestellt: Die Line Sensor Methode zur Orientierungsfeldschätzung, gebogene Regionen zur Ridge-Frequenz-Schätzung und gebogene Gabor Filter zur Bildverbesserung. Multi-level Jugdment Aggregation wird eingeführt als Design Prinzip zur Kombination mehrerer Methoden auf mehreren Verarbeitungsstufen. Schließlich wird Score Neubewertung vorgestellt, um Informationen aus der Vorverarbeitung mit in die Score Bildung einzubeziehen. Anhand eines Anwendungsbeispiels wird die Wirksamkeit dieses Ansatzes auf den verfügbaren FVC-Datenbanken gezeigt.Finger growth is studied in the first part of the thesis and a method for growth prediction is presented. The effectiveness of the method is validated in several tests. Fingerprint image preprocessing is discussed in the second part and novel methods for orientation field estimation, ridge frequency estimation and image enhancement are proposed: the line sensor method for orientation estimation provides more robustness to noise than state of the art methods. Curved regions are proposed for improving the ridge frequency estimation and curved Gabor filters for image enhancement. The notion of multi-level judgment aggregation is introduced as a design principle for combining different methods at all levels of fingerprint image processing. Lastly, score revaluation is proposed for incorporating information obtained during preprocessing into the score, and thus amending the quality of the similarity measure at the final stage. A sample application combines all proposed methods of the second part and demonstrates the validity of the approach by achieving massive verification performance improvements in comparison to state of the art software on all available databases of the fingerprint verification competitions (FVC)
    corecore