8 research outputs found

    Arís: Analogical Reasoning for reuse of Implementation & Specification.

    Get PDF
    Formal methods and formal verification of source code has been used extensively in the past few years to create dependable software systems. However, although formal languages like Spec# or JML are quite popular, the set of verified implementations remains small. Our work aims to automate some of the steps involved in writing specifications and their implementations, by reusing existing verified programs i.e. for a given implementation, we aim to retrieve similar verified code and then reapply the missing specification that accompanies that code. Similarly, for a given specification, we aim to retrieve code with a similar specification and use its implementation to generate the missing implementation

    Evaluation of Graph Matching Measures for Documents Retrieval

    Get PDF
    International audienceIn this paper we evaluate four graph distance measures. The analysis is performed for document retrieval tasks. For this aim, different kind of documents are used which include line drawings (symbols), ancient documents (ornamental letters), shapes and trademark-logos. The experimental results show that the performance of each graph distance measure depends on the kind of data and the graph representation technique

    Comparing Graph Similarity for Graphical Recognition

    Get PDF
    The original publication is available at www.springerlink.com. 8th International Workshop, GREC 2009, La Rochelle, France, July 22-23, 2009. Selected PapersIn this paper we evaluate four graph distance measures. The analysis is performed for document retrieval tasks. For this aim, different kind of documents are used including line drawings (symbols), ancient documents (ornamental letters), shapes and trademark-logos. The experimental results show that the performance of each graph distance measure depends on the kind of data and the graph representation technique

    Use of LSH functions for conceptual search based on ontologies

    Get PDF
    Orientador: Maurício Ferreira MagalhãesTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: O volume de dados disponíveis na WWW aumenta a cada dia. Com o surgimento da Web Semântica, os dados passaram a ter uma representação do seu significado, ou seja, serem classificados em um conceito de um domínio de conhecimento, tal domínio geralmente definido por uma ontologia. Essa representação, apoiada em todo o ferramental criado para a Web Semântica, propicia a busca conceitual. Nesse tipo de busca, o objetivo não é a recuperação de um dado específico, mas dados, de diversos tipos, classificados em um conceito de um domínio de conhecimento. Utilizando um índice de similaridade, é possível a recuperação de dados referentes a outros conceitos do mesmo domínio, aumentando a abrangência da busca. A indexação distribuída desses dados pode fazer com que uma busca conceitual por similaridade se torne muito custosa. Existem várias estruturas de indexação distribuída, como as redes P2P, que são empregadas na distribuição e compartilhamento de grandes volumes de dados. Esta tese propõe a utilização de funções LSH na indexação de conceitos de um domínio, definido por uma ontologia, mantendo a similaridade entre eles. Dessa forma, conceitos similares são armazenados próximos um dos outros, tal conceito de proximidade medida em alguma métrica, facilitando a busca conceitual por similaridadeAbstract: The volume of data available in the WWW increases every day. The Semantic Web emerged, giving a representation of the meaning of data, being classified in a concept of a knowledge domain, which is generally defined using an ontology. This representation, based in all the tools created for the Semantic Web, possibilitates the conceptual search. In this type of search, the goal is not to retrieve a specific piece of data, but several data, of several types, classified in a concept of an ontology. Using a similarity level, the retrieval of data that refer to other concepts of the domain is also possible, making the search broader. The distributed indexing of all these data may turn the conceptual search costly. The Internet holds several structures of distributed indexing, such as P2P networks, which are used in the distribution and sharing of huge volumes of data. This thesis presents how it is possible to use LSH functions to generate identifiers to concepts of a domain, defined using an ontology, keeping their similarity. This way, similar concepts are stored near each other, such distance measured in some metric, turning the conceptual search by similarity easierDoutoradoEngenharia de ComputaçãoDoutor em Engenharia Elétric

    Eine verteilte Infrastruktur für typ- und diensterweiterbare orthogonale digitale Bibliotheken

    Get PDF
    Ziel dieser Arbeit war es, eine verteilte Infrastruktur zu entwickeln, die die Realisierung skalierbarer erweiterbarer orthogonaler Digitaler Bibliotheken erlaubt. Dabei sollte die Skalierbarkeit sowohl hinsichtlich der Zahl der unterstützten Anwender als auch hinsichtlich der Zahl der gespeicherten Dokumente gewährleistet sowie die Erweiterbarkeit um neue Typen und um neue Dienste sichergestellt werden. In einem ersten Schritt wurde ein Modell skalierbarer erweiterbarer orthogonaler Digitaler Bibliotheken entworfen, das die für Erweiterbarkeit und Orthogonalität notwendigen Elemente und Mechanismen identifiziert. Anhand dieses Modells erfolgte dann eine Untersuchung existierender Systeme zur Verarbeitung digitaler Dokumente im Hinblick auf ihre Eignung zur Realisierung einer skalierbaren, erweiterbaren, orthogonalen Digitalen Bibliothek. Resultat dieser Untersuchung war, daß in existierenden Systemen zur Verarbeitung digitaler Dokumente Erweiterbarkeit nur auf Kosten der Orthogonalität oder Skalierbarkeit unterstützt wird. Als Grund dafür wurde eine mangelnde Unterstützung der transparenten Erweiterung und Interpretation der Zuordnungsfunktion durch diese Systeme erkannt. Die Ursache dieses Mangels ist die unzureichende Benennung der Elemente der Zuordnungsfunktionen in den existierenden Systemen. Um eine Infrastruktur für Digitale Bibliotheken zu entwickeln, die die genannten Anforderungen erfüllt, wurden drei Maßnahmen getroffen: die Einführung einer systemweit eindeutigen Benennung der Elemente der Zuordnungsfunktion, der Entwurf eines Mechanismus zur transparenten Verteilung der Zuordnungsfunktion in der Digitalen Bibliothek und die Entwicklung eines Mechanismus zur transparenten Bereitstellung von Dokumentmethoden in den, an der Digitalen Bibliothek beteiligten Rechnerknoten. Die eindeutige Benennung wurde durch die Definition orthogonaler Operationen ermöglicht. Die Verteilung der Zuordnungsfunktion in der Digitalen Bibliothek konnte durch die Einführung von Metadokumenten erreicht werden. Das Konzept der Metadokumente basiert auf der Erkenntnis, daß die Komponenten der Digitalen Bibliothek nur die Teile der Zuordnungsfunktion benötigen, die sich auf die Dokumente beziehen, die sie bearbeiten. Diese dokumentspezifischen Teile der Zuordnungsfunktion erhält man durch Partitionieren der Zuordnungsfunktion entlang der Dimension der Dokumente. Die dokumentspezifischen Zuordnungsfunktionen werden dann zusammen mit dem Dokumentinhalt in Form eines Metadokuments zusammengefaßt. Aufgrund des Verzichts auf eine Typabbildung ist in jedem Metadokument die vollständige dokumentspezifische Zuordnungsfunktion gespeichert. Die Verteilung der Zuordnungsfunktion in der Digitalen Bibliothek ist damit allein durch den Transport des Dokumentinhalts in Form der Metadokumente möglich geworden. Die transparente Bereitstellung der Dokumentmethoden konnte durch Verwendung von mobilen Programmen zur Implementierung von Dokumentmethoden erreicht werden. Digitale Bibliotheken lassen sich so durch Erstellung eines entsprechenden Metadokuments durch den Dokumentautor transparent um neue Dokumenttypen erweitern. Es wurde gezeigt, wie auf der Basis dieser Infrastruktur eine Vielzahl verschiedener Dokumenttypen realisiert werden können. Dazu zählen Dokumente, die unterschiedliche Formen der Präsentation realisieren, sowie Dokumente zur verteilten Datenhaltung, zur Aggregation von Dokumenten und zur Realisierung zugriffsgeschützter und vertraulicher Dokumente. Die Erweiterung um neue Dienste wurde durch die Definition mobiler Dokumente ermöglicht, die die Verteilung neuer Dienstfunktionen innerhalb der Digitalen Bibliothek erlauben. Mobile Dokumente können, analog zu nicht mobilen Dokumenten, durch den Autor des Dokuments, in diesem Fall den Gestalter des Dienstes, transparent in die Digitale Bibliothek integriert werden. Zusammen mit der Möglichkeit zur Einführung neuer orthogonaler Operationen läßt sich dadurch das Dienstspektrum der Digitalen Bibliothek dynamisch erweitern. Die Elemente der Infrastruktur wurden unter der Verwendung standardisierter Protokolle und existierender Laufzeitumgebungen für interpretierte Sprachen realisiert. Auf der Basis dieser Realisierung wurden verschiedene Dokumente implementiert, anhand derer die Umsetzbarkeit der entwickelten Konzepte demonstriert werden konnte. Der Einsatz plattformunabhängiger Sprachen zur Implementierung von Dokumentmethoden ermöglicht eine Integration zukünftiger Plattformen in die Infrastruktur, ohne daß dazu eine Änderung der existierenden Dokumente und Methoden notwendig wird. In dieser Arbeit wurde eine Infrastruktur entworfen, auf deren Grundlage sich skalierbare erweiterbare orthogonale Digitale Bibliotheken realisieren lassen. Das resultierende System läßt sich durch die Dokumentautoren und Dienstgestalter transparent um neue Dokumenttypen und Dienste erweitern. Durch die konsequente Vermeidung zentraler Komponenten konnte die Skalierbarkeit des Systems in der Zahl der unterstützten Anwender sowie in der Zahl der verwalteten Dokumente sichergestellt werden. Ausgehend von den in dieser Arbeit entwickelten Konzepten können weitergehende Fragestellungen diskutiert werden. So kann die Möglichkeit zur einer engeren Integration der Präsentation aggregierter multimedialer Dokumente, wie sie z. B. im Informedia­Projekt bei der synchronisierten Darstellung geographischer Regionen und darauf bezogener Video­Daten vorgenommen wird (vgl. [13]), untersucht werden. Eine Integration unterschiedlicher Dokumente im Präsentationsraum könnte durch die Definition einer orthogonalen MultimediaPresent­Operation geschehen, die die Angabe von Koordinaten im Dokument­ und Präsentationsraum, wie sie z. B. in HyTime [64] möglich ist, zur Kontrolle der Präsentation erlaubt. In der vorliegenden Arbeit wurde der Schutz einzelner Ausführungs­Server gegen böswillige Dokumentmethoden behandelt. Mit der Möglichkeit zur Erstellung mobiler Dokumente verdient der Schutz des Server­Verbundes zur Begrenzung der Ressourcennutzung durch einen Initiator ebenfalls eine eingehendere Betrachtung. Hier könnten Konzepte aus Infrastrukturen für mobile Agenten, z. B. AgentTcl [42], angepaßt werden, z. B. die Kontingentierung der Ressourcennutzung auf den Rechnerknoten innerhalb einer administrativen Domäne und die Verwendung elektronischen Geldes zur Limitierung der Ressourcennutzung durch mobile Dokumente, die sich zwischen mehreren administrativen Domänen bewegen. Zur Effizienzsteigerung könnten Verfahren zur Übersetzung von plattformunabhängigem Zwischencode in nativen Code der Zielmaschine, wie sie beispielsweise in [33] beschrieben sind, eingesetzt werden. In diesem Zusammenhang sind geeignete Mittel für eine Durchsetzung der Sicherheitsanforderungen auszuwählen und ihr Einfluß auf den zu erwartenden Performance­Gewinn zu untersuchen

    Modeling, Indexing and Retrieving Images using Conceptual Graphs

    No full text
    . When dealing with the complexity of an image as part of the indexing process, keywords are not sufficient to obtain an index that is a faithful representation of the image content. We propose to use the conceptual graphs formalism as the indexing language, which allows to use not only keywords, but also relations between them. The obtained indexes are more precise, and retrieval effectiveness is thus improved. Our paper presents a system that provides a computer-assisted image indexing process, which is performed according to a formal image model. The result of the indexing process, which is a set of conceptual graphs, is then organized so that to improve retrieval execution times. Our image retrieval system, called RELIEF, is implemented on an object-oriented DBMS and is available on the Web. It ensures the management of an image test collection and gives good results, with respect to both execution time and quality of answers. 1 Introduction: Towards Precision-Oriented ..

    Organization Of Multimedia Data For Conceptual Search Based On Ontologies

    No full text
    Nowadays, there is a large volume of semantically annotated multimedia data available in the Semantic Web. These data have originated from several different sources, generating new issues about their storage and retrieval. In this scenario, simple ontologies are commonly used to define knowledge domains and classify data into concepts, establishing relations between them. Such conceptual relationship may be measured by a similarity function which allows the search to be performed by similarity in an indexing system. The contribution of this paper is to propose how to organize multimedia data using this conceptual classification in LSH (Locality Sensitive Hashing) functions, facilitating the conceptual search in distributed systems like P2P networks. © 2011 The Brazilian Computer Society.174241254Berners-Lee, T., Hendler, J., Lassila, O., The semantic web: a new form of web content that is meaningful to computers will unleash a revolution of new possibilities (2001) Sci Am, 284 (5), pp. 29-37Batista, C.E.C.F., Schwabe, D., LinkedTube: semantic information on web media objects (2009) Proceedings of the XV Brazilian Symposium on Multimedia and the Web (Webmedia 2009)Haghani, P., Michel, S., Cudré-Mauroux, P., Aberer, K., LSH at large-distributed KNN search in high dimensions (2008) WebDBKulis, B., Jain, P., Grauman, K., Fast similarity search for learned metrics (2009) IEEE Trans Pattern Anal Mach Intell, 31, pp. 2143-2157Zhu, Y., (2005) Enhancing search performance in peer-to-peer networks, , PhD thesis, University of CincinnatiKöhler, J., Philippi, S., Specht, M., Rüegg, A., (2006) Ontology Based Text Indexing and Querying for the Semantic Web, , Amsterdam: Elsevier ScienceRatinov, L., Roth, D., Srikumar, V., (2008) Conceptual search and text categorization, , Technical report UIUCDCS-R-2008-2932, UIUC, CS deptLyte, V., Jones, S., Ananiadou, S., Kerr, L., (2009) UK institutional repository search: Innovation and discovery, Ariadne, (61)Formica, A., (2008) Concept Similarity in Formal Concept Analysis: An Information Content Approach, Know-Based Syst, , Amsterdam: Elsevier ScienceCordi, V., Lombardi, P., Martelli, M., Mascardi, V., An ontology-based similarity between sets of concepts (2005) Woa'05Sridevi, U.K., Nagaveni, N., Ontology based similarity measure in document ranking (2010) Int J Comput Appl, 1 (26), pp. 125-129Polyvyanyy, A., (2007) Evaluation of a novel information retrieval model: ETVSM, , Hasso Plattner Institut, Master's thesis, Univeristat PotsdmStoica, I., Morris, R., Karger, D., Kaashoek, M.F., Balakrishnan, H., Chord: a scalable peer-to-peer lookup service for internet applications (2001) Proceedings of ACM SIGCOMM'01Indyk, P., Motwani, R., Approximate nearest neighbors: towards removing the curse of dimensionality (1998) Proceedings of the Thirtieth Annual ACM Symposium on Theory of Computing (STOC '98), , New York, NY, USACharikar, M.S., Similarity estimation techniques from rounding algorithms (2002) Proceedings of the Thiry-Fourth Annual ACM Symposium on Theory of Computing (STOC '02), , New York: ACMVarelas, G., Voutsakis, E., Raftopoulou, P., Petrakis, E.G.M., Milios, E.E., Semantic similarity methods in wordNet and their application to information retrieval on the web (2005) Proceedings of the 7th Annual ACM International Workshop on Web Information and Data Management (WIDM '05)Gupta, A., Agrawal, D., El Abbadi, A., Approximate range selection queries in peer-to-peer systems (2002) CidrWatts, D.J., Strogatz, S.H., Collective dynamics of small world networks (1998) Nature, 393 (6684)Kleinberg, J., The small-world phenomenon: an algorithm perspective (2000) Proceedings of the Thirty-Second Annual ACM Symposium on Theory of Computing (STOC '00), , New York, NY, USAGirdzijauskas, S., (2009) Designing peer-to-peer overlays: A small-world perspective, , PhD dissertation, Ecole Polytechnique Federale de Lausanne (EPFL), Lausane, CH, March 2009Chum, O., Perdoch, M., Matas, J., (2009) Geometric min-hashing: Finding a (thick) needle in a haystack.Georgoulas, K., Kotidis, Y., Random hyperplane projection using derived dimensions (2010) Proceedings of the Ninth ACM International Workshop on Data Engineering for Wireless and Mobile Access (MobiDE '10)Ryyndnen, M., Klapuri, A., Query by humming of midi and audio using locality sensitive hashing (2008) IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2008)Yoshida, K., Murabayashi, N., Tiny LSH for content-based copied video detection (2008) International Symposium on Applications and the Internet (SAINT 2008)Bulskov, H., Andreasen, T., On measuring similarity for conceptual querying (2002) Proc. Of the 5th International Conference on Flexible Query Answering Systems, , Berlin: SpringerChu, S., Cesnik, B., Knowledge representation and retrieval using conceptual graphs and free text document self-organisation techniques (2001) Int J Med Inform, 62 (2-3), pp. 121-133Dick, J.P., Representation of legal text for conceptual retrieval (1991) Proceedings of the 3rd International Conference on Artificial Intelligence and Law (ICAIL '91)Ounis, I., Pasca, M., Modeling, indexing and retrieving images using conceptual graphs (1998) DEXA '98Mishne, G., de Rijke, M., Source code retrieval using conceptual similarity (2004) Proc Conf Computer Assisted Information Retrieval (RIAO 04)D'Amato, C., Staab, S., Fanizzi, N., On the influence of description logics ontologies on conceptual similarity (2008) Proceedings of the 16th International Conference on Knowledge Engineering: Practice and Patterns (EKAW '08)Yang, G., Oh, J., Knowledge acquisition and retrieval based on conceptual graphs (1993) Proceedings of the 1993 ACM SIGAPP Symposium on Applied Computing: States of the Art and Practice (SAC 93)Zhu, Y., Hu, Y., Efficient semantic search on DHT overlays (2007) J Parallel Distrib Comput, 67 (5), pp. 604-616Crespo, A., Garcia-Molina, H., Semantic overlay networks for p2p systems (2004) Third International Workshop on Agents and Peer-to-Peer Computing (AP2PC)Haase, P., Siebes, R., van Harmelen, F., Peer selection in peer-to-peer networks with semantic topologies (2004) International Conference on Semantics of a Networked World: Semantics for Grid DatabasesSchlosser, M., Sintek, M., Decker, S., Nejdl, W., HyperCuP-hypercubes, ontologies and efficient search on P2P networks (2002) International Workshop on Agents and Peer-to-Peer Computin
    corecore