25 research outputs found

    RDFViewS: A Storage Tuning Wizard for RDF Applications

    Get PDF
    In recent years, the significant growth of RDF data used in numerous applications has made its efficient and scalable manipulation an important issue. In this paper, we present RDFViewS, a system capable of choosing the most suitable views to materialize, in order to minimize the query response time for a specific SPARQL query workload, while taking into account the view maintenance cost and storage space constraints. Our system employs practical algorithms and heuristics to navigate through the search space of potential view configurations, and exploits the possibly available semantic information - expressed via an RDF Schema - to ensure the completeness of the query evaluation

    Distributed Semantic Web Data Management in HBase and MySQL Cluster

    Full text link
    Various computing and data resources on the Web are being enhanced with machine-interpretable semantic descriptions to facilitate better search, discovery and integration. This interconnected metadata constitutes the Semantic Web, whose volume can potentially grow the scale of the Web. Efficient management of Semantic Web data, expressed using the W3C's Resource Description Framework (RDF), is crucial for supporting new data-intensive, semantics-enabled applications. In this work, we study and compare two approaches to distributed RDF data management based on emerging cloud computing technologies and traditional relational database clustering technologies. In particular, we design distributed RDF data storage and querying schemes for HBase and MySQL Cluster and conduct an empirical comparison of these approaches on a cluster of commodity machines using datasets and queries from the Third Provenance Challenge and Lehigh University Benchmark. Our study reveals interesting patterns in query evaluation, shows that our algorithms are promising, and suggests that cloud computing has a great potential for scalable Semantic Web data management.Comment: In Proc. of the 4th IEEE International Conference on Cloud Computing (CLOUD'11

    Distributed Semantic Web data management in HBase and MySQL cluster

    Get PDF
    Various computing and data resources on the Web are being enhanced with machine-interpretable semantic descriptions to facilitate better search, discovery and integration. This interconnected metadata constitutes the Semantic Web, whose volume can potentially grow the scale of the Web. Efficient management of Semantic Web data, expressed using the W3C\u27s Resource Description Framework (RDF), is crucial for supporting new data-intensive, semantics-enabled applications. In this work, we study and compare two approaches to distributed RDF data management based on emerging cloud computing technologies and traditional relational database clustering technologies. In particular, we design distributed RDF data storage and querying schemes for HBase and MySQL Cluster and conduct an empirical comparison of these approaches on a cluster of commodity machines using datasets and queries from the Third Provenance Challenge and Lehigh University Benchmark. Our study reveals interesting patterns in query evaluation, shows that our algorithms are promising, and suggests that cloud computing has a great potential for scalable Semantic Web data management

    S2ST: A Relational RDF Database Management System

    Get PDF
    The explosive growth of RDF data on the Semantic Web drives the need for novel database systems that can efficiently store and query large RDF datasets. To achieve good performance and scalability of query processing, most existing RDF storage systems use a relational database management system as a backend to manage RDF data. In this paper, we describe the design and implementation of a Relational RDF Database Management System. Our main research contributions are: (1) We propose a formal model of a Relational RDF Database Management System (RRDBMS), (2) We propose generic algorithms for schema, data and query mapping, (3) We implement the first and only RRDBMS, S2ST, that supports multiple relational database management systems, user-customizable schema mapping, schema-independent data mapping, and semantics-preserving query translation

    Использование онтологий для построения семантических запросов в реляционных базах данных

    Get PDF
    На сьогодні всесвітня павутина є найбільшим сховищем інформації. Проте для використання цієї інформації потрібна людина. Мета Семантичного Вебу — представити інформацію у вигляді, придатному для машинної обробки. Він забезпечує можливість спільного доступу до даних, а також їх повторного використання. Велика частина інформації у всесвітній павутині зберігається в реляційних базах даних. Семантичний Веб не може їх використовувати безпосередньо, але реляційні бази даних можуть бути використані для побудови онтологій. Ця ідея привернула увагу багатьох дослідників, які запропонували алгоритми та відповідні програмні рішення для автоматичного або напівавтоматичного вилучення структурованої синтаксичної інформації. У цій роботі досліджено існуючі рішення, показано різні підходи до формалізації логічної моделі реляційної бази даних і перетворення цієї моделі в OWL (мова Семантичного Вебу). Відзначено проблеми розглянутих рішень, а також виділено аспекти, які необхідно враховувати в майбутньому.Nowadays, the Web is the biggest existing information repository. However, to operate with its information human action is required, but the Semantic Web aims to change this. It provides a common framework that allows data to be shared and reused across application, allowing more uses than the traditional Web. Most of the information on the Web is stored in relational databases and the Semantic Web cannot use such databases. Relational databases can be used to construct ontology as the core of the Semantic Web. This task has attracted the interest of many researches, which have made algorithms (wrappers) able to extract structured syntactic information in an automatic or semi-automatic way. At our work we drew experience from those works. We showed different approaches of formalization of a logic model of relational databases, and a transformation of that model into OWL, a Semantic Web language. We closed this paper by mentioning some problems that have only been lightly touched by database to ontology mapping solutions as well as some aspects that need to be considered by future approaches.На сегодняшний день всемирная паутина является крупнейшим хранилищем информации. Тем не менее для использования этой информации необходим человек. Цель Семантического Веба — представить информацию в виде пригодном для машинной обработки. Он обеспечивает возможность совместного доступа к данным, а также их повторного использования. Большая часть информации во всемирной паутине хранится в реляционных базах данных. Семантический Веб не может их использовать непосредственно, но реляционные базы данных могут быть применены для построения онтологий. Эта идея привлекла интерес многих исследователей, которые предложили алгоритмы и соответствующие программные решения для автоматического или полуавтоматического извлечения структурированной синтаксической информации. В этой работе исследованы существующие решения, показаны различные подходы к формализации логической модели реляционной базы данных и преобразования этой модели в OWL (язык Семантического Веба). Отмечены проблемы рассмотренных решений, а также выделены аспекты, которые необходимо учитывать в будущем

    Using ontology for querying in relational database

    No full text
    Nowadays, the Web is the biggest existing information repository. However, to operate with its information human action is required, but the Semantic Web aims to change this. It provides a common framework that allows data to be shared and reused across application, allowing more uses than the traditional Web. Most of the information on the Web is stored in relational databases and the Semantic Web cannot use such databases. Relational databases can be used to construct ontology as the core of the Semantic Web. This task has attracted the interest of many researches, which have made algorithms (wrappers) able to extract structured syntactic information in an automatic or semi-automatic way. At our work we drew experience from those works. We showed different approaches of formalization of a logic model of relational databases, and a transformation of that model into OWL, a Semantic Web language. We closed this paper by mentioning some problems that have only been lightly touched by database to ontology mapping solutions as well as some aspects that need to be considered by future approaches.На сьогодні всесвітня павутина є найбільшим сховищем інформації. Проте для використання цієї інформації потрібна людина. Мета Семантичного Вебу — представити інформацію у вигляді, придатному для машинної обробки. Він забезпечує можливість спільного доступу до даних, а також їх повторного використання. Велика частина інформації у всесвітній павутині зберігається в реляційних базах даних. Семантичний Веб не може їх використовувати безпосередньо, але реляційні бази даних можуть бути використані для побудови онтологій. Ця ідея привернула увагу багатьох дослідників, які запропонували алгоритми та відповідні програмні рішення для автоматичного або напівавтоматичного вилучення структурованої синтаксичної інформації. У цій роботі досліджено існуючі рішення, показано різні підходи до формалізації логічної моделі реляційної бази даних і перетворення цієї моделі в OWL (мова Семантичного Вебу). Відзначено проблеми розглянутих рішень, а також виділено аспекти, які необхідно враховувати в майбутньому.На сегодняшний день всемирная паутина является крупнейшим хранилищем информации. Тем не менее для использования этой информации необходим человек. Цель Семантического Веба — представить информацию в виде пригодном для машинной обработки. Он обеспечивает возможность совместного доступа к данным, а также их повторного использования. Большая часть информации во всемирной паутине хранится в реляционных базах данных. Семантический Веб не может их использовать непосредственно, но реляционные базы данных могут быть применены для построения онтологий. Эта идея привлекла интерес многих исследователей, которые предложили алгоритмы и соответствующие программные решения для автоматического или полуавтоматического извлечения структурированной синтаксической информации. В этой работе исследованы существующие решения, показаны различные подходы к формализации логической модели реляционной базы данных и преобразования этой модели в OWL (язык Семантического Веба). Отмечены проблемы рассмотренных решений, а также выделены аспекты, которые необходимо учитывать в будущем

    Distributed storage and queryng techniques for a semantic web of scientific workflow provenance

    Get PDF
    In scientific workflow environments, scientists depend on provenance, which records the history of an experiment. Resource Description Framework is frequently used to represent provenance based on vocabularies such as the Open Provenance Model. For complex scientific workflows that generate large amounts of RDF triples, single-machine provenance management becomes inadequate over time. In this thesis, we research how HBase capabilities can be leveraged for distributed storage and querying of provenance data represented in RDF. We architect the ProvBase system that incorporates an HBase/Hadoop backend, propose a storage schema to hold provenance triples, and design querying algorithms to evaluate SPARQL queries in the system. We conduct an experimental study to show the feasibility of our approach
    corecore