4 research outputs found

    Accommodating Complex Chained Prepositional Phrases in Natural Language Query Interface to an Event-Based Triplestore

    Get PDF
    Building Natural language query interfaces (NLI) to databases is one the most interesting and challenging fields of study for computer scientists and researchers. There have been many advancements and achievements in this area that enables NLIs to operate more efficiently and have wide NL coverage. However, there exists some shortcomings in query interface to semantic web triplestores. Some researchers have attempted to extend the range of queries that can be answered. However, only a few techniques can handle queries containing complex chained prepositional phrases. This thesis involves extending an existing method that can accommodate prepositional phrases to also be able to handle when..., where..., and with what... type queries. The approach developed is implemented in the Miranda programing environment

    An Event-Driven Approach for Querying Graph-Structured Data Using Natural Language

    No full text
    An ideal way for people to query graph-based knowledge, including triplestores in the semantic web, would be for them to ask questions in a natural language (NL). However, existing NL query interfaces to graph-based data have limited expressive power and cannot accommodate arbitrarilynested quantification (i.e. phrases such as “a gangster who joined every gang”) together with multiple complex prepositional phrases, such as “in a city located in Illinois in 1918 using a set of keys that was stolen from a gangster”. It would appear that the commonly-used “entity-based ” triplestores, together with what has become the de-facto approach of converting NL queries to SPARQL queries before being evaluated, hinders the development of expressive NL query processors. The reason is that entity-based triples are not conducive to the development of semantic theories of complex prepositional phrases, and the development of such theories is made considerably more complex when translation to SPARQL has to be taken into account. An alternative approach, which uses “event-based ” triplestores, treats (bracketed) English queries as expressions of the lambda calculus which can be evaluated directly with respect to the triplestore. This approach facilitates the development of a formal denotational semantics of English queries which easily accommodates complex prepositional phrases. The approach described here could be used to develop a denotational semantics for a highly-expressive NL query language, and then that semantics could be used to guide the design of an NL query to SPARQL translator, thereby taking advantage of SPARQL optimizations

    Interrogation des sources de données hétérogènes : une approche pour l'analyse des requêtes

    Get PDF
    No english summary availableLe volume des données structurées produites devient de plus en plus considérable. Plusieurs aspects concourent à l’accroissement du volume de données structurées. Au niveau du Web, le Web de données (Linked Data) a permis l’interconnexion de plusieurs jeux de données disponibles créant un gigantesque hub de données. Certaines applications comme l’extraction d’informations produisent des données pour peupler des ontologies. Les capteurs et appareils (ordinateur, smartphone, tablette) connectés produisent de plus en plus de données. Les systèmes d’information d’entreprise sont également affectés. Accéder à une information précise devient de plus en plus difficile. En entreprise, des outils de recherche ont été mis au point pour réduire la charge de travail liée à la recherche d’informations, mais ces outils génèrent toujours des volumes importants. Les interfaces en langage naturel issues du Traitement Automatique des Langues peuvent être mises à contribution pour permettre aux utilisateurs d’exprimer naturellement leurs besoins en informations sans se préoccuper des aspects techniques liés à l’interrogation des données structurées. Les interfaces en langage naturel permettent également d’avoir une réponse concise sans avoir besoin de fouiller d’avantage dans une liste de documents. Cependant actuellement, ces interfaces ne sont pas assez robustes pour être utilisées par le grand public ou pour répondre aux problèmes de l’hétérogénéité ou du volume de données. Nous nous intéressons à la robustesse de ces systèmes du point de vue de l’analyse de la question. La compréhension de la question de l’utilisateur est une étape importante pour retrouver la réponse. Nous proposons trois niveaux d’interprétation pour l’analyse d’une question : domaine abstrait, domaine concret et la relation domaine abstrait/concret. Le domaine abstrait s’intéresse aux données qui sont indépendantes de la nature des jeux de données. Il s’agit principalement des données de mesures. L’interprétation s’appuie sur la logique propre à ces mesures. Le plus souvent cette logique a été bien décrite dans les autres disciplines, mais la manière dont elle se manifeste en langage naturel n’a pas fait l’objet d’une large investigation pour les interfaces en langage naturel basées sur des données structurées. Le domaine concret couvre le domaine métier de l’application. Il s’agit de bien interpréter la logique métier. Pour une base de données, il correspond au niveau applicatif (par opposition à la couche des données). La plupart des interfaces en langage naturel se focalisent principalement sur la couche des données. La relation domaine abstrait/concret s’intéresse aux interprétations qui chevauchent les deux domaines. Du fait de l’importance de l’analyse linguistique, nous avons développé l’infrastructure pour mener cette analyse. L’essentiel des interfaces en langage naturel qui tentent de répondre aux problématiques du Web de données (Linked Data) ont été développées jusqu’ici pour la langue anglaise et allemande. Notre interface tente d’abord de répondre à des questions en françai
    corecore