6 research outputs found

    Технология извлечения структур знаний с использованием аппарата расширенных семантических сетей

    Get PDF
    В статье рассматривается задача извлечения из текстов естественного языка структур знаний: информационных объектов («именованных сущностей»), их свойств, связей и фактов участия в действиях. Для этих целей разработан инструментарий: язык представления знаний (расширенные семантические сети – РСС) и их обработки (язык преобразования структур – ДЕКЛ). На этой основе созданы технологии, которые обладают следующими особенностями. Из текстов извлекаются не отдельные объекты (именованные сущности), а структуры знаний, представляющие связи объектов и их участие в действиях и событиях. Для извлечения структур знаний разработан уникальный семантико-ориентированный лингвистический процессор (ЛП), осуществляющий глубинный анализ текстов ЕЯ и выявляющий десятки типов объектов вместе с их структурами. Процессор ЛП управляется лингвистическими знаниями, представляющими собой декларативные структуры и обеспечивающие быструю настройку ЛП на предметную область и язык. Основой лингвистических знаний являются правила, обладающие высокой степенью избирательности при выявлении объектов («сущностей»), средствами устранения коллизий при их применении. Это позволяет минимизировать шумы и потери.У статті розглядається задача знайдення у текстах природної мови структур знань: інформаційних об’єктів («іменованих сутностей»), їх якостей зв’язків і фактів участі у діях. Для цих цілей розроблений інструментарій: мова представлення знань (розширені семантичні мережі – РСМ) та їх обробки (мова перетворення структур – ДЕКЛ). На цій основі створені технології, що мають наступні особливості. З тестів виділяються не окремі об’єкти (іменовані сутності), а структури знань, що представляють зв’язки об’єктів та їх участь у діях та подіях. З метою виділення структур знань розроблений винятковий семантико-орієнтований лінгвістичний процесор (ЛП), що здійснює глибинний аналіз текстів ЕЯ та виявляє десятки типів об’єктів разом з їх структурами. Процесор ЛП керується лінгвістичними знаннями, які представляють собою декларативні структури та забезпечують швидке настроювання ЛП на предметну сферу та мову. Основою лінгвістичних знань є правила, що мають високий ступінь вибірковості при виявленні об’єктів («сутностей»), засобами усунення колізій при їхньому використанні. Це дозволяє мінімізувати шуми та втрати.The paper is devoted to the extracting of knowledge structures from the natural language texts, i.e. information objects (“Named Entities”), their features, relationships, and participation in the actions and events. For this purpose, the language used for knowledge representation (extended semantic networks/ESN) and tools for processing (language for structure conversion LSC) are considered. On this base, the new technologies are proposed. These technologies have the following features: extraction from the texts of knowledge structures that represent the links of named entities and their participation in actions and events. For the knowledge extraction the unique semantic-oriented language processor (LP) are designed. Processor LP provides the deep analysis of NL-texts and revealing set of objects together with their structures. Processor LP is controlled by the linguistic knowledge, which are declarative structures (on ESN) and which provides the quick tuning of LP on subject area and language, both Russian and English

    Late assignment of syntax theory: evidence from Chinese and English

    Get PDF
    The attraction of the well-structured arguments of the mental syntactic processing device (parser) in Chomsky’s theory has led to an overemphasis on syntactic processing to the exclusion of semantic and other processing in the initial sentence processing stage (Frazier & Clifton, 1996; Gibson & Hickok, 1993; Pickering & van Gompel, 2006). The current thesis joins some others (Green & Mitchell, 2006; MacDonald et al., 1994; Townsend & Bever, 2001, etc.), investigating the timecourse of the information processing of sentences. The first interest centres on ambiguous sentence resolution. Crosslinguistic studies have shown different resolutions in processing the relative clause (RC) attachment as in “the servant of the actress who was on the balcony” (Cuetos & Mitchell, 1988). Three studies confirmed that there is an NP-low preference in Chinese; however, this effect was delayed in comparison to its English counterparts. The NP-low preference can be explained by syntax-first, syntax parallel, and syntax later theories. However, the delay effect questions the traditional syntax-first theories. This leads to the second investigation of direct comparison of the timecourse of syntactic and semantic processing using anomalous materials in English and Chinese. Two experiments have confirmed that the syntactic anomaly is recognised later than semantic anomaly in both languages. The empirical investigation in the current thesis used various methodologies, including self-paced reading, a questionnaire, and eye-tracking studies, where the design of materials strictly followed linguistic principles. All the results support the late assignment of syntax theory (LAST) (Townsend & Bever, 2001). In fact, LAST can explain most of the evidence for syntax-first and syntax-parallel theories, and it is in line with the latest development of the linguistic UG theories (the Minimalist Programme)

    Электронные библиотеки: перспективные методы и технологии, электронные коллекции

    Get PDF
    Электронные библиотеки – область исследований и разработок, направленных на развитие теории и практики обработки, распространения, хранения, анализа и поиска цифровых данных различной природы. Основная цель серии конференций RCDL заключается в формировании сообщества специалистов России, ведущих исследования и разработки в области электронных библиотек и близких областях. Всероссийская научная конференция 2009 г. (RCDL'2009) является одиннадцатой конференцией по данной тематике (1999 г. – Санкт-Петербург, 2000 г. – Протвино, 2001 г. – Петрозаводск, 2002 г. – Дубна, 2003 г. – Санкт-Петербург, 2004 г. – Пущино, 2005 г. – Ярославль, 2006 г. – Суздаль, 2007 г. – Переславль-Залесский, 2008 г. – Дубна). Настоящий сборник включает тексты докладов, коротких сообщений и стендовых докладов, отобранных Программным комитетом RCDL'2009 в результате проведенного рецензирования

    A Statistical Approach to the Alignment of fMRI Data

    Get PDF
    Multi-subject functional Magnetic Resonance Image studies are critical. The anatomical and functional structure varies across subjects, so the image alignment is necessary. We define a probabilistic model to describe functional alignment. Imposing a prior distribution, as the matrix Fisher Von Mises distribution, of the orthogonal transformation parameter, the anatomical information is embedded in the estimation of the parameters, i.e., penalizing the combination of spatially distant voxels. Real applications show an improvement in the classification and interpretability of the results compared to various functional alignment methods

    A comparison of the CAR and DAGAR spatial random effects models with an application to diabetics rate estimation in Belgium

    Get PDF
    When hierarchically modelling an epidemiological phenomenon on a finite collection of sites in space, one must always take a latent spatial effect into account in order to capture the correlation structure that links the phenomenon to the territory. In this work, we compare two autoregressive spatial models that can be used for this purpose: the classical CAR model and the more recent DAGAR model. Differently from the former, the latter has a desirable property: its ρ parameter can be naturally interpreted as the average neighbor pair correlation and, in addition, this parameter can be directly estimated when the effect is modelled using a DAGAR rather than a CAR structure. As an application, we model the diabetics rate in Belgium in 2014 and show the adequacy of these models in predicting the response variable when no covariates are available
    corecore