6 research outputs found
Технология извлечения структур знаний с использованием аппарата расширенных семантических сетей
В статье рассматривается задача извлечения из текстов естественного языка структур знаний: информационных объектов («именованных сущностей»), их свойств, связей и фактов участия в действиях. Для этих целей разработан инструментарий: язык представления знаний (расширенные семантические сети – РСС) и их обработки (язык преобразования структур – ДЕКЛ). На этой основе созданы технологии, которые обладают следующими особенностями. Из текстов извлекаются не отдельные объекты (именованные сущности), а структуры знаний, представляющие связи объектов и их участие в действиях и событиях. Для извлечения структур знаний разработан уникальный семантико-ориентированный лингвистический процессор (ЛП), осуществляющий глубинный анализ текстов ЕЯ и выявляющий десятки типов объектов вместе с их структурами. Процессор ЛП управляется лингвистическими знаниями, представляющими собой декларативные структуры и обеспечивающие быструю настройку ЛП на предметную область и язык. Основой лингвистических знаний являются правила, обладающие высокой степенью избирательности при выявлении объектов («сущностей»), средствами устранения коллизий при их применении. Это позволяет минимизировать шумы и потери.У статті розглядається задача знайдення у текстах природної мови структур знань: інформаційних об’єктів («іменованих сутностей»), їх якостей зв’язків і фактів участі у діях. Для цих цілей розроблений інструментарій: мова представлення знань (розширені семантичні мережі – РСМ) та їх обробки (мова перетворення структур – ДЕКЛ). На цій основі створені технології, що мають наступні особливості. З тестів виділяються не окремі об’єкти (іменовані сутності), а структури знань, що представляють зв’язки об’єктів та їх участь у діях та подіях. З метою виділення структур знань розроблений винятковий
семантико-орієнтований лінгвістичний процесор (ЛП), що здійснює глибинний аналіз текстів ЕЯ та виявляє десятки типів об’єктів разом з їх структурами. Процесор ЛП керується лінгвістичними знаннями, які представляють собою декларативні структури та забезпечують швидке настроювання ЛП на предметну сферу та мову. Основою лінгвістичних знань є правила, що мають високий ступінь вибірковості при виявленні об’єктів («сутностей»), засобами усунення колізій при їхньому використанні. Це дозволяє мінімізувати шуми та втрати.The paper is devoted to the extracting of knowledge structures from the natural language texts, i.e. information objects (“Named Entities”), their features, relationships, and participation in the actions and events. For this purpose, the language used for knowledge representation (extended semantic networks/ESN) and tools for processing (language for structure conversion LSC) are considered. On this base, the new technologies are proposed. These technologies have the following features: extraction from the texts of knowledge structures that represent the links of named entities and their participation in actions and events. For the knowledge extraction the unique semantic-oriented language processor (LP) are designed. Processor LP provides the deep analysis of NL-texts and revealing set of objects together with their structures. Processor LP is controlled by the linguistic knowledge, which are declarative structures (on ESN) and which provides the quick tuning of LP on subject area and language, both Russian and English
Late assignment of syntax theory: evidence from Chinese and English
The attraction of the well-structured arguments of the mental syntactic processing
device (parser) in Chomsky’s theory has led to an overemphasis on syntactic processing
to the exclusion of semantic and other processing in the initial sentence processing stage
(Frazier & Clifton, 1996; Gibson & Hickok, 1993; Pickering & van Gompel, 2006). The
current thesis joins some others (Green & Mitchell, 2006; MacDonald et al., 1994;
Townsend & Bever, 2001, etc.), investigating the timecourse of the information
processing of sentences.
The first interest centres on ambiguous sentence resolution. Crosslinguistic studies have
shown different resolutions in processing the relative clause (RC) attachment as in “the
servant of the actress who was on the balcony” (Cuetos & Mitchell, 1988). Three
studies confirmed that there is an NP-low preference in Chinese; however, this effect
was delayed in comparison to its English counterparts. The NP-low preference can be
explained by syntax-first, syntax parallel, and syntax later theories. However, the delay
effect questions the traditional syntax-first theories. This leads to the second
investigation of direct comparison of the timecourse of syntactic and semantic
processing using anomalous materials in English and Chinese. Two experiments have
confirmed that the syntactic anomaly is recognised later than semantic anomaly in both
languages.
The empirical investigation in the current thesis used various methodologies, including
self-paced reading, a questionnaire, and eye-tracking studies, where the design of
materials strictly followed linguistic principles. All the results support the late
assignment of syntax theory (LAST) (Townsend & Bever, 2001). In fact, LAST can
explain most of the evidence for syntax-first and syntax-parallel theories, and it is in
line with the latest development of the linguistic UG theories (the Minimalist
Programme)
Электронные библиотеки: перспективные методы и технологии, электронные коллекции
Электронные библиотеки – область исследований и разработок, направленных на развитие теории и практики обработки, распространения, хранения, анализа и поиска цифровых данных различной природы. Основная цель серии конференций RCDL заключается в формировании сообщества специалистов России, ведущих исследования и разработки в области электронных библиотек и близких областях. Всероссийская научная конференция 2009 г. (RCDL'2009) является одиннадцатой конференцией по данной тематике (1999 г. – Санкт-Петербург, 2000 г. – Протвино, 2001 г. – Петрозаводск, 2002 г. – Дубна, 2003 г. – Санкт-Петербург, 2004 г. – Пущино, 2005 г. – Ярославль, 2006 г. – Суздаль, 2007 г. – Переславль-Залесский, 2008 г. – Дубна).
Настоящий сборник включает тексты докладов, коротких сообщений и стендовых докладов, отобранных Программным комитетом RCDL'2009 в результате проведенного рецензирования
A Statistical Approach to the Alignment of fMRI Data
Multi-subject functional Magnetic Resonance Image studies are critical. The anatomical and functional structure varies across subjects, so the image alignment is necessary. We define a probabilistic model to describe functional alignment. Imposing a prior distribution, as the matrix Fisher Von Mises distribution, of the orthogonal transformation parameter, the anatomical information is embedded in the estimation of the parameters, i.e., penalizing the combination of spatially distant voxels. Real applications show an improvement in the classification and interpretability of the results compared to various functional alignment methods
A comparison of the CAR and DAGAR spatial random effects models with an application to diabetics rate estimation in Belgium
When hierarchically modelling an epidemiological phenomenon on a finite collection of sites in space, one must always take a latent spatial effect into account in order to capture the correlation structure that links the phenomenon to the territory. In this work, we compare two autoregressive spatial models that can be used for this purpose: the classical CAR model and the more recent DAGAR model. Differently from the former, the latter has a desirable property: its ρ parameter can be naturally interpreted as the average neighbor pair correlation and, in addition, this parameter can be directly estimated when the effect is modelled using a DAGAR rather than a CAR structure. As an application, we model the diabetics rate in Belgium in 2014 and show the adequacy of these models in predicting the response variable when no covariates are available