7 research outputs found
Ontology-Based Knowledge Acquisition Method for Natural Language Texts
ΠΠ»Π°Π²Π½Π°Ρ Π·Π°Π΄Π°ΡΠ° ΠΏΡΠΈΠΎΠ±ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π½Π°Π½ΠΈΠΉ (ΡΠ°ΠΊΠΆΠ΅ Π½Π°Π·ΡΠ²Π°Π΅ΠΌΠ°Ρ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ΠΌ Π·Π½Π°Π½ΠΈΠΉ) ΠΈΠ· ΡΠ΅ΠΊΡΡΠΎΠ² Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° β ΡΡΠΎ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ Π·Π½Π°Π½ΠΈΠΉ ΠΈΠ· ΡΠ΅ΠΊΡΡΠΎΠ² Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° Π² ΡΡΠ°Π³ΠΌΠ΅Π½Ρ Π±Π°Π·Ρ Π·Π½Π°Π½ΠΈΠΉ ΠΈΠ½ΡΠ΅Π»Π»Π΅ΠΊΡΡΠ°Π»ΡΠ½ΠΎΠΉ ΡΠΈΡΡΠ΅ΠΌΡ. Π‘ ΡΡΠ΅ΡΠΎΠΌ ΠΎΠ·Π½Π°ΠΊΠΎΠΌΠ»Π΅Π½ΠΈΡ Ρ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠ΅ΠΉ Π»ΠΈΡΠ΅ΡΠ°ΡΡΡΠΎΠΉ ΠΎ ΠΏΡΠΈΠΎΠ±ΡΠ΅ΡΠ΅Π½ΠΈΠΈ Π·Π½Π°Π½ΠΈΠΉ
Π² ΡΡΡΠ°Π½Π΅ ΠΈ Π·Π° ΡΡΠ±Π΅ΠΆΠΎΠΌ Π² ΡΡΠ°ΡΡΠ΅ Π°Π½Π°Π»ΠΈΠ·ΠΈΡΡΡΡΡΡ ΠΏΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π° ΠΈ Π½Π΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ ΠΊΠ»Π°ΡΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΏΠΎΠ΄Ρ
ΠΎΠ΄Π° ΠΊ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ Π·Π½Π°Π½ΠΈΠΉ. ΠΠΎΡΠ»Π΅ ΡΡΠ°ΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΡ ΡΠ΅Ρ
Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ Π·Π½Π°Π½ΠΈΠΉ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΏΡΠ°Π²ΠΈΠ» ΠΈ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ ΠΎΠ½ΡΠΎΠ»ΠΎΠ³ΠΈΠΉ Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΠΊΠΈ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΎ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ Π΄Π»Ρ ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΠΈ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ Π·Π½Π°Π½ΠΈΠΉ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅
ΡΠ΅Ρ
Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ OSTIS. ΠΡΠ½ΠΎΠ²Π½ΠΎΠΉ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΡΡ ΡΡΠΎΠ³ΠΎ ΡΠ΅ΡΠ΅Π½ΠΈΡ ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΠ΅ Π΅Π΄ΠΈΠ½ΠΎΠΉ ΡΠ΅ΠΌΠ°Π½ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ
ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΌΠΎΠΆΠ΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΎΠ½ΡΠΎΠ»ΠΎΠ³ΠΈΠΈ Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΠΊΠΈ (Π² ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠΌ ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΈ ΡΠ΅ΠΌΠ°Π½ΡΠΈΡΠ΅ΡΠΊΠΈΠΉ Π°ΡΠΏΠ΅ΠΊΡΡ) ΠΈ ΠΈΠ½ΡΠ΅Π³ΡΠΈΡΠΎΠ²Π°ΡΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΠΏΡΠ°Π²ΠΈΠ»,
ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π΅ΠΉΡΠΎΠ½Π½ΡΡ
ΡΠ΅ΡΠ΅ΠΉ) Π΄Π»Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ Π·Π½Π°Π½ΠΈΠΉ ΠΈΠ· ΡΠ΅ΠΊΡΡΠΎΠ² Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ°
A New Open Information Extraction System Using Sentence Difficulty Estimation
The World Wide Web has a considerable amount of information expressed using natural language. While unstructured text is often difficult for machines to understand, Open Information Extraction (OIE) is a relation-independent extraction paradigm designed to extract assertions directly from massive and heterogeneous corpora. Allocation of low-cost computational resources is a main demand for Open Relation Extraction (ORE) systems. A large number of ORE methods have been proposed recently, covering a wide range of NLP tools, from ``shallow'' (e.g., part-of-speech tagging) to ``deep'' (e.g., semantic role labeling). There is a trade-off between NLP tools depth versus efficiency (computational cost) of ORE systems. This paper describes a novel approach called Sentence Difficulty Estimator for Open Information Extraction (SDE-OIE) for automatic estimation of relation extraction difficulty by developing some difficulty classifiers. These classifiers dedicate the input sentence to an appropriate OIE extractor in order to decrease the overall computational cost. Our evaluations show that an intelligent selection of a proper depth of ORE systems has a significant improvement on the effectiveness and scalability of SDE-OIE. It avoids wasting resources and achieves almost the same performance as its constituent deep extractor in a more reasonable time
Π¦ΠΈΡΡΠΎΠ²Π°Ρ ΡΡΠ°Π½ΡΡΠΎΡΠΌΠ°ΡΠΈΡ : Π½Π°ΡΡΠ½ΡΠΉ ΠΆΡΡΠ½Π°Π»
Π ΠΆΡΡΠ½Π°Π»Π΅ Β«Π¦ΠΈΡΡΠΎΠ²Π°Ρ ΡΡΠ°Π½ΡΡΠΎΡΠΌΠ°ΡΠΈΡΒ» ΠΏΡΠ±Π»ΠΈΠΊΡΡΡΡΡ ΡΡΠ°ΡΡΠΈ Π² ΠΎΠ±Π»Π°ΡΡΠΈ ΡΠ΅Ρ
Π½ΠΈΡΠ΅ΡΠΊΠΈΡ
ΠΈ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡΠ΅ΡΠΊΠΈΡ
Π½Π°ΡΠΊ. ΠΠ½ ΠΏΠΎΡΠ²ΡΡΠ΅Π½ Π°Π½Π°Π»ΠΈΠ·Ρ ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ² ΡΠΈΡΡΠΎΠ²ΠΎΠΉ ΡΡΠ°Π½ΡΡΠΎΡΠΌΠ°ΡΠΈΠΈ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΠΊΠΈ ΠΈ, Π² ΡΠ°ΡΡΠ½ΠΎΡΡΠΈ, ΡΠΈΡΡΠ΅ΠΌΡ ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ
ΠΠ΅ΠΊΠΎΡΠΎΡΡΠ΅ Π°ΡΠΏΠ΅ΠΊΡΡ ΡΠ΅Ρ Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΈΠ΄Π΅Π½ΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΊΡΠΈΠΌΠΈΠ½Π°Π»ΡΠ½ΠΎ Π·Π½Π°ΡΠΈΠΌΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Π² ΠΌΠ½ΠΎΠ³ΠΎΡΠ·ΡΡΠ½ΡΡ ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ ΠΌΠ°ΡΡΠΈΠ²Π°Ρ
Π ΠΌΠΎΠ½ΠΎΠ³ΡΠ°ΡΠΈΠΈ ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ Π² ΠΎΠ±Π»Π°ΡΡΠΈ ΠΏΠΎΠΈΡΠΊΠ° ΠΊΡΠΈΠΌΠΈΠ½Π°Π»ΡΠ½ΠΎ ΠΎΠΊΡΠ°ΡΠ΅Π½Π½ΡΡ
ΡΠ΅ΠΊΡΡΠΎΠ² ΠΈ Π²ΠΎΠΏΡΠΎΡΡ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΌΠ΅ΠΆΠ΄Ρ Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΠΌΠΈ ΡΠΎΡΠΌΠ°Π»ΠΈΠ·ΠΌΠ°ΠΌΠΈ ΡΠ΅ΠΊΡΡΠΎΠ² Π²Π΅Π±-ΠΊΠΎΠ½ΡΠ΅Π½ΡΠ° ΠΈ ΡΠ΅Π°Π»ΡΠ½ΠΎΠΉ ΡΡΡΠ½ΠΎΡΡΡΡ ΠΎΠ±ΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎ Π·Π½Π°ΡΠΈΠΌΠΎΠ³ΠΎ ΡΠΎΠ±ΡΡΠΈΡ. ΠΠΏΠΈΡΠ°Π½Π° Π»ΠΎΠ³ΠΈΠΊΠΎ-Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ ΡΠ°ΠΊΡΠΎΠ² ΠΈΠ· ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ
ΠΌΠ°ΡΡΠΈΠ²ΠΎΠ² ΠΊΠ°Π·Π°Ρ
ΡΠΊΠΎΠ³ΠΎ, ΡΡΡΡΠΊΠΎΠ³ΠΎ ΠΈ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠΎΠ². ΠΡΠΈΠ²Π΅Π΄Π΅Π½Ρ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΠΈ ΡΠΎΡΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π²ΡΡΠ°Π²Π½Π΅Π½Π½ΠΎΠ³ΠΎ ΠΊΠ°Π·Π°Ρ
ΡΠΊΠΎ-ΡΡΡΡΠΊΠΎΠ³ΠΎ ΠΏΠ°ΡΠ°Π»Π΅Π»ΡΠ½ΠΎΠ³ΠΎ ΠΊΠΎΡΠΏΡΡΠ° ΡΠ΅ΠΊΡΡΠΎΠ² ΠΊΡΠΈΠΌΠΈΠ½Π°Π»ΡΠ½ΠΎΠΉ ΡΠ΅ΠΌΠ°ΡΠΈΠΊΠΈ
ΠΠ΅ΠΊΠΎΡΠΎΡΡΠ΅ Π°ΡΠΏΠ΅ΠΊΡΡ ΡΠ΅Ρ Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΈΠ΄Π΅Π½ΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΊΡΠΈΠΌΠΈΠ½Π°Π»ΡΠ½ΠΎ Π·Π½Π°ΡΠΈΠΌΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Π² ΠΌΠ½ΠΎΠ³ΠΎΡΠ·ΡΡΠ½ΡΡ ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ ΠΌΠ°ΡΡΠΈΠ²Π°Ρ
Π ΠΌΠΎΠ½ΠΎΠ³ΡΠ°ΡΠΈΠΈ ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ Π² ΠΎΠ±Π»Π°ΡΡΠΈ ΠΏΠΎΠΈΡΠΊΠ° ΠΊΡΠΈΠΌΠΈΠ½Π°Π»ΡΠ½ΠΎ ΠΎΠΊΡΠ°ΡΠ΅Π½Π½ΡΡ
ΡΠ΅ΠΊΡΡΠΎΠ² ΠΈ Π²ΠΎΠΏΡΠΎΡΡ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ ΠΌΠ΅ΠΆΠ΄Ρ Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΠΌΠΈ ΡΠΎΡΠΌΠ°Π»ΠΈΠ·ΠΌΠ°ΠΌΠΈ ΡΠ΅ΠΊΡΡΠΎΠ² Π²Π΅Π±-ΠΊΠΎΠ½ΡΠ΅Π½ΡΠ° ΠΈ ΡΠ΅Π°Π»ΡΠ½ΠΎΠΉ ΡΡΡΠ½ΠΎΡΡΡΡ ΠΎΠ±ΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎ Π·Π½Π°ΡΠΈΠΌΠΎΠ³ΠΎ ΡΠΎΠ±ΡΡΠΈΡ. ΠΠΏΠΈΡΠ°Π½Π° Π»ΠΎΠ³ΠΈΠΊΠΎ-Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ ΡΠ°ΠΊΡΠΎΠ² ΠΈΠ· ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ
ΠΌΠ°ΡΡΠΈΠ²ΠΎΠ² ΠΊΠ°Π·Π°Ρ
ΡΠΊΠΎΠ³ΠΎ, ΡΡΡΡΠΊΠΎΠ³ΠΎ ΠΈ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠΎΠ². ΠΡΠΈΠ²Π΅Π΄Π΅Π½Ρ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΠΈ ΡΠΎΡΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π²ΡΡΠ°Π²Π½Π΅Π½Π½ΠΎΠ³ΠΎ ΠΊΠ°Π·Π°Ρ
ΡΠΊΠΎ-ΡΡΡΡΠΊΠΎΠ³ΠΎ ΠΏΠ°ΡΠ°Π»Π΅Π»ΡΠ½ΠΎΠ³ΠΎ ΠΊΠΎΡΠΏΡΡΠ° ΡΠ΅ΠΊΡΡΠΎΠ² ΠΊΡΠΈΠΌΠΈΠ½Π°Π»ΡΠ½ΠΎΠΉ ΡΠ΅ΠΌΠ°ΡΠΈΠΊΠΈ