8 research outputs found

    Automatically Building Korean Predicate-Argument Structures Based on POS rules

    No full text
    이 논문은 품사규칙을 기반으로 한국어 하위범주화 정보를 자동으로 구축하는 방법을 제안한다. 원시코퍼스에서 용언-논항 단위를 추출하여 용언의 격틀을 자동으로 구축하고 평가한다. 또한, 단순히 품사규칙에 의존하여 용언-논항 정보를 추출하기 때문에 발생할 수 있는 문제점들을 알아보고 해결책을 제안한다

    Named entity-based URI spotting from natural language query

    No full text
    학위논문(석사) - 한국과학기술원 : 웹사이언스공학전공, 2014.2, [ vi, 46 p. ]본 논문은 Linked Data의 중심 역할을 하는 디비피디아의 발전 정도 및 활용 가능 범위를 4 단계 계층을 통해 제시한다. 우리는 디비피디아의 계층 정의를 통해 다음과 같은 질문에 답변을 제시한다. 레벨을 나누는 기준이 무엇인가?, 레벨에 포함되기 위한 요구사항은 무엇인가?, 각 디비피디아 언어가 어느 레벨에 속하는가?. 4단계의 계층 분류는 두 가지 다른 관점으로부터 연구 첫 번째로 자연어 처리 관점에서의 분류, 다시말해 이것은 QALD URI spotting 질의응답 실험으로부터 "어떠한 자연어 처리 과정을 통해 해당 질의가 해결되는가?" 두 번째로 디비피디아 데이터의 성장관점에서 "QALD 질의응답을 위해 어떠한 디비피디아 데이터를 가 필요한가"로 분류될 수 있다. 또한, 우리는 실험을 통해 QALD URI spotting을 통해 디비피디아에 더 많은 계층이 있을것이라는 점을 말할 수 있다. 우리는 25개 언어에 대한 디비피디아를 분석하여 앞서 정의한 4단계의 계층을 기준으로 분류를 시도 하였으며, 각 단계를 진행하면 어떤 QALD 질의 응답을 해결할 수 있고, 어느 분야에 사용할 수 있는지 구체적 사례와 어플리케이션을 소개한다. 그리고 디비피디아의 구축의 실례로서 한국어 디비피디아 구축 사례를 통해 실제 각 계층을 구축하는 방법을 소개함으로써 아직 구축하지 못한 언어엔 디비피디아를 구축하는 최선의 가이드를 제공하고 25개의 분석된 언어엔 다음 발전 방향을 제시할 좋은 기회가 될 것이다.한국과학기술원 : 웹사이언스공학전공

    Methods of Transforming the Sejong Treebank to Improve

    No full text
    세종 트리뱅크는 현존하는 한국어 트리뱅크 중 비교적 최근에 구축되었고 그 규모가 가장 큰 자원이다. 세종 트리뱅크는 어절을 기반으로 구축되어 있어, 어절의 개념이 없는 영어를 기반으로 연구 개발된 대다수의 구문분석기를 학습하는 데 이용될 경우 모호성이 발생된다. 본 논문에서는 세종 트리뱅크를 변환하여 학습 시 모호성을 줄이고, 이를 통해 학습된 구문 분석기의 성능을 높이는 방법에 대하여 서술한다. 실험 결과에 따르면 본 논문에서 제시된 변환 결과를 통해 최소 2 %에서 최대 4 % 정도의 성능 향상 효과를 얻을 수 있었다

    링크드 데이터를 이용한 질의응답 지식 베이스 구축 방법론 연구

    No full text
    본 논문에서는 질의응답 시스템 구현을 위한 준비 작업으로 링크드 데이터를 이용한 질의응답 지식 베이스 구축 방법을 제시한다. 질의응답에 필요한 광범위한 지식 베이스 구축을 위해 누구나 접근 가능한 공개형 데이터이며 잘 구성된 온톨로지를 가진 한국어 디비피디아를구축 하였고 QALD 질의응답 코퍼스에 한국어 정보를 추가하여 질의응답 평가 데이터를 구축하였다

    형태소 분석 결과를 사용한 통사 지표 자동 부여

    No full text
    이 논문에서는 형태소 분석 결과로 부터 통사 지표를 자동으로 부여하는 방법에 대해 설명한다. 세종 구문 분석 말뭉치에서 제공하는 통사 지표를 학습하고 테스트하여 94.78%의 정확도를 얻었다. 또한 세종 말뭉치에서 학습한 내용을 구조적으로 다른 카이스트 구문 분석 말뭉치에 적용하는 방법을 소개한다. 통사 지표 정보는 구문 분석 전처리로 사용되어 구문 분석 성능을 향상 시킬 수 있다. 실제로 새로이 통사 지표를 부여받은 카이스트 구문 분석 말뭉치는 구구조 구문 분석에서 성능 향상을 보였다

    Accessing Korean DBpedia resources for the Data Web

    No full text
    본 논문에서는 한국어 DBpedia의 문제점을 기반으로 한국어 DBpedia리소스 접근을 위한 여러 방안을 제시하고 사용자로 하여금 손쉬운 SPARQL Endpoint의 이용 방법을 모색하여 최종적으로 한국어 DBpedia의 활용도를 높여 Linked Data 등의 데이터 웹으로 확장하는 방법을 제시한

    Korean Natural Language Processing Platform for Linked Data

    No full text
    본 논문에서는 한국어 자연언어처리를 위해 형태소분석기와 구구조 구문분석기와 의존구조 구문분석기를 통합한 하나의 플랫폼을 제공하고, 외국의 다양한 자연언어처리 도구들의 결과물과의 국제적 상호운용성 및 Linked Data를 위한 RDF 형태로의 변환 시스템을 제시한다
    corecore