15 research outputs found

    Method of Sentence compression using the Dependency Grammar parse tree

    No full text
    본 발명은 문장의 의존 문법 구문 트리를 일정한 법칙에 따라 변형한 새로운 의존 문법 구문 트리를 생성하고 이를 이용하여 문장을 요약하는 의존 문법 구문 트리를 이용한 문장 요약 방법에 관한 것으로, 본 발명에 따른 의존 문법 구문 트리를 이용한 문장 요약 방법은, 규칙을 기반으로 하는 구문 분석기를 이용하여 제1 의존 문법 구문 트리를 생성하는 제1 단계; 상기 제1 단계에서 애매성으로 인하여 의존 관계를 찾아 내지 못한 단어들에 대해 확률을 기반으로 하는 구문 분석기를 이용하여 제2 의존 문법 구문 트리를 생성하는 제2 단계; 상기 제1 단계에서 생성된 제1 의존 문법 구문 트리와 상기 제2 단계에서 생성된 제2 의존 문법 구문 트리를 결합하여 제3 의존 문법 구문 트리를 생성하는 제3 단계; 상기 제3 의존 문법 구문 트리의 각 노드에 대해 해당 노드를 유지하는'REMAIN'동작, 또는 해당 노드와 그 자식 노드를 모두 삭제하는 'DELETE'동작, 또는 해당 노드를 삭제하고 그 자식 노드를 해당 노드의 자리에 두는 'CHILD_UP'동작을 판별하는 인공지능 모델을 사용하고 이를 적용하여 변형된 제4 의존 문법 구문 트리를 생성하는 제4 단계; 및, 상기 변형된 제4 의존 문법 구문 트리로부터 요약문을 생성하는 제5 단계를 포함하는 것을 특징으로 한다

    Schedule time information extraction system and method from korean text on internet

    No full text
    본 발명은 회의를 포함한 각종 한글로 이루어진 모임 공지에서 시작 시각과 종료 시각이 포함되는데, 이러한 시각 정보를 자동으로 식별 및 추출하기 위하여 시각 정보와 문맥 간의 관계를 표현하는 방법 및 정보 추출 시스템을 개시한다

    Method of Sentence compression using lexical information, the principal grammar element and title information

    No full text
    본 발명은 문장 요약 방법에 관한 것으로, 보다 상세하게는 공기 정보, 주요 문법 요소 및 제목 정보를 이용하여 요약 성능 및 가독율을 향상시킨 문장 요약 방법에 관한 것으로, 본 발명에 따른 문장 요약 방법은, 문장과 본문의 제목을 입력하는 제1 단계; Top-Down 방식으로 구문 분석 트리를 생성하면서, 주요 문법 요소를 추출하여 표시하는 제2 단계; 결정 트리를 이용하여 현재 문장의 최초의 단어가 요약된 문장에 포함되는 지를 판단하는 제3 단계; 상기 최초의 단어가 요약된 문장에 포함되는 것으로 판단되는 경우 상기 최초의 단어를 요약된 문장에 포함시키고, 공기 정보(lexical information)를 이용하여 상기 구문 분석 트리에 상기 최초의 단어를 주요 부분으로 표시하는 제4 단계; 및, 현재 문장에 단어가 더 존재하는지 판단하여, 더 존재하는 경우 상기 제3 단계 및 제4 단계를 반복 수행하고, 더 존재하지 않는 경우 현재의 문장을 요약하는 제5 단계를 포함하는 것을 특징으로 한다. 문장, 요약, 코퍼스, 공기 정보(lexical information

    Method of extracting Triplets by searching dependency grammar setence tree

    No full text
    본 발명은 문법적으로 올바른 평서문의 문장으로부터 온톨로지를 구축하기 위한 관계 트리플의 정보를 자동으로 추출해내는 방법 및 시스템에 관한 것으로, 본 발명에 따른 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법은, 대상 문장을 구문 분석하여 의존 문법 구문 트리를 생성하는 제1 단계; 상기 제1 단계 후 생성된 의존 문법 구문 트리를 전처리하여 관계 추출을 위한 형태로 변환하는 제2 단계; 및, 상기 제2 단계에서 변환된 의존 문법 구문 트리를 포스트오더(postorder) 방식으로 탐색하여 자동으로 관계 트리플을 추출하는 제3 단계를 포함한다

    Construction of LGG for Extracting Meeting Location

    No full text
    본 논문에서는 회의공지 이메일을 대상으로 하는 개최장소 추출시스템에 대하여 소개한다. 개최장소 추출 시스템은 두 단계로 구성되는데, 첫 번째 단계는 본문에 포함된 개최장소의 추출이고, 두 번째 단계는 추출된 개최장소의 Geocoding이다. 개최장소의 추출을 위하여 문맥 패턴을 분석하여 개최장소가 포함된 문장 주변의 패턴을 반영하는 Local-Grammar Graph를 구축하며, 개최장소의 Geocoding을 위하여는 Addr2Geocode API를 사용한다. 본 논문은 일정공지메일의 개최장소를 추출하기 위한 LGG 방법론 기반의 어휘-통사적 언어 정보를 기술하는 것을 목적으로 한다

    Sentence Summarization of News Articles

    No full text
    텔레비전 뉴스에서 부제목을 만들거나, 문장을 PDA나 휴대폰과 같은 작은 화면에 출력하고 싶은 경우, 가능한 방법은 두 가지가 있다. 첫번째는 사람에 의해 직접 만드는 방식이다. 두번째는 자동화된 문장 요약 시스템을 사용하는 방법이다. 따라서 문장 요약 알고리즘은 그 중요성이 계속해서 커지고 있다. 본 논문에서는 구문 트리의 서브 트리가 변화할 수 있는 규칙을 제시하는 방법에 (1)공기 정보와 (2) 문법적으로 올바른 구조를 유지하기 위해 핵심적인 부분(주요 문법 구조) 및 같이 요약되어야 할 절을 표시하는 휴리스틱, (3)주어진 문장이 포함된 글의 제목 정보를 추가로 사용하여 문장 요약을 실행하였다. 본 시스템의 결과와 기존의 요약 방식을 비교하는 실험을 분야 전공자들에 의한 주관적 평가로 수행한 결과, 본 시스템의 알고리즘이 기존에 사용되던 구문서브트리 변환 방법보다 중요한 부분 및 문법적으로 올바른 부분을 많이 유지하는 요약임을 확인하였다

    Methods of Transforming the Sejong Treebank to Improve

    No full text
    세종 트리뱅크는 현존하는 한국어 트리뱅크 중 비교적 최근에 구축되었고 그 규모가 가장 큰 자원이다. 세종 트리뱅크는 어절을 기반으로 구축되어 있어, 어절의 개념이 없는 영어를 기반으로 연구 개발된 대다수의 구문분석기를 학습하는 데 이용될 경우 모호성이 발생된다. 본 논문에서는 세종 트리뱅크를 변환하여 학습 시 모호성을 줄이고, 이를 통해 학습된 구문 분석기의 성능을 높이는 방법에 대하여 서술한다. 실험 결과에 따르면 본 논문에서 제시된 변환 결과를 통해 최소 2 %에서 최대 4 % 정도의 성능 향상 효과를 얻을 수 있었다

    번역과 웹그래프를 활용한 언어 간 위키피디아 인포박스 자동생성 기법

    No full text
    여러 언어로 작성되는 위키피디아의 경우 언어 간에 등록되어 있는 정보의 양과 내용이 달라 언어 간 정보를 상호 추출하고 서로 통합하는 연구에 대한 관심이 증가하고 있다. 특히, 위키피디아의 요약본으로써 의미가 있는 인포박스는 위키피디아 아티클에 존재하는 구조화된 정보 중 가장 근간이 되는 정보로, 본 논문에서는 위키피디아에 존재하는 인포박스를 1)소스 언어 자원으로부터 획득하여 타겟 언어로 번역하고, 2)번역된 결과물과 웹그래프를 이용하여 타겟 언어 데이터에서 획득하는 정보와 결합하는 과정을 통해 자동으로 인포박스를 생성하는 기법에 대하여 설명한다. 웹그래프는 위키피디아에 존재하는 링크 구조를 통해 서로 다른 두 용어간의 관련도를 측정하여 인포박스에 추가될 내용을 파악하는데 사용한다. 본 논문의 기법은 언어 간 인포박스를 생성하는 측면에서, 영어 인포박스 데이터를 입력으로 하여 한국어 인포박스 데이터를 생성하는 방식으로 진행하였다. 평가를 위하여 기존 한국어에 실제 존재하는 인포박스 데이터와 비교 실험하는 방식을 사용하여 평균적으로 40%의 정확률과 83%의 재현율을 나타내었다. 하지만, 기존 한국어에 존재하는 인포박스 데이터의 내용이 인포박스에 포함될 완전한 데이터를 모두 포함했다고 볼 수 없으므로 본 논문에서 제안하는 수행한 실험의 정확률이 상대적으로 낮게 나온 것으로 분석되었다. 실제 사람이 수작업으로 새롭게 생성된 인포박스 데이터의 적합성을 판별한 경우 평균 76%의 정확률과 91%의 재현율을 나타내었다

    Determinants of Soybeans and Copper in the World Market

    No full text
    corecore