6 research outputs found

    Contextual Keyword Extraction by Building Sentences with Crowsourcing

    No full text
    Automatic keyword extraction from documents has long been used and proven its usefulness in various areas. Crowdsourced tagging for multimedia resources has emerged and looks promising to a certain extent. Automatic approaches for unstructured data, automatic keyword extraction and crowdsourced tagging are efficient but they all suffer from the lack of contextual understanding. In this paper, we propose a new model of extracting key contextual terms from unstructured data, especially from documents, with crowdsourcing. The model consists of four sequential processes: (1) term selection by frequency, (2) sentence building, (3) revised term selection reflecting the newly built sentences, and (4) sentence voting. Online workers read only a fraction of a document and participated in sentence building and sentence voting processes, and key sentences were generated as a result. We compared the generated sentences to the keywords entered by the author and to the sentences generated by offline workers who read the whole document. The results support the idea that sentence building process can help selecting terms with more contextual meaning, closing the gap between keywords from automated approaches and contextual understanding required by humans

    SYSTEM AND METHOD FOR KNOWLEDGE FUSION

    No full text
    본 발명은 지식 융합 시스템 및 방법에 관한 것으로, 상기 시스템은 소스 언어의 디비피디아를 기반으로 대상 도메인에 속하는 아티클들을 수집 및 분석하여 주제, 속성, 빈객체의 트리플 항목을 가지는 인포박스 템플릿을 생성하는 인포박스 템플릿 생성부; 상기 인포박스 템플릿의 속성 항목의 명칭을 호환 가능한 술어로 치환하는 술어 치환부; 소스 주제와 상기 소스 주제에 대응되는 타겟 주제를 검색하여 제시하는 정보 확인부; 소스 언어의 디비피디아를 기반으로 상기 소스 주제에 속하는 아티클을 획득한 후, 술어 치환된 상기 인포박스 템플릿에 대응되는 트리플을 추출하여 상기 인포박스 템플릿에 기입하는 트리플 추출부; 트리플 추출 완료된 상기 인포박스 템플릿을 소스 언어에서 타겟 언어로 모두 번역하는 트리플 번역부; 및 타겟 언어의 디비피디아를 기반으로 상기 타겟 주제에 속하는 아티클의 인포박스 데이터를 획득한 후, 번역된 상기 인포박스 템플릿의 트리플 항목과 융합하여 새로운 인포박스를 생성하는 데이터 융합부를 포함할 수 있다

    METHOD AND APPARATUS FOR MEASURING KOREAN STRING SIMILARITY

    No full text
    한글 유사도 측정 방법 및 장치를 공개한다. 본 발명은 컴퓨터에서 수행되는 한글 유사도 측정 방법에 있어서, 상기 컴퓨터가, 인가된 입력 데이터에서 적어도 2개의 비교 대상 단어를 추출하는 단계, 상기 추출된 적어도 2개의 비교 대상 단어 각각의 음절과 음소를 분석하는 단계, 상기 적어도 2개의 비교 대상 단어 각각에서 분석된 상기 음절을 비교하여 음절 거리를 계산하는 단계, 상기 음절 거리가 0보다 크면, 비교 대상 단어 간에 서로 상이한 적어도 하나의 음절 각각에 대한 음소 거리인 음절별 음소 거리를 계산하는 단계, 상기 음절별 음소 거리들 중 최소값인 최소 음절별 음소 거리를 획득하는 단계 및 상기 음절 거리에 기설정된 음절 가중치를 가중하고, 상기 최소 음절별 음소 거리에 기설정된 음소 가중치를 가중하여 유사도를 측정하는 단계를 포함한다

    K 기업 사례 = xMarketing strategies for venture business : K company case / d홍순길.

    No full text
    학위논문(석사) - 한국과학기술원 : 테크노경영대학원, 1999.2, [ iv, 64 p. ]한국과학기술원 : 테크노경영대학원
    corecore