機械翻訳用超大規模辞書データ資源

Abstract

会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター情報交流の国際化に伴い多言語情報の充実は今や喫緊の課題である。特に固有名詞やPOI (points of interest)は膨大な数量に加え頻繁な名称変更にも対応する必要があるため,正確で充実した多言語辞書データ資源が必須だ。そこで,機械翻訳の作業効率と精度を格段に向上させる,超大規模辞書データ資源(Very Large Scale Lexica: VLSL)の構築例として,固有名詞・専門用語等を含む日中韓英辞書データベースや多言語固有名詞辞書データベースを紹介する。VLSLは情報検索・形態素解析・固有表現認識・用語抽出等,自然言語処理の幅広い分野に応用が可能で更なる展開が期待される

    Similar works