病名を表す合成語の語末調査

Abstract

Seinan Jo Gakuin UniversitySeinan Jo Gakuin UniversityOsaka UniversityOsaka UniversityNational Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター本研究では合成語の語末により病名の判別が可能か否かを確認するために合成語の語末調査を行った。具体的には、病名を表す合成語5,465 語について語末のunigram、bigram、trigram を調べた。加えて、筆者等が着手している電子カルテに記載された合成語を対象とした語構成要素解析で定めた語単位で、合成語を分割した場合に語末となる語構成要素の頻度を調べた。その結果、(1)右側主要部の規則による意味を用いた判別が可能なこと、(2)病名の末尾には「ヘモクロマトーシス」のようなカタカナ語があり、文字単位での判別より語単位の判別の方が適していることが分かった。また、意味ラベル「接尾語」が付与された語構成要素と、「病名」が付与された語構成要素の内「接尾語」を含まない要素を用いることで「病名」の機械的な判別が可能であることが示唆された

    Similar works