多言語コーパスと日本語研究 : 「中日対訳コーパス」の利用研究例から


北京日本学研究センターBeijing Center for Japanese Studies多言語コーパスに焦点を絞って,まずこれまで多言語コーパスを分類するための基準が不足していたことを指摘する。さらに,多言語コーパスというものにおいては異なる言語がさまざまな関係によって関連付けられていることを示し,その関係を分類するための基準を提案する。その上で,多言語コーパスをどのように選定し,使い分けるべきかについての目安を示す。また,「中日対訳コーパス」の作成と利用経験を踏まえて,訳文データの特性に気付かず原語と対等に使うなどの利用上の問題点を指摘したうえ,筆者が提示した利用モデルを説明し,「可能だ」という可能表現,終助詞「だろう」の意味用法,日中同形語である「基本」の意味用法などに関する日中対照研究の事例を通して,対訳コーパスを適正に利用する方法とその効果を示す。Recent developments of the computer-readable corpus and their applications have become increasingly diversified, and the type of users has also expanded to a wider community. These changes have created new problems in application, and studies on these problems have attracted much attention. The problems include ascertaining the characteristics, potentiality, and limitation of each corpus, and complying with the user\u27s specific requirements. Based on the series of research results from building and using the Japanese-Chinese parallel corpora for Japanese studies, the author points out the importance of fully understanding the characteristics of each corpus and the problems of treating sentences in parallel corpora as the equivalent of the original sentences. As an illustration of these issues and to demonstrate the best of use of parallel corpus, he presents his study using particular examples, including the Japanese expression kanou-da denoting the possibility, the sentence final particle daroo, and kihon (jiben) that has the same form in Japanese and Chinese

    Similar works