    ジュウゾクセツ ノ カカリ ウケ コウゾウ ノ ケイシキカ

    本研究では,日本語における従属節の係り受け構造について形式化する。より大きな節を作る規則に着目し,その規則をもとに,節の係り受け構造を,スロットとそれに含まれる接続表現という観点から記述することを試みる。その結果,必要となる15 のスロットと,それらに含まれる接続表現の記述を得た。ある接続表現を節末に持つ節は,それよりも前者のスロットに含まれる表現を節末に持つ従属節を受け,より後方のスロットに含まれる接続表現を節末に持つ節に係る。そして一つの節を構成することのない,共起制限が生じる接続表現を示し,それらについて考察したい。また,いくつかの接続表現に関しては,係り受け構造の観点から,二種類に分類する必要があるという提案を行った。 The aim of this study is to formalize the struture of subordinate clauses based on the rules of connectives. In this study, rules that were written in context-free grammar and bottom-up style are considered. Rules that specify the structure of two subordinate clauses stipulate that the preceding clause modeifies the following clause, and therefore connectives are assigned a number of slots as the first element of the rule must precede the second. This study established 15 slots, to each of which connectives can be assigned. Connectives occupying the same slot express a co-occurence restriction, because they do not coexist as part of one rule, and characteristics of connectives which appear in two different slots were also considered


    会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター現在,多くの幼稚園では日本語を母語としない保護者(NonNativeSpeaker 保護者,以下NNS 保護者)が見られるが,日本語学習の機会が少なく日本語が十分に理解できない場合,幼稚園の配布文書が正しく理解されず,情報伝達がうまくいかずに保育活動に支障をきたすこともある。そのため,将来的に教師とNNS 保護者を結ぶ「保護者に伝わるやさしい日本語」のテキスト化をめざし,『幼稚園の配布文書コーパス』を作成している。コーパスの作成では,より精度の高い語彙・文型調査が行えるよう,OCR ソフトの認識誤りを人手だけで修正するのではなく,形態素解析システム(unidic-mecab2.1.2)も活用して誤りを発見して修正し,さらに正確に語に区切れない場合は表記の変更・記号の追加を行っている。本発表では,そのコーパス作成法について報告する


    <コース報告特集>文型・文法 7

    既存コーパスの修正とその有効性 : 「YNU書き言葉コーパス」を例に

