63 research outputs found

    『日本語日常会話コーパス』モニター公開版:研究の可能性

    Get PDF
    National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター本発表では『日本語日常会話コーパス』(CEJC)モニター公開版を用いることでどのような研究の可能性が開けるかを、コーパスを用いた予備的分析を通して具体的に示す。プロジェクトの開始時点では、国語研究所コーパス開発センターが提供するコーパスは書き言葉に集中しており、話し言葉については独話を主対象とする『日本語話し言葉コーパス』のみであった。日常会話を対象とするCEJCのモニター公開により、書き言葉・話し言葉を含む多様なレジスターを対象に、言葉の使用傾向を多角的に捉えることができるようになった。このことを、並列節を導く接続助詞や縮約の分析を通して具体的に示す。またCEJCが多様な話者・多様な会話を収録していることによって、話者の年齢、場面、聞き手との関係性などが言葉の選択に与える影響の分析が可能となった。この点を丁寧体・普通体の分析を通して示す

    Prosodic diversity according to relationship among participants in everyday Japanese conversation

    Get PDF
    National Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsA new corpus project of the National Institute for Japanese Language and Linguistics is building a large-scale corpus of everyday Japanese conversation, the Corpus of Everyday Japanese Conversation, CEJC, which contains various kinds of conversations in a balanced manner. We plan to publish the corpus with 200 hours of conversations in 2022, and have already published and released 50 hours of the conversations to the public on a trial basis in December 2018. In this paper, we investigate statistically prosodic diversity in everyday conversation by analyzing the characteristics of the fundamental frequency (F0) of utterance in the CEJC. We first examined the differences of the F0s by the relationships between the speaker and the addressee. The results indicated that speech to the family is generally produced with low F0s, and politeness to the addressee produces higher F0s in utterances. Next, we analyzed the characteristics of the F0s in situations with various types of participants to show the effect of participants on diversity. The results indicated that although the degree of the F0 change differs with each speaker, they speak in relatively low tones in situations including family members and utter with high F0 in customer service

    〈共同研究プロジェクト紹介〉萌芽・発掘型 : 会話の韻律機能に関する実証的研究 日本語話し言葉における複合境界音調の役割

    Get PDF
    国立国語研究所理論・構造研究系本稿では,共同研究プロジェクト「会話の韻律機能に関する実証的研究」の中間報告を行う。最初にプロジェクトの目的について簡単に触れたあと,プロジェクトの研究成果の一つとして,アクセント句の複合境界音調(Boundary Pitch Movement, BPM)の分析結果について紹介する。この研究では,プロジェクトメンバーが構築に携ってきた『日本語話し言葉コーパス』を対象に定量的に分析を行い,独話と対話のいずれにおいても,上昇調や上昇下降調といったBPMが意味的・統語的に強い切れ目で生じる傾向にあることを明らかにした。この結果は,BPMが発言継続性の表示機能という共通した役割を独話と対話において担いうることを示している。This paper provides an interim report on the project "Empirical Study on the Role of Prosodic Features in Conversations." After a brief description of the research aims, we report on the analysis of boundary pitch movements (BPMs) in accentual phrases. Based on a quantitative analysis of the Corpus of Spontaneous Japanese, we found that BPMs such as rising intonation tend to occur at syntactically and semantically deep boundaries both in monologs and in dialogs. This result shows that BPMs may have the common function of indicating the continuation of speech in monologs and dialogs

    『日本語日常会話コーパス』モニター公開版の構築

    Get PDF
    国立国語研究所National Institute for Japanese Language and Linguistics国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,『日本語日常会話コーパス』(CEJC)の構築を進めている.CEJC は,自宅での家族との会話や飲食店での友人との会話,職場での同僚との会合,散策時の会話など,日常生活における多様な場面の会話を,映像まで含めて収録・公開するものであり,世界的に見ても極めて新しい試みである.最終的には200時間規模のコーパスとして2021年度末に公開する予定であるが,コーパスの利用可能性や問題などを把握し今後の構築に活かすために,50 時間のデータについて2018 年12 月にモニター公開を開始した.本稿ではCEJC モニター公開版の設計・構成やそれを用いた研究の可能性について概説する.We have been constructing the Corpus of Everyday Japanese Conversation, CEJC, under the NINJAL collaborative research project since 2016. The main features of the CEJC are i) that we target conversations embedded in naturally occurring ctivities in daily life; ii) that we collect various kinds of everyday conversations in a balanced manner so as to capture the diversity of everyday conversations and to observe natural conversational behavior; and iii) that we collect and publish not only audio but also video data in order to precisely understand the mechanism of our real-life social behavior. Prior to the publication of the whole corpus scheduled for 2022, we published the monitor version of the CEJC in December 2018. In this article, we first outline the design of the monitor version of the CEJC. Then, we conduct a preliminary analysis, showing possible implications of the corpus

    話し言葉コーパスの構築と公開

    Get PDF
    国立国語研究所National Institute for Japanese Language and Linguistic

    『日常会話コーパス』プロジェクト : コーパスに基づく話し言葉の多角的研究

    Get PDF
    会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター国立国語研究所では,2016 年4 月から「大規模日常会話コーパスに基づく話し言葉の多角的研究」プロジェクトを開始した。このプロジェクトでは,さまざまなタイプの日常会話200 時間をバランス良く収録した大規模な日常会話コーパスを構築し,それに基づく分析を通して,日常会話を含む話し言葉の特性を,レジスター・相互行為・経年変化の観点から多角的に解明することを目指す。本発表では,プロジェクト全体で推進する研究,およびそのために整備・公開する複数の言語資源の全体像について触れた上で,本プロジェクトの中核を占める『日本語日常会話コーパス』を取り上げ,コーパスの設計について報告する

    子どもによるやり取りへの参与の振る舞い : 両親との会話の事例分析から

    Get PDF
    National Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター子どもの会話への関わり方は、大人ほど豊かではないことが予想される一方で、『日本語日常会話コーパス』に収められる家庭で収録された映像データには、子どもが大人とのやり取りに巧みに加わって行く様子も観察される。このような子どもの会話参与に関する詳細を明らかにする足がかりとして、本研究は『日本語日常会話コーパス』から抜き出した、子どもが両親とやり取りを交わしている二つの食事場面を扱った事例研究を行う。各事例の中で子どもたちが、やり取りを生み出すことや、それを進行、展開させることにどのように関わっているのかについて、言語的・身体的振る舞いを記述し、考察を行う

    日中バイリンガル児の中国語の発達に関する事例研究 : 物の受け渡しにおける「谢谢(ありがとう)」に着目して

    Get PDF
    The University of Tokyo / National Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センター本研究では、日中バイリンガル家庭で育つ幼児の中国語の発達について検討する。バイリンガル児の言語発達については、音韻や語彙、統語面からの分析があるが、養育者とのコミュニケーションの中でどのように言語発達が進むかについての研究は不十分である。本研究では、一事例として、日本語母語話者の母親と中国語母語話者の父親の間に育つ女児1名(1歳7か月から2歳0か月)の「谢谢(ありがとう)」の使用を分析した。その結果、(1)相互行為上、「谢谢」は主に養育者から物を受け取った後に使用されるが、物を渡した後や受け取る前にも産出されることがある、(2)構文の面では、成人の典型的な用例以外にも、「谢谢+物を受け取った側」、「物を渡した側+谢谢+物を受け取った側」など、多くのバリエーションがある、(3)養育者は中国語能力にかかわらず女児の「谢谢」使用に対し肯定的であるが、中国語能力に応じて異なる役割を担っていることが明らかになった

    『日本語日常会話コーパス』データ公開方針 : 法的・倫理的な観点からの検討を踏まえて

    Get PDF
    国立国語研究所 研究系 音声言語研究領域千葉大学Spoken Language Division, Research Department, NINJALChiba University現在,国立国語研究所の機関拠点型基幹研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」で構築している『日本語日常会話コーパス』(CEJC)には,例えば自宅での家族との会話や飲食店での友人との会話,職場での同僚との打ち合せ,学校での同級生との雑談,散策時や車中の会話など,実に多様な場面の会話が含まれる。本コーパスは,音声データや転記テキストだけでなく,映像データについても公開する方針だが,こうした日常生活の中で記録された会話を,映像データも含めて公開したコーパスはこれまでにほとんど存在せず,データ公開のための方針を確立する必要がある。例えば,日常場面の会話を録画すると,映像データには公開の承諾を得ていない第三者の顔やテレビなどの著作物の写り込みが多く見られる。そこで,これまでに収録した多様な会話データをもとに具体的な問題を洗い出し,その対応について,肖像権や個人情報保護,著作権などの観点から,知財関連を専門とする弁護士と相談を重ねてきた。本稿では,これら一連の検討・議論を踏まえて定めたCEJC のデータ公開方針について報告する。Under the NINJAL collaborative research project, we started the compilation of a large-scale corpus of everyday Japanese conversation, the Corpus of Everyday Japanese Conversation (CEJC). The CEJC targets various kinds of naturally occurring conversations in daily situations, such as conversations during eating with the family at home, meetings with colleagues at work, and conversations while driving. A notable characteristic of the CEJC is that both audio and video data are collected and published. However, as virtually no corpora have contained video recordings of everyday conversations, guidelines have to be established on the release of such data in light of the potential ethical and legal issues of showing the faces of non-consenting third parties or copyrighted content such as TV programs. Based on a variety of data collected thus far, we discussed with a lawyer specializing in copyright and portrait right issues how to deal with such ethical problems. In this paper, we report a guideline for the release of the CEJC that we have established based on this discussion

    『日本語日常会話コーパス』のデータ公開方針 : 法的・倫理的な観点から

    Get PDF
    会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター『日本語日常会話コーパス』には,自宅での家族との会話やレストランでの友人との会話,屋外の散策時の会話,職場・学校での同僚や学友との用談・会議など,実に多様な場面の会話が含まれる。こうした日常生活の中で記録された会話を,映像データを含めて公開するにあたり,プライバシー権・肖像権・個人情報保護などの観点から,また著作物の写り込みについては著作権の観点から,検討する必要がある。本稿では,これまでに収録した200時間を越える会話データをもとに具体的な問題を洗い出し,知財関連を専門とする弁護士と相談した上で整理したデータ整備・公開方針について議論する
    corecore