9 research outputs found
美容院におけるマルチアクティビティ:鏡越しの視線と発話
National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター美容院では鏡越しに会話が行われる。鏡越しの視線に注目し、美容院の特殊な物的環境の中で参与者が美容施術中の日常会話が成立するプロセスを記述し明らかにする。通常の会話に伴う視線の移動パターンとの違いはどのように見られるか。本発表では日常会話コーパスから4人のデータ提供者による美容施術場面を扱う。マルチモーダルな事例分析を通して美容院における顧客の視線パターンを例示し、日常生活にある複合活動場面における視線ストラテジーの多様性と普遍性の発見を目指す
マルチアクティビティに伴う発話の分類 : 遂行発話と雑談
National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター日常的に会話はマルチアクティビティ(複合活動)の中で行われることが多い。他の活動を主として行う場面での会話は、雑談に加えて、活動の遂行に関わる発話が見られる。雑談も活動に関連して行われることが多く、全くその場の物事と関わらない発話は少ない。その場の物事に関した発話とその場にない物事に関する発話の区分は談話研究において重要である。Chafe(1994)は意識の宛先をもとにこれらの言語表現の分類を提示した。話し言葉においては話し手と聴き手が会話スペースを共有することがほとんどであるため、書き言葉に比べて場に即した言語活動が行われやすい。本発表では参加者が共同で料理活動を行いながらの会話データを扱う。料理工程を進捗させるための発話と料理の進捗に関わらない発話を分類する
マルチアクティビティにおける作業の優先と会話の補填:共同調理場面・他者化粧場面を例に
National Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センター日常会話は共同作業を行いながら成されることが多い。日常生活における共同作業は作業活動と会話活動のマルチアクティビティとして捉えることができる。参加者たちは相手の行動・発話とタイミングを調整しながら自らの行動・発話を行い、協力的に作業と会話を進捗させていく。作業の目的とは別に、会話には社会的関係を良好に保つ目的がある。良好な人間関係は作業の達成に間接的に寄与するが、直接的には会話の進行が作業の進行を妨げることがある。作業の見通しを誤ってある参加者がエピソードを話しはじめ作業の進捗を妨げる場合、別の参加者はエピソードへの反応が期待される位置で沈黙を保ったのち作業の指示発話を行い相手に作業への復帰を促す。作業再開後エピソードトークを遮った参加者が適宜先程のエピソードに言及して会話活動の補填が成される。二者による料理場面、化粧場面から事例分析を行う。また発話はCloranの修辞ユニット分析を用いて分析し、特に脱文脈度の低い「行動」を示す発話を作業活動の指示発話の指標とする
Design and Evaluation of the Corpus of Everyday Japanese Conversation
application/pdfNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsGraduate School of Humanities, Chiba UniversityNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsWe have constructed the Corpus of Everyday Japanese Conversation (CEJC) and published it in March 2022. The CEJC is designed to contain various kinds of everyday conversations in a balanced manner to capture their diversity. The CEJC features not only audio but also video data to facilitate precise understanding of the mechanism of real-life social behavior. The publication of a large-scale corpus of everyday conversations that includes video data is a new approach. The CEJC contains 200 hours of speech, 577 conversations, about 2.4 million words, and a total of 1675 conversants. In this paper, we present an overview of the corpus, including the recording method and devices, structure of the corpus, formats of video and audio files, transcription, and annotations. We then report some results of the evaluation of the CEJC in terms of conversant and conversation attributes. We show that the CEJC includes a good balance of adult conversants in terms of gender and age, as well as a variety of conversations in terms of conversation forms, places, activities, and numbers of conversants.conference pape
『日本語日常会話コーパス』モニター版の設計・評価・予備的分析
国立国語研究所 音声言語研究領域国立国語研究所 音声言語研究領域 非常勤研究員国立国語研究所 音声言語研究領域 非常勤研究員国立国語研究所 音声言語研究領域 非常勤研究員国立国語研究所 音声言語研究領域国立国語研究所 音声言語研究領域 非常勤研究員国立国語研究所 音声言語研究領域 非常勤研究員千葉大学国立国語研究所 コーパス開発センター 非常勤研究員Spoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALSpoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALChiba UniversityAdjunct Researcher, Center for Corpus Development, NINJAL国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,『日本語日常会話コーパス』(CEJC)の構築を進めている。CEJCは,日常会話の多様性を捉え自然な会話行動が観察できるよう,様々な種類の会話をバランスよく収めることを目標に掲げている。2021年度末に予定している本公開に先立ち,コーパスの利用可能性や問題などを把握するために,目標とする200時間のうち50時間の会話データについて,2018年12月にモニター公開を開始した。本稿ではまず,コーパスの設計について,会話の収録法,データの公開方針,調査協力者の内訳,コーパスの規模や構成などの観点から概観する。次に,収録されているデータが設計通りバランスがとれているかを,話者と会話の両面から検証する。最後に,コーパスを用いた予備的分析を通して,CEJCモニター版を活用した研究の可能性を示す。We have been constructing the Corpus of Everyday Japanese Conversation (CEJC) under the NINJAL collaborative research project since 2016. The CEJC is designed to contain various kinds of everyday conversations in a balanced manner to capture the diversity of everyday conversations and to observe natural conversational behavior. Prior to the publication of the whole corpus, which scheduled for 2022, we published the monitor version of the CEJC in December 2018. In this paper, we first outlined the design of the monitor version of the CEJC, including recording methods, the release policy of the corpus, corpus size, and annotations. Then, we examined whether the speakers and the conversations in the corpus vary in a balanced manner. Finally, we conducted a preliminary analysis on some linguistic aspects of the monitor version of the CEJC, revealing the possible implications of the corpus
『子ども版日本語日常会話コーパス』の構築
NINJALNINJALNINJALNINJALNINJALNINJALNINJALThe University of Tokyo / NINJALNINJAL会議名: 言語資源ワークショップ2022, 開催地: オンライン, 会期: 2022年8月30日-31日, 主催: 国立国語研究所 言語資源開発センター2022年3月に公開した『日本語日常会話コーパス』(CEJC)は、成人中心のコーパスであり、未成年者、とくに 10 歳未満の子どもの会話はあまり含まれていないという問題がある。そこで国立国語研究所共同研究プロジェクト「多世代会話コーパスに基づく話し言葉の総合的研究」(2022~2027年度)では、子どもを中心とする多様な場面・相手との会話を含む映像付きコーパスを新たに開発し、成人中心のCEJCと接続させることにより、コミュニケーションを含む言語の発達・変化の過程を、子どもから高齢者まで多世代に渡り実証的に研究できる基盤を構築することを目指している。発表では、新たに構築する子ども版の日常会話コーパスの設計や収録状況について報告する
『日本語日常会話コーパス』モニター公開版の概要
National Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsChiba University,National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,200時間規模の日常会話を収めた『日本語日常会話コーパス』の構築を進めている。このコーパスは,多様な日常場面の会話を,映像まで含めて収録・公開するものであり,世界的に見ても新しい試みである。『日本語日常会話コーパス』の本公開は,プロジェクトの最終年度にあたる2021年度を予定してるが,コーパスの利用可能性や問題などを把握し今後の構築に活かすために,50時間のデータについて2018年12月にモニター公開することを予定している。そこで本稿では,モニター公開データの仕様や特徴について報告する
『日本語日常会話コーパス』設計と構築
国立国語研究所 研究系国立国語研究所 研究系 非常勤研究員国立国語研究所 研究系 非常勤研究員国立国語研究所 研究系 非常勤研究員国立国語研究所 研究系国立国語研究所 言語資源開発センター国立国語研究所 研究系 非常勤研究員千葉大学国立国語研究所 研究系 非常勤研究員国立国語研究所 研究系 技術補佐員Research Department, NINJALAdjunct Researcher, Research Department, NINJALAdjunct Researcher, Research Department, NINJALAdjunct Researcher, Research Department, NINJALResearch Department, NINJALCenter for Language Resource Development, NINJALAdjunct Researcher, Research Department, NINJALChiba UniversityAdjunct Researcher, Research Department, NINJALTechnical Assistant, Research Department, NINJAL国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,『日本語日常会話コーパス』(CEJC)の構築を進め,2022年3月に最終公開した。CEJCは,(1)日常生活で実際に交わされる会話を対象とすること,(2)多様な場面における多様な話者による会話をバランスよく格納すること,(3)映像まで含めて公開することを特徴とする。日常会話を対象とする映像付き大規模コーパスの構築は世界的に見ても新しい取り組みである。コーパスの規模は,200時間,577会話,240万語,延べ話者数1675人である。本稿では,コーパスの設計・構築について,会話の収録法や収録機器,コーパスの基本構成,公開する音声・映像データのフォーマット,転記テキスト,各種アノテーション等などの観点から概観した上で,収録データのバランスについて検証する。We have constructed the Corpus of Everyday Japanese Conversation (CEJC) and published it in March 2022. The main features of the CEJC include: i) a focus on conversations that occurred naturally in activities of daily life; ii) a balanced collection of everyday conversations that capture their diversity and facilitate the observation of natural, conversational behavior in daily life; and iii) the publication of audio and video data for a better understanding of the mechanism of real-life social behavior. The publication of a large-scale corpus of everyday conversations that includes video data is a new approach. The CEJC contains 200 hours of speech, 577 conversations, approximately 2.4 million words, and 1,675 speakers. In this paper, we describe the process involved in the design and construction of CEJC including the recording method and devices used, structure of the corpus, formats of the audio and video files, transcription, and annotations. We then examine how the conversations in the corpus were selected and compiled in a balanced manner to showcase their variety