24 research outputs found


    Get PDF
    National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センター本研究では,日本語による自然会話において,「とか」が物語の要素としての発話引用を構造的に配置する方法として用いられていることを論じる.「とか」について,「銅メダルとかとっちゃって」のような並列ではない用法は比較的近年において用いられ始めたとされ,研究はまだ多くない.とりわけ実際になされた会話に基づき,会話の中でのふるまいを経験的に分析した研究は管見の限りなされていない.本研究ではそのため,国立国語研究所において構築中の『日本語日常会話コーパス(CEJC)』モニター版をデータとし,会話分析の手法を用いて,具体的にどのように物語の中で「とか」が用いられるかを分析する.なお,ここでの物語とは,あるひとまとまりの出来事が時系列的に語られている発話連鎖を指す.また,本研究では発話者自身や第三者の可能な発話を引用するための標識として「とか」を用いている例に絞って分析する

    態度をほのめかす例示 : 日本語引用表現「みたいな」の分析

    Get PDF
    国立国語研究所 研究系 音声言語研究領域 非常勤研究員Adjunct Researcher, Spoken Language Division, Research Department, NINJAL本研究では,日本語の会話において,なんらかの発話を引用し,「みたいな」が置かれるような発話を分析する。従来,このタイプの発話についてはいくつかの研究がなされてきているが,多くの場合自然会話のデータは用いられておらず,実際の会話における参与者が何をするためにこうした発話を用いるのかということは十分には明らかになってきていない。そのため本研究では,国立国語研究所で現在構築中の『日本語日常会話コーパス』モニター公開版を利用し,会話分析の手法によって,上記のタイプの発話を分析する。分析の結果,以下のことがわかった。自分の発話に続けて発話する場合,語った事態や出来事に関して自分がどのような態度をとっているかが表出される。他の人の発話に続けて発話する場合,その参与者が語った事態や出来事に関する聴き手の理解を例証する。これらにより,なんらかの語られた事態や出来事に,可能な反応の形で続きを付け加えることで,事態や出来事についての態度を提示する方法になっており,態度を明示的に記述することなく言及することで,語り手と聴き手が出来事や事態からそれぞれ同じ態度へと至ることが目指されていると考えられる。This study examines a type of utterance, which quotes other utterances and ends with a quotation marker mitai-na in Japanese conversation. Some studies have worked on the type of utterance, but few of them have taken naturally occurring conversations into account. It has not been clear what work is done by such utterances in natural conversation. To solve this problem, this study analyzes the conversation data from the Corpus of Everyday Japanese Conversation using the methodology of conversation analysis. The study\u27s results were as follows. When a mitai-na utterance is used following an utterance by the utterer of the mitai-na, the utterance shows the attitude of the utterer toward the event or the matter described by the preceding utterance. When following an utterance of the utterance by others, it allows the utterer to show the proper understanding of the attitude of the utterer of the preceding utterance. The two can be seen as a procedure for showing the attitude by connecting a possible continuation of the event or the matter, so that the teller and the receiver can acheve the same attitude toward it


    Get PDF
    National Institute for Japanese Language and Linguistics会議名: 言語資源ワークショップ2022, 開催地: オンライン, 会期: 2022年8月30日-31日, 主催: 国立国語研究所 言語資源開発センター日常生活において,目の前で起こった出来事と結びつける形で,過去に自分が経験した事柄について語るということがなされる.本研究ではこの種の語りを「状況づけられた語りsituated telling」と呼ぶこととし,以下の2点について検討する.1.この種の語りによって何がなされているのか.2.具体的にどのような方法によって,語られる経験と目の前の出来事とが結びつけられているのか.この問題を検討するため,『日本語日常会話コーパス』からいくつかの会話断片を選び出して分析する.状況づけられた語りは,目の前で起こった出来事と類似の経験を有していることを示す.このことは,目の前で起こった一回限りの出来事を,何らかのパターンに基づいて「繰り返し起こること」として再編し,理解可能にしている.それにより目の前で起こった出来事を「繰り返し起こること」として理解することを主張するものであるといえる.そのために状況づけられた語りは,過去に経験された出来事の構成要素が目の前の出来事の理解に即した形で組み立てられる.またそのことによって目の前の出来事が経験の語りに即して理解可能になるといえ,相互反映的な関係が見出される

    Inaccurate Quotation: Structuring Telling with Complex Particle toka in Japanese Everyday Conversation

    Get PDF
    静岡理工科大学Shizuoka Institute of Science and Technology本研究は日常会話において,参与者が過去に経験した出来事を時系列的に語る「物語」の語りにおける複合助詞の「とか」の分析を行う。「とか」は「AとかBとか」の形で,類似のものを並列的に列挙する用法があるほか,会話などにおいては断定・明言を避ける対人配慮的な用法があるとされてきた。一方,近年ではそうではなく,評価の際立ったものの集合の中から一例を取り出して提示する「卓立的例示」と呼ばれる用法が見られることが指摘されてきている。本研究では,この「卓立的例示」に類する用法のうち,物語の語りの中に生じ,引用を導くマーカーとして使用されている例を『日本語日常会話コーパス』を用いて収集した。本研究で明らかにしたのは以下のことである。物語の語りにおける,引用を導く「とか」も「卓立的例示」の一種と見なせる用法が多く見られる。その上で,物語における出来事の推移に沿って,時系列的に先行するものごとに対して,後続することがらを際立たせるという構造の中に生じることがわかった。またそうした働きは,「とか」のもつ不正確さの含意の作用であることが示唆された。This study examines a type of Japanese complex particle toka in storytelling, in which participants narrate a series of events that they experienced in the past in the chronological order, in everyday conversation. Traditionally, toka is used to enumerate similar things parallelly. The literature points out that it is also used for marking a salient object by picking up an example from a set of excellent things with similar characteristics. In this article, some examples of the "salient exemplification" in storytelling are selected from the Corpus of Everyday Japanese Conversation. The result is as follows. Toka used as a marker of "salient exemplification" is often seen in storytelling. As the story progresses, toka is used to emphasize the subsequent object against the previous. Moreover, the literal meaning of toka, that is, a display of inaccuracy, enables it to be used in the above-mentioned manner.application/pdfdepartmental bulletin pape

    Design and Evaluation of the Corpus of Everyday Japanese Conversation

    Get PDF
    application/pdfNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsGraduate School of Humanities, Chiba UniversityNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsWe have constructed the Corpus of Everyday Japanese Conversation (CEJC) and published it in March 2022. The CEJC is designed to contain various kinds of everyday conversations in a balanced manner to capture their diversity. The CEJC features not only audio but also video data to facilitate precise understanding of the mechanism of real-life social behavior. The publication of a large-scale corpus of everyday conversations that includes video data is a new approach. The CEJC contains 200 hours of speech, 577 conversations, about 2.4 million words, and a total of 1675 conversants. In this paper, we present an overview of the corpus, including the recording method and devices, structure of the corpus, formats of video and audio files, transcription, and annotations. We then report some results of the evaluation of the CEJC in terms of conversant and conversation attributes. We show that the CEJC includes a good balance of adult conversants in terms of gender and age, as well as a variety of conversations in terms of conversation forms, places, activities, and numbers of conversants.conference pape

    Construction of the corpus of everyday Japanese conversation : An interim report

    Get PDF
    National Institute for Japanese Language and LinguisticsChiba University/National Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsLREC 2018 Special Speech Sessions "Speech Resources Collection in Real-World Situations"; Phoenix Seagaia Conference Center, Miyazaki; 2018-05-09In 2016, we launched a new corpus project in which we are building a large-scale corpus of everyday Japanese conversation in a balanced manner, aiming at exploring characteristics of conversations in contemporary Japanese through multiple approaches. The corpus targets various kinds of naturally occurring conversations in daily situations, such as conversations during dinner with the family at home, meetings with colleagues at work, and conversations while driving. In this paper, we first introduce an overview of the corpus, including corpus size, conversation variations, recording methods, structure of the corpus, and annotations to be included in the corpus. Next, we report on the current stage of the development of the corpus and legal and ethical issues discussed so far. Then we present some results of the preliminary evaluation of the data being collected. We focus on whether or not the 94 hours of conversations collected so far vary in a balanced manner by reference to the survey results of everyday conversational behavior that we conducted previously to build an empirical foundation for the corpus design. We will publish the whole corpus in 2022, consisting of more than 200 hours of recordings


    Get PDF
    会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター国立国語研究所では,今年の四月から「大規模日常会話コーパスに基づく話し言葉の多角的研究」プロジェクトを進めている。このプロジェクトでは,さまざまなタイプの日常会話200時間をバランス良く収録した大規模なコーパス『日本語日常会話コーパス』を構築し,それに基づく分析を通じて,日常会話を含む話し言葉の特性を多角的に解明することを目指している。本コーパスには,日常場面で行われる現実の会話が収録される。こうした会話には,極めてくだけた表現も頻出する。こうしたデータを多人数で書き起こしをするためには,文字化をするための基準を明確に定める必要がある。また,大量の会話を限られた期間で書き起こすために,効率的に作業をするための工夫が必要になる。本発表では,書き起こしの基準と効率的に作業を行うために用いている方法について紹介する


    Get PDF
    国立国語研究所 研究系 音声言語研究領域 非常勤研究員千葉大学大学院 博士課程/国立国語研究所 研究系 音声言語研究領域 非常勤研究員国立国語研究所 コーパス開発センター 非常勤研究員国立国語研究所 コーパス開発センター国立国語研究所 研究系 音声言語研究領域Adjunct Researcher, Spoken Language Division, Research Department, NINJALDoctoral Student, Chiba University / Adjunct Researcher, Spoken Language Division, Research Department, NINJALAdjunct Researcher, Center for Corpus Development, NINJALCenter for Corpus Development, NINJALSpoken Language Division, Research Department, NINJAL本稿は,平成28年度から構築を進めている『日本語日常会話コーパス』における転記の基準と作成手法について述べる。本コーパスには,日常場面で自然に生じるさまざまなタイプの会話200時間がバランス良く収録される予定である。日常会話には,極めてくだけた表現や,聞き取りづらい,あるいは把握しづらい表現が頻出する。こうした会話データを多人数により均質に書き起こすには,転記のための基準を明確に定める必要がある。また,200時間という大量の会話を限られた期間で書き起こすために,効率的に作業をするための工夫が必要になる。本プロジェクトでは,実際の会話データを対象に転記を行いながら,効率的に作業をするための工程を検討し,ツールの開発や転記基準の改訂を行ってきた。本稿では,このようにして策定した転記基準と,作業を効率的に進めるために整備した方法について紹介する。This paper describes the criteria and composition method of transcription for the Corpus of Everyday Japanese Conversation, which has been in construction since 2016 and will contain 200 hours of various types of conversations in a balanced distribution. As some expressions are extremely informal, hard to hear, or hard to understand, it is necessary to establish clear criteria for transcription to ensure homogeneous transcription quality from a large number of staff. Methods are also required to transcribe no less than 200 hours of conversations efficiently and in a timely manner. As part of this project, procedures for efficient transcription have been considered, and the development of tools and the revision of criteria of transcription have been conducted. This paper presents said transcription criteria and methods


    Get PDF
    国立国語研究所 音声言語研究領域国立国語研究所 音声言語研究領域 非常勤研究員国立国語研究所 音声言語研究領域 非常勤研究員国立国語研究所 音声言語研究領域 非常勤研究員国立国語研究所 音声言語研究領域国立国語研究所 音声言語研究領域 非常勤研究員国立国語研究所 音声言語研究領域 非常勤研究員千葉大学国立国語研究所 コーパス開発センター 非常勤研究員Spoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALSpoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALAdjunct Researcher, Spoken Language Division, Research Department, NINJALChiba UniversityAdjunct Researcher, Center for Corpus Development, NINJAL国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,『日本語日常会話コーパス』(CEJC)の構築を進めている。CEJCは,日常会話の多様性を捉え自然な会話行動が観察できるよう,様々な種類の会話をバランスよく収めることを目標に掲げている。2021年度末に予定している本公開に先立ち,コーパスの利用可能性や問題などを把握するために,目標とする200時間のうち50時間の会話データについて,2018年12月にモニター公開を開始した。本稿ではまず,コーパスの設計について,会話の収録法,データの公開方針,調査協力者の内訳,コーパスの規模や構成などの観点から概観する。次に,収録されているデータが設計通りバランスがとれているかを,話者と会話の両面から検証する。最後に,コーパスを用いた予備的分析を通して,CEJCモニター版を活用した研究の可能性を示す。We have been constructing the Corpus of Everyday Japanese Conversation (CEJC) under the NINJAL collaborative research project since 2016. The CEJC is designed to contain various kinds of everyday conversations in a balanced manner to capture the diversity of everyday conversations and to observe natural conversational behavior. Prior to the publication of the whole corpus, which scheduled for 2022, we published the monitor version of the CEJC in December 2018. In this paper, we first outlined the design of the monitor version of the CEJC, including recording methods, the release policy of the corpus, corpus size, and annotations. Then, we examined whether the speakers and the conversations in the corpus vary in a balanced manner. Finally, we conducted a preliminary analysis on some linguistic aspects of the monitor version of the CEJC, revealing the possible implications of the corpus