62 research outputs found

    日常会話音声に対する基本周波数推定の課題

    Get PDF
    National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター音声コーパス構築において韻律ラベリングを行うためには、音声波形の基本周波数を抽出することで声の高さを数値化し、上昇・下降の程度を観察することが必要となる。一般に、『日本語話し言葉コーパス』に収録されているような雑音がほとんど存在しないクリーンな音声に対する基本周波数推定は容易であるが、日常場面のような周囲に様々な音が存在する環境で収録された音声に対しては各種の雑音の影響や発話の重複により誤った推定がなされる場合がある。本稿では『日本語日常会話コーパス』モニター版を基に、推定エラーが生じやすい日常会話音声に対して雑音抑圧や音源分離といった音声信号処理を利用することで、音声コーパス構築に向けてどの程度の基本周波数推定を行うことができるかを示す

    Spontaneous speech resources in Japan

    Get PDF
    National Institute for Japanese Language and LinguisticsNational Institute of InformaticsLREC 2018 Special Speech Sessions "Speech Resources Collection in Real-World Situations"; Phoenix Seagaia Conference Center, Miyazaki; 2018-05-09In this paper, we introduce representative corpora of spontaneous speech, which have been provided publically in Japan. A large amount of spontaneous speech data is required for research on various themes in speech studies such as speech analysis, speech recognition systems, and natural language processing in recent years. However, it is difficult to collect spontaneous speech data, and few corpora of spontaneous speech are available. Considering the diversity of speech in real-world situations, the data remain insufficient. We show the characteristics of spontaneous Japanese speech corpora gathered and distributed by two organizations: the Speech Resources Consortium at the National Institute of Informatics, and the National Institute for Japanese Language and Linguistics. Then, we describe prospects for the development of spontaneous speech resources

    Prosodic diversity according to relationship among participants in everyday Japanese conversation

    Get PDF
    National Institute for Japanese Language and LinguisticsNational Institute for Japanese Language and LinguisticsA new corpus project of the National Institute for Japanese Language and Linguistics is building a large-scale corpus of everyday Japanese conversation, the Corpus of Everyday Japanese Conversation, CEJC, which contains various kinds of conversations in a balanced manner. We plan to publish the corpus with 200 hours of conversations in 2022, and have already published and released 50 hours of the conversations to the public on a trial basis in December 2018. In this paper, we investigate statistically prosodic diversity in everyday conversation by analyzing the characteristics of the fundamental frequency (F0) of utterance in the CEJC. We first examined the differences of the F0s by the relationships between the speaker and the addressee. The results indicated that speech to the family is generally produced with low F0s, and politeness to the addressee produces higher F0s in utterances. Next, we analyzed the characteristics of the F0s in situations with various types of participants to show the effect of participants on diversity. The results indicated that although the degree of the F0 change differs with each speaker, they speak in relatively low tones in situations including family members and utter with high F0 in customer service

    コーパス構築における発話アライメントの現状

    Get PDF
    会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター音声コーパスの構築にあたり,音声信号に対し発話・音韻・韻律などの各種ラベルを付与する必要がある。これらのラベルは音声分野の知識を有した作業者による目視や聴音を基に付与されることがほとんどであり,大規模コーパス構築において大きな負担となっている。特に近年研究対象となることが多い自発発話では,言い誤りや言い澱み,曖昧な発声などの現象が頻繁に生じるため,自動ラベリングを困難にしている。本稿では,転記テキストのラベリングに焦点を絞り,既存の音声認識によるシステムを応用した自動アライメントの現状について報告する。自発発話が収録されている「日本語話し言葉コーパス(CSJ)」および「日本語日常会話コーパス(CEJC)」を用いてシステムの性能評価を行い,自動アライメントの今後の課題について述べる

    Relationships between Dialog Acts and the Fundamental Frequencies of Everyday Speech on the Corpus of Everyday Japanese Conversation

    Get PDF
    会議名: 言語資源ワークショップ2023, 開催地: オンライン, 会期: 2023年8月28日-29日, 主催: 国立国語研究所 言語資源開発センター様々なタイプの日常会話をバランス良く納めた『日本語日常会話コーパス』(CEJC)の公開により、これまで大規模な分析を行うことが困難であった日常生活における音声の多様性が観察できるようになった。先に、CEJCを基にした調査により日常会話においては会話相手の属性によって発話の基本周波数が異なる傾向を示すことが観察された。本稿では音声の多様性の更なる検証として、CEJCに付与されている発話の性質を表す談話行為情報に着目し、日常会話音声の基本周波数と談話行為との関係を調べた結果を示す。application/pdfものつくり大学 / 国立国語研究所Institute of Technologists / National Institute for Japanese Language and Linguisticsconference pape

    A Conversation-Analytic Annotation of Turn-Taking Behavior in Japanese Multi-Party Conversation and its Preliminary Analysis

    Get PDF
    Tokyo University of TechnologyChiba UniversityNational Institute for Japanese Language and Linguistic

    方言音声に対するテキスト自動アライメントの試み

    Get PDF
    National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター音声コーパスの構築にあたり、音声に対する発話・音素・韻律などの各種ラベル付与が作業者の大きな負担となっている。この負担軽減を目的としてラベリングを自動化する試みが行われており、音声認識技術を利用した転記テキストの自動アライメントシステムがすでにコーパス構築の補助として稼働し始めている。しかし、システムの音声認識部を構成する音響モデル・言語モデルが標準語を基に設計されていることから、現在のところは標準語を主とした音声へのシステム利用にとどまっており、標準語とは異なる特性を持ちうる方言音声に対してはシステムの有効性が不明である。そこで本稿では、方言音声に対する転記テキストの自動アライメント性能について調べた結果について報告し、方言音声コーパスの構築におけるテキスト自動アライメントシステムの実用可能性について述べる

    日本語日常会話コーパスから見える会話場面と声の高さの関係性

    Get PDF
    National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター自発音声ではパラ言語情報や感情の影響によりピッチが様々に変動することが知られているが、日常生活の多様な状況を反映した音声データの不足により、自発音声のピッチの多様性について大規模な定量的分析を行うことが困難であった。国立国語研究所では,2016年より多様な種類の日常会話をバランス良く収録した大規模な日常会話コーパスとして『日本語日常会話コーパス』(CEJC)の構築を進めている。CEJCに収録される自発音声のうち50時間のデータを基に様々な会話場面における声の高さの違いを調べたところ、子どもや配偶者、父母といった家族に対しては低く、取引先や客など丁寧さが必要な相手や友人には高い声で話していることが示された。また、発話の直接の向け先だけではなく、会話場面に同席している参与者の属性によっても声の高さが変わることが観察された

    『日本語日常会話コーパス』で観察される日常会話音声のF0の多様性

    Get PDF
    National Institute for Japanese Language and Linguistics会議名: 言語資源活用ワークショップ2021, 開催地: オンライン, 会期: 2021年9月13日-14日, 主催: 国立国語研究所 コーパス開発センターパラ言語情報や感情の影響により音声のF0が様々に変動することが知られているが、日常生活の多様な状況を網羅するような音声データはこれまで存在せず、日常話されている音声のF0がどのようなものであるか大規模な分析を行うことが困難だった。国立国語研究所で構築を進めている『日本語日常会話コーパス』は多様な種類の日常会話をバランス良く収録した大規模コーパスであり、このコーパスを活用することで日常会話音声の様々な面を観察することが可能となる。本稿では、『日本語日常会話コーパス』モニター版(2018年度版・2020年度版)とこれまで日本語自発音声の大規模コーパスとして幅広い分野で活用されてきた『日本語話し言葉コーパス』のそれぞれの音声の分析を通して、日常会話音声において観察されるF0の多様性を示す。分析の結果、『日本語日常会話コーパス』に収録されている音声は『日本語話し言葉コーパス』よりも発話の平均F0が幅広く分布していることがわかった

    日本語話し言葉コーパスのF0値再抽出に関する検討

    Get PDF
    会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター本稿では,日本語話し言葉コーパス(CSJ)の音声波形から高精度な基本周波数(F0)抽出を行なった結果について報告する。CSJに現在付与されているF0値は,波形の自己相関に基づいた手法により推定されたものである。自己相関法は音声波形の周期性を利用するため,周期性が乱れた箇所では本来のF0とはかけ離れた値を誤検出したり,非周期区間とみなされてF0の抽出が全くできないことがある。実際にCSJに付与されたF0を確認すると,明らかな抽出誤りの箇所が見受けられる。F0はCSJに付与されている韻律ラベリングの基となっているため,F0抽出精度は韻律ラベリングの精度にも関わってくる。そこで,最新の高精度なF0推定法によってF0値を求め,現在付与されている値との違いを調べるとともに,韻律ラベルへの影響について述べる
    corecore