10 research outputs found

    Corpus of Japanese Telephone Conversation at Hiroshima University : Design and Current Status

    Get PDF
    国立国語研究所 研究系 言語変異研究領域Language Variation Division, Research Department, NINJAL『広島大学日本語電話会話コーパス』(COTCO-H)は現在開発中の大規模音声データベースである。COTCO-Hは,広島大学の日本語非標準変種の母語話者である50名の学生が2つのレジスター(出身地の友人との会話,キャンパスの友人との会話)で発話した電話会話を格納している。本コーパスには,約11万語(22時間)の音声信号に加えて,その転記および品詞や活用などの形態論情報が付与されている。分節音情報付与作業は現在進行中である。COTCO-Hにはさらに補助データとして同じ話者による読み上げ音声も含まれている。COTCO-Hは,地域や発話スタイル,自発性などの違いによる言語変異に興味を持つ研究者のコミュニティに貢献するものとなるだろう。The Corpus of Japanese Telephone Conversation at Hiroshima University (COTCO-H) is a large-scale speech database that is currently under development. COTCO-H contains spontaneous telephone conversations in two different registers (conversations with a local friend and with a campus friend) produced by 50 Hiroshima University students who are native speakers of nonstandard varieties of Japanese. The corpus consists of speech signals and transcriptions for approximately 110,000 words (22 hours), along with morphological annotations such as parts of speech and conjugations. Segmental labeling is currently in progress. COTCO-H also contains different types of read speech produced by the same speakers as auxiliary data. The corpus will contribute to a community of researchers interested in variations across different regions, speech styles, and spontaneity