    Universal Dependencies for Ainu Language in Latin Alphabet, Katakana, and Cyrillic

    会議名: Evidence-based Linguistics Workshop 2023, 開催地: 国立国語研究所, 会期: 2023/09/14-15, 主催: 国立国語研究所、神戸大学人文学研究科書写言語としてのアイヌ語は、ローマ字(ラテンアルファベット)・カタカナ・キリル文字など、多彩な文字と記法によって記述されてきた。その一方、抱合語としてのアイヌ語は、日本語や欧米諸語とは全く異なる言語構造を持つことから、これらの言語向けの言語処理手法は、そのままではアイヌ語に適用できない。ならばUniversal Dependenciesは、どうだろう。言語横断的な文法構造記述として設計されたUniversal Dependenciesは、書写言語としてのアイヌ語を、どの程度ちゃんと記述できるのだろう。『アイヌ神謠集』、『アイヌ語會話字典』、アイヌ語訳『五倫名義解』、『Аинско-русский словарь』をUniversal Dependenciesコーパスとして記述していく中で、われわれは、われわれの見積りが甘かったことを痛感すると同時に、それでも、アイヌ語Universal Dependenciesが、アイヌ語の言語処理に寄与することを確信した。本発表では、その一端について述べる。application/pdf京都大学京都大学, 京都外国語大学Kyoto UniversityKyoto University, Kyoto University of Foreign Studiesconference pape


    書写言語としてのアイヌ語は, ローマ字(ラテンアルファベット)・カタカナ・キリル文字など, 多彩な文字と記法によって記述されてきた. その一方, 抱合語としてのアイヌ語は, 日本語や欧米諸語とは全く異なる言語構造を持つことから, これらの言語向けのRoBERTa・DeBERTaモデルは, そのままではアイヌ語に適用できない. 本発表では, ローマ字・カタカナ・キリル文字で書かれたアイヌ語に対し, RoBERTa・DeBERTaモデルを開発する手法を示し, さらに形態素解析・係り受け解析への応用について考察する

    Building a Mbyá Treebank

    This presentation relates the ongoing construction of a multilayer corpus of Mbyá (Tupi Guarani: Argentina, Brazil, Paraguay). It will discuss (i) corpus composition (ii) ethical, linguistic and technological issues in corpus design and annotation, and (iii) usefulness for leveraging legacy texts in documenting language variation and recent evolution. (session 1.1.6

    Universal Dependenciesによるアイヌ語テキストコーパス

    書写言語としてのアイヌ語は,カタカナ・キリル文字・ローマ字 (ラテンアルファベット) など,多彩な文字と記法によって記述されてきた.その一方,抱合語としてのアイヌ語は,日本語や欧米諸語とは全く異なる文法構造を持ち,これらの言語向けの文法記述手法は,アイヌ語に太刀打ちできない.ならばUniversal Dependenciesは,どうだろう.言語横断的な文法構造記述として設計された Universal Dependencies は,書写言語としてのアイヌ語を,どの程度ちゃんと記述できるのだろう.本発表では,カタカナ・キリル文字・ローマ字で書かれたアイヌ語を,Universal Dependencies で記述する際の困難さについて,考察する

    アイヌ語Universal Dependencies再考

    [東洋学へのコンピュータ利用 第34回研究セミナー] とき: 2021年7月30日(金)13:00~16:45, ところ: 京都大学人文科学研究所本館1Fガラス張りセミナー室, 主催: 京都大学人文科学研究所附属東アジア人文情報学研究センタ

    The Ainu, Meiji Era Politics, and Its Lasting Impacts: A Historical Analysis of Racialization, Colonization, and the Creation of State and Identity in Relation to Ainu-Japanese History

    On March 2nd, 1899, the Meiji government of Japan passed the Hokkaido Former Natives Protection Act. At its core, the act stripped the Ainu of their indigenous identity, labeling the group as ‘former aborigines’ and forcing every member into Japanese citizenship. In an instant, the Ainu became erased in an official capacity from the consciousness of the state and its people, a condition that would last well over 109 years when in 2008 the Japanese state finally acknowledged the Ainu as an indigenous group. What is often not acknowledged is that the implementation and subsequent enforcement of the Protection Act didn’t emerge out of thin air and exist without creating profoundly impactful consequences. There was historical precedent to justify its enactment spanning well over a hundred years prior, these same justifications also finding use today. Through processes of racialization, colonization, and the desire to solidify the Self and Nation, the Ainu became the focal point not just within Hokkaido politics but also the wider Japanese state attempting to create and define what it means to be Japanese and who can possess this label. To fully understand the lasting consequences of policies like the Protection Act, one must examine the wider historical narrative that created and justified their enactment. It is important to also examine where the Ainu are now as a people and what impact this history has had on a community largely ignored both domestically and internationally

    Universal DependenciesとBERT/RoBERTa/DeBERTaモデルによる多言語情報処理(2023年7月版)

