237 research outputs found

    PEMBENTUKAN DAN MAKNA KONTEKSTUAL DAJARE PADA SERIAL KARTUN DORAEMON EPISODE 452 (ダジャレでやっつけろ!)

    Get PDF
    Dajare merupakan salah satu permainan kata dalam bahasa Jepang. Permainan kata ini banyak digunakan di dalam keseharian masyarakat Jepang sebagai humor dan media periklanan. Untuk lebih mengetahui dan memahami apa itu dajare, maka dapat dilakukan dengan cara menganalisis pembentukan serta makna kontekstual dari dajare dalam penggunaannya di kehidupan sehari-hari. Salah satu media yang dapat digunakan untuk menganalisis dajare yakni serial kartun Jepang yang di dalamnya terdapat pemakaian dajare. Penelitian ini penting untuk dilakukan, terutama bagi para pemelajar Bahasa Jepang agar dapat memahami dan bisa menggunakan dajare, dengan tujuan untuk lebih mengakrabkan diri dengan orang Jepang, atau juga untuk kepentingan lainnya. Berdasarkan latar belakang tersebut, penelitian ini bertujuan untuk mendeskripsikan mengenai pembentukan dajare pada serial kartun Doraemon episode 452 (ダジャレでやっつけろ!), dan makna kontekstual dari dajare itu. Untuk menjawab kedua rumusan masalah tersebut, peneliti menggunakan teori pembentukan dajare oleh Dybala, dkk., dan teori pembentukan kata oleh Tsujimura, serta teori makna kontekstual oleh Chaer. Penelitian ini menggunakan metode deskriptif kualitatif untuk mendeskripsikan hasil analisis penelitian secara terperinci. Adapun sumber data penelitian yang digunakan yaitu serial kartun Doraemon episode 452. Data berupa pembentukan dajare serta makna kontekstual yang terdapat di dalamnya. Pada penelitian ini ditemukan data sebanyak 33 data. Kemudian diperoleh hasil penelitian sebagai berikut: (1) Pembentukan dajare yang ditemukan yakni mencakup 7 klasifikasi yang terbagi ke dalam pembentukan secara homophony, mora addition (initial, final, dan internal), mora omission (initial), mora transformation (vowel), kanji readings change, mix of languages, dan pause transference. Secara morfologi, pun phrase pada data yang ditemukan tersebut termasuk pada jenis free morphemes dan inflectional morphemes, dan ada juga yang mengalami pembentukan kata secara affixation, compounding, reduplication, clipping, dan borrowing; (2) Makna kontekstual yang terdapat dalam dajare tersebut yakni berupa (1) kata benda, seperti: roti, badak, dan unta; (2) kata kerja, seperti: berbaring, terbang, dan marah; (3) kata keterangan, seperti: kata keterangan jatuh, benda yang mencair, dan suara tawa; dan (4) ungkapan, seperti: ungkapan terimakasih dan ungkapan dari rasa terkejut. Dengan mengetahui pentingnya penelitian ini, implikasi yang diharapkan yakni untuk dapat memasukkan materi mengenai dajare pada pembelajaran Bahasa Jepang, misal dalam bidang Sosiolinguistik. Dengan begitu, para pemelajar menjadi lebih memahami dan dapat menggunakan dajare dengan baik dan benar dalam keseharian berkomunikasinya.                 Kata Kunci: dajare, pembentukan, makna kontekstual   要旨 駄洒落というのは日本語の言葉遊びの一つである。日本ではユーモアや広告メディアにこの言語遊びが多く使われている。駄洒落を知るために駄洒落の利用法を分析した。一つの使用するメディアは日本のアニメである。 本研究の目的は452挿話のドラえもん「ダジャレでやつけろ!」というシリーズアニメにおける駄洒落の形と文脈的意味を知ることである。駄洒落の形を分類するためDybala,dkk. (2012), そしてTsujimura (2004) の理論を利用して分析する。文脈的意味を分析するためにChaer (2007) の理論を使う。この研究は定性分析という方法を用いた研究である。研究対象としてDoraemon のシリーズアニメから452話を利用する。研究対象のデータは駄洒落と文脈的意味からである。本研究では33 データが見られた。                 分析した結果は以下のようになった。(1) 駄洒落の形成には7分類がある。それは同音擬音語、音節混入、音節還元、音節変化、漢字読み方変化、言語合成、合間転移が見られた。  そして、形態素の形は自由形と結合系があって、この言語形成には接辞、合成、重複、切り落とし、借入 がある; (2) 発見した駄洒落の文脈的意味は多くがある。発見した駄洒落の文脈的意味は多くがある。それは名詞:パン、さい、らくだ;動詞:寝転ぶ、吹っ飛んだ、怒る、副詞:ズボーン、ドーロドロ、ゲタゲタ;感動詞: 感謝とどきりによる表現である。  キーワード:駄洒落、形、文脈的意

    MEGAVERSE: Benchmarking Large Language Models Across Languages, Modalities, Models and Tasks

    Full text link
    Recently, there has been a rapid advancement in research on Large Language Models (LLMs), resulting in significant progress in several Natural Language Processing (NLP) tasks. Consequently, there has been a surge in LLM evaluation research to comprehend the models' capabilities and limitations. However, much of this research has been confined to the English language, leaving LLM building and evaluation for non-English languages relatively unexplored. There has been an introduction of several new LLMs, necessitating their evaluation on non-English languages. This study aims to expand our MEGA benchmarking suite by including six new datasets to form the MEGAVERSE benchmark. The benchmark comprises 22 datasets covering 81 languages, including low-resource African languages. We evaluate several state-of-the-art LLMs like GPT-3.5-Turbo, GPT4, PaLM2, and Llama2 on the MEGAVERSE datasets. Additionally, we include two multimodal datasets in the benchmark and assess the performance of the LLaVa-v1.5 model. Our experiments suggest that GPT4 and PaLM2 outperform the Llama models on various tasks, notably on low-resource languages, with GPT4 outperforming PaLM2 on more datasets than vice versa. However, issues such as data contamination must be addressed to obtain an accurate assessment of LLM performance on non-English languages.Comment: 23 pages, 30 figures and 1 tabl

    PEMBENTUKAN DAN MAKNA KONTEKSTUAL DAJARE PADA SERIAL KARTUN DORAEMON EPISODE 452 (ダジャレでやっつけろ!)

    Get PDF
    Dajare merupakan salah satu permainan kata dalam bahasa Jepang. Permainan kata ini banyak digunakan di dalam keseharian masyarakat Jepang sebagai humor dan media periklanan. Untuk lebih mengetahui dan memahami apa itu dajare, maka dapat dilakukan dengan cara menganalisis pembentukan serta makna kontekstual dari dajare dalam penggunaannya di kehidupan sehari-hari. Salah satu media yang dapat digunakan untuk menganalisis dajare yakni serial kartun Jepang yang di dalamnya terdapat pemakaian dajare. Penelitian ini penting untuk dilakukan, terutama bagi para pemelajar Bahasa Jepang agar dapat memahami dan bisa menggunakan dajare, dengan tujuan untuk lebih mengakrabkan diri dengan orang Jepang, atau juga untuk kepentingan lainnya. Berdasarkan latar belakang tersebut, penelitian ini bertujuan untuk mendeskripsikan mengenai pembentukan dajare pada serial kartun Doraemon episode 452 (ダジャレでやっつけろ!), dan makna kontekstual dari dajare itu. Untuk menjawab kedua rumusan masalah tersebut, peneliti menggunakan teori pembentukan dajare oleh Dybala, dkk., dan teori pembentukan kata oleh Tsujimura, serta teori makna kontekstual oleh Chaer. Penelitian ini menggunakan metode deskriptif kualitatif untuk mendeskripsikan hasil analisis penelitian secara terperinci. Adapun sumber data penelitian yang digunakan yaitu serial kartun Doraemon episode 452. Data berupa pembentukan dajare serta makna kontekstual yang terdapat di dalamnya. Pada penelitian ini ditemukan data sebanyak 33 data. Kemudian diperoleh hasil penelitian sebagai berikut: (1) Pembentukan dajare yang ditemukan yakni mencakup 7 klasifikasi yang terbagi ke dalam pembentukan secara homophony, mora addition (initial, final, dan internal), mora omission (initial), mora transformation (vowel), kanji readings change, mix of languages, dan pause transference. Secara morfologi, pun phrase pada data yang ditemukan tersebut termasuk pada jenis free morphemes dan inflectional morphemes, dan ada juga yang mengalami pembentukan kata secara affixation, compounding, reduplication, clipping, dan borrowing; (2) Makna kontekstual yang terdapat dalam dajare tersebut yakni berupa (1) kata benda, seperti: roti, badak, dan unta; (2) kata kerja, seperti: berbaring, terbang, dan marah; (3) kata keterangan, seperti: kata keterangan jatuh, benda yang mencair, dan suara tawa; dan (4) ungkapan, seperti: ungkapan terimakasih dan ungkapan dari rasa terkejut. Dengan mengetahui pentingnya penelitian ini, implikasi yang diharapkan yakni untuk dapat memasukkan materi mengenai dajare pada pembelajaran Bahasa Jepang, misal dalam bidang Sosiolinguistik. Dengan begitu, para pemelajar menjadi lebih memahami dan dapat menggunakan dajare dengan baik dan benar dalam keseharian berkomunikasinya.                 Kata Kunci: dajare, pembentukan, makna kontekstual   要旨 駄洒落というのは日本語の言葉遊びの一つである。日本ではユーモアや広告メディアにこの言語遊びが多く使われている。駄洒落を知るために駄洒落の利用法を分析した。一つの使用するメディアは日本のアニメである。 本研究の目的は452挿話のドラえもん「ダジャレでやつけろ!」というシリーズアニメにおける駄洒落の形と文脈的意味を知ることである。駄洒落の形を分類するためDybala,dkk. (2012), そしてTsujimura (2004) の理論を利用して分析する。文脈的意味を分析するためにChaer (2007) の理論を使う。この研究は定性分析という方法を用いた研究である。研究対象としてDoraemon のシリーズアニメから452話を利用する。研究対象のデータは駄洒落と文脈的意味からである。本研究では33 データが見られた。                 分析した結果は以下のようになった。(1) 駄洒落の形成には7分類がある。それは同音擬音語、音節混入、音節還元、音節変化、漢字読み方変化、言語合成、合間転移が見られた。  そして、形態素の形は自由形と結合系があって、この言語形成には接辞、合成、重複、切り落とし、借入 がある; (2) 発見した駄洒落の文脈的意味は多くがある。発見した駄洒落の文脈的意味は多くがある。それは名詞:パン、さい、らくだ;動詞:寝転ぶ、吹っ飛んだ、怒る、副詞:ズボーン、ドーロドロ、ゲタゲタ;感動詞: 感謝とどきりによる表現である。  キーワード:駄洒落、形、文脈的意

    PEMBENTUKAN DAN MAKNA DAJARE PADA KOMIK “SHARE NI NARANAI SAN (シャレにナラナイさん) VOL. 1-10” KARYA KAZUYOSHI ITO

    Get PDF
    AbstractWordplay is a pun form. Pun is the use of two words or more which has same or nearlysame sound but different meaning, which in Japan is called dajare. Dajare is used to producehumor effect on manga. Manga “シャレにナラナイさん” is an example of the use of variousforms of dajare. This research use qualitative descriptive approach to describe dajare formation,word formation, and contextual meaning from manga “シャレにナラナイさん” volume 1-10.Based on the results, there is 67 data dajare obtained in the form of 19 homophony data, 8 moraaddition data, 5 mora omission data, 24 mora transformation data, 8 kanji reading change data, 2blend data, 2 division data, 2 riddles data, and 2 mix of language data. The word formation thatobtained is in the form of affixation, compounding, clipping, and borrowing. Based on the data,contextual meaning of dajare is referring to: 1) expression, such as: admiration, wishes, respect,greeting, feeling, despair; 2) explanation; 3) information; 4) sentence, such as: imperativesentence, invitation, interrogative sentence, supposition; 5) parody from: movie title, person’sname, a word; 6) writing errors in typing; 7) action; 8) prohibition.Keywords: dajare, formation, contextual meaning, manga.要旨言葉遊びは pun の形である。Pun とは、同じまたはほぼ同じ音で意味が異なる二つ以上の単語を使用することで、日本ではダジャレと言う。ダジャレは漫画に面白さの効果を生み出すために使用する。漫画「シャレにナラナイさん」は様々なダジャレの形の使用例である。この研究は定性的な記述的アプローチを使用して、漫画「シャレにナラナイさん」第 1 本目から第 10 本目まで、ダジャレの形成、語形成、文脈的な意味を説明する。結果に基づいて、19 つの「同音」データ、8 つの「拍増加」データ、5 つの「拍減少」データ、24 つの「拍変化」データ、8 つの「漢字読み替え」データ、2 つの「混ぜ合わせ」データ、2 つの「分割」データ、2 つの「謎々」データ、2 つの「言語の混合」データの形で得られた 67 データのダジャレがある。得られた語形成の形は派生語、複合語、省略、借りる。データに基づいて、ダジャレの文脈的な意味は:1)表現:感心、希望、尊敬、挨拶、気分、絶望;2)説明;3)情報;4)文:命令文、招待、疑問文、想定;5)パロディ:映画のタイトル、人名、言葉;6)入力の書き込みエラー;7)動作;8)禁止を指す。必要語: ダジャレ、形成、文脈的な意味、漫

    PEMBENTUKAN DAN MAKNA KONTEKSTUAL DAJARE DALAM OYAJI GYAGU KARUTA (おやじギャグかるた)OLEH DAISO PUBLISHING CO.LTD

    Get PDF
    ABSTRACTDajare is one of word game in Japanese. Dajare is not only used in conversation but also used in various things,such as karuta game. Using this karuta can make it easier for Japanese language learners to understand dajare and learnnew vocabulary from it.This research aims to describe the formation of dajare and its contextual meaning in oyaji gyagu karuta. Toanswer this, the research uses theory of dajare formation by Daybala et al, word formation by Dedi Sutedi and NatsukoTsujimura, and theory of contextual meaning by Abdul Chaer.Then the following results obtained in this study are found 9 types of dajare namely homophony, riddle, moraomission (internal mora omission and final mora omission), mora addition (internal mora addition, initial mora additionand final mora addition), kanji reading changes, blend, mora transformation, pause transference and mix of language.From these data, mora addition is the most found type with 11 data for initial mora addition, 5 data for internal moraaddition and 11 data for final mora addition. Then in terms of morphology, the punning phrase data found free morphemesand bound morphems (derivational morphemes and inflectional morphemes), and there was also word formation by meansof haseigo, fukugougo, compound (sino-japanese compound), affixation, borrowing, clipping and reduplication.Furthermore, the data found have various contextual meaning, namely in the form of nouns such as surippa (slipper), verbsuch as nesobettoru (to lie down), adverb such as chokotto (a little, a bit), and expression such as yaanee (don’t want to).Keyword : dajare, word formation, contextual meaning.要旨ダジャレは日本語の単語遊びの 1 つである。ダジャレは会話だけでなく、色々な場面にも使われる例えばカルタゲームである。このカルタを使うと、日本語学習者が駄洒落を理解し、そこから新しい語彙を学ぶのができる。 この研究は、ダジャレの形成とその文脈上の意味をおやじギャグかるたで説明することを目的としている。これに答えるために、この研究では、Daybala et al によるダジャレ形成の理論、DediSutedi と Natsuko Tsujimura による語形成、および Abdul Chaer による文脈的意味の理論を使用している。データを分析した結果、同音異義語、なぞなぞ、音節混入、音節還元、漢字の読み方変化、ブレンド、 音節変化、合間転移、言語合成 および混合の 9 種類のダジャレが得られた。これらのデータから、音節混入は最も見つかったタイプである。次に、形態素に関して、自由形態素と結合形態素を発見し、また、派生語、複合語、compound (sino-japanese compound), affixation, borrowing, clipping and reduplication。さらに、見つかったデータにはさまざまな文脈上の意味が多くある。例えば、名詞ではスリッパ、動詞 ではねそべっとる、副詞ではちょこっと、そして感動詞やあねえ(いやね)。キーワード: ダジャレ、語形成、文脈上の意

    A Comprehensive Survey of Natural Language Generation Advances from the Perspective of Digital Deception

    Get PDF
    In recent years there has been substantial growth in the capabilities of systems designed to generate text that mimics the fluency and coherence of human language. From this, there has been considerable research aimed at examining the potential uses of these natural language generators (NLG) towards a wide number of tasks. The increasing capabilities of powerful text generators to mimic human writing convincingly raises the potential for deception and other forms of dangerous misuse. As these systems improve, and it becomes ever harder to distinguish between human-written and machine-generated text, malicious actors could leverage these powerful NLG systems to a wide variety of ends, including the creation of fake news and misinformation, the generation of fake online product reviews, or via chatbots as means of convincing users to divulge private information. In this paper, we provide an overview of the NLG field via the identification and examination of 119 survey-like papers focused on NLG research. From these identified papers, we outline a proposed high-level taxonomy of the central concepts that constitute NLG, including the methods used to develop generalised NLG systems, the means by which these systems are evaluated, and the popular NLG tasks and subtasks that exist. In turn, we provide an overview and discussion of each of these items with respect to current research and offer an examination of the potential roles of NLG in deception and detection systems to counteract these threats. Moreover, we discuss the broader challenges of NLG, including the risks of bias that are often exhibited by existing text generation systems. This work offers a broad overview of the field of NLG with respect to its potential for misuse, aiming to provide a high-level understanding of this rapidly developing area of research

    An Overview on Language Models: Recent Developments and Outlook

    Full text link
    Language modeling studies the probability distributions over strings of texts. It is one of the most fundamental tasks in natural language processing (NLP). It has been widely used in text generation, speech recognition, machine translation, etc. Conventional language models (CLMs) aim to predict the probability of linguistic sequences in a causal manner. In contrast, pre-trained language models (PLMs) cover broader concepts and can be used in both causal sequential modeling and fine-tuning for downstream applications. PLMs have their own training paradigms (usually self-supervised) and serve as foundation models in modern NLP systems. This overview paper provides an introduction to both CLMs and PLMs from five aspects, i.e., linguistic units, structures, training methods, evaluation methods, and applications. Furthermore, we discuss the relationship between CLMs and PLMs and shed light on the future directions of language modeling in the pre-trained era

    Possible Usage of Sentiment Analysis for Calculating Vectors of Felific Calculus

    Get PDF
    Abstract-In this paper we introduce an algorithm for affective reasoning based on Bentham's Felific Calculus known also as the hedonic calculus. Knowledge recquired for the task is retrived from a blog corpus by means of sentiment analysis on sentences containing an action or state input. This approach allows a machine to gather information on how usually other people feel when something happens, why people did it and what could happen after the act. Such knowledge is important for understanding actions of others, and for acquiring emphatic skills by a machine. In addition to emotion categorization of Nakamura, we introduce two lexicons based on McDougall's instinct classification and Kohlbergian stages of moral development, then show some basic efficiency of the retrieved knowledge

    Towards standardizing Korean Grammatical Error Correction: Datasets and Annotation

    Full text link
    Research on Korean grammatical error correction (GEC) is limited compared to other major languages such as English and Chinese. We attribute this problematic circumstance to the lack of a carefully designed evaluation benchmark for Korean. Thus, in this work, we first collect three datasets from different sources (Kor-Lang8, Kor-Native, and Kor-Learner) to cover a wide range of error types and annotate them using our newly proposed tool called Korean Automatic Grammatical error Annotation System (KAGAS). KAGAS is a carefully designed edit alignment & classification tool that considers the nature of Korean on generating an alignment between a source sentence and a target sentence, and identifies error types on each aligned edit. We also present baseline models fine-tuned over our datasets. We show that the model trained with our datasets significantly outperforms the public statistical GEC system (Hanspell) on a wider range of error types, demonstrating the diversity and usefulness of the datasets.Comment: Add affiliation and email addres
    corecore