2 research outputs found

    Emotion Recognition for Japanese Short Sentences Including Slangs

    Get PDF
    The growth of Internet communication sites such as weblogs and social networking sites brought younger people especially in teens and in their 20s to create new words and to use them very often. We prepared an emotion corpus by collecting weblog article texts including new words, analyzed the corpus statistically, and proposed a method to estimate emotions of the texts. Most slang words such as Youth Slang are too ambiguous in sense classification to be registered into the existing dictionaries such as thesaurus. To cope with these words, we created a large scale of Twitter corpus and calculated sense similarities between words. We proposed to convert unknown word to semantic class id so that we might be able to process the words that were not included in the learning data. For calculation similarities between words and converting the word into word cluster id, we used the word embedding algorithms such as word2vec, or GloVe. We defined this method as a method using Bag of Concepts as feature. As a result of the evaluation experiment using several classifiers, the proposed method was proved its robustness for unknown expressions

    PROSIDING SEMINAR TAHUNAN LINGUISTIK UNIVERSITAS PENDIDIKAN INDONESIA (SETALI 2018) TINGKAT INTERNASIONAL : Language in the Digital Era: Opportunities or Threats?

    Get PDF
    Seminar Tahunan Linguistik yang lazim disebut SETALI merupakan ajang seminar tahunan yang diselenggarakan oleh Program Studi Linguistik Sekolah Pascasarjana Universitas Pendidikan Indonesia (SPs UPI) bekerja sama dengan organisasi profesi Masyarakat Linguistik Indonesia (MLI) komisariat UPI. Pada 2018 ini, seminar kembali digelar pada 5-6 Mei bertemakan “Bahasa di Era Digital: Peluang atau Ancaman?”. Pengusungan tema kali ini beranjak dari fenomena khas terkait bahasa di era digital yang turut mengambil peran penting di dalam pengaplikasiannya. Ada sekitar 200 makalah terpilih yang dimuat untuk dibentangkan dalam Setali 2018. Makalah-makalah yang terhimpun dalam prosiding ini telah diseleksi melalui proses panjang dan pertimbangan yang cukup cermat. Bahasa dan digitalisasi adalah dua hal yang saling berkait dan tidak terpisahkan. Pemakaian bahasa di ruang digital, pada berbagai media, menimbulkan berbagai varian. Penggunaan bahasa dalam komunikasi di era digital, terkadang sesuai dengan bentuk yang baik (well-form), namun tak jarang juga tampil menyimpang (unwell-form). Banyaknya penyimpangan yang terjadi dalam konteks penggunaaan bahasa di ruang digital berpotensi menimbulkan efek negatif yang dapat mempengaruhi sikap bahasa pengguna bahasa Indonesia secara umum. Terkait dengan hal tersebut, masyarakat diharapkan cermat dalam menyikapi berbagai fenomena penggunaan bahasa yang sulit terbendung. Sekalipun ada banyak ancaman terhadap eksistensi bahasa di era ini, tidak dipungkiri juga ada banyak peluang yang dapat dipilih oleh masyarakat pengguna bahasa sebagai hal yang positif dan menguntungkan. Setakat ini, muncul berbagai polemik dalam dunia linguistik terkait masalah kebahasaan yang merebak di dunia digital. Para penggiat bahasa diharapkan banyak melakukan penelaahan terhadap praktik dan peran bahasa di era digital ini. Tema “Bahasa di Era Digital: Peluang atau Ancaman?” ini diharapkan mampu mewadahi semua elemen masyarakat untuk berpatisipasi dan ikut andil dalam menilai dan menelisik kedudukan bahasa dari sudut pandang yang beraneka ragam sehingga dapat melahirkan beraragamnya perspektif di jagat linguistik Indonesia. Akhir kata, dengan memohon petunjuk dan keridhaan Allah Swt., saya berharap agar penyelenggaraan Setali 2018 ini dapat berjalan dengan tertib dan lancar. Selain itu, saya juga berharap semoga dokumentasi akademik seperti ini dapat memberikan kontribusi nyata bagi perkembangan linguistik di Indonesia. Dalam kesempatan ini, saya merasa perlu untuk mengucapkan terima kasih kepada para pihak yang telah turut serta membantu terlaksananya Setali 2018 ini berjalan dengan baik. Selamat berseminar
    corecore