8 research outputs found

    An Automated Pipeline for Character and Relationship Extraction from Readers' Literary Book Reviews on Goodreads.com

    Full text link
    Reader reviews of literary fiction on social media, especially those in persistent, dedicated forums, create and are in turn driven by underlying narrative frameworks. In their comments about a novel, readers generally include only a subset of characters and their relationships, thus offering a limited perspective on that work. Yet in aggregate, these reviews capture an underlying narrative framework comprised of different actants (people, places, things), their roles, and interactions that we label the "consensus narrative framework". We represent this framework in the form of an actant-relationship story graph. Extracting this graph is a challenging computational problem, which we pose as a latent graphical model estimation problem. Posts and reviews are viewed as samples of sub graphs/networks of the hidden narrative framework. Inspired by the qualitative narrative theory of Greimas, we formulate a graphical generative Machine Learning (ML) model where nodes represent actants, and multi-edges and self-loops among nodes capture context-specific relationships. We develop a pipeline of interlocking automated methods to extract key actants and their relationships, and apply it to thousands of reviews and comments posted on Goodreads.com. We manually derive the ground truth narrative framework from SparkNotes, and then use word embedding tools to compare relationships in ground truth networks with our extracted networks. We find that our automated methodology generates highly accurate consensus narrative frameworks: for our four target novels, with approximately 2900 reviews per novel, we report average coverage/recall of important relationships of > 80% and an average edge detection rate of >89\%. These extracted narrative frameworks can generate insight into how people (or classes of people) read and how they recount what they have read to others

    PROSIDING SEMINAR TAHUNAN LINGUISTIK UNIVERSITAS PENDIDIKAN INDONESIA (SETALI 2018) TINGKAT INTERNASIONAL : Language in the Digital Era: Opportunities or Threats?

    Get PDF
    Seminar Tahunan Linguistik yang lazim disebut SETALI merupakan ajang seminar tahunan yang diselenggarakan oleh Program Studi Linguistik Sekolah Pascasarjana Universitas Pendidikan Indonesia (SPs UPI) bekerja sama dengan organisasi profesi Masyarakat Linguistik Indonesia (MLI) komisariat UPI. Pada 2018 ini, seminar kembali digelar pada 5-6 Mei bertemakan “Bahasa di Era Digital: Peluang atau Ancaman?”. Pengusungan tema kali ini beranjak dari fenomena khas terkait bahasa di era digital yang turut mengambil peran penting di dalam pengaplikasiannya. Ada sekitar 200 makalah terpilih yang dimuat untuk dibentangkan dalam Setali 2018. Makalah-makalah yang terhimpun dalam prosiding ini telah diseleksi melalui proses panjang dan pertimbangan yang cukup cermat. Bahasa dan digitalisasi adalah dua hal yang saling berkait dan tidak terpisahkan. Pemakaian bahasa di ruang digital, pada berbagai media, menimbulkan berbagai varian. Penggunaan bahasa dalam komunikasi di era digital, terkadang sesuai dengan bentuk yang baik (well-form), namun tak jarang juga tampil menyimpang (unwell-form). Banyaknya penyimpangan yang terjadi dalam konteks penggunaaan bahasa di ruang digital berpotensi menimbulkan efek negatif yang dapat mempengaruhi sikap bahasa pengguna bahasa Indonesia secara umum. Terkait dengan hal tersebut, masyarakat diharapkan cermat dalam menyikapi berbagai fenomena penggunaan bahasa yang sulit terbendung. Sekalipun ada banyak ancaman terhadap eksistensi bahasa di era ini, tidak dipungkiri juga ada banyak peluang yang dapat dipilih oleh masyarakat pengguna bahasa sebagai hal yang positif dan menguntungkan. Setakat ini, muncul berbagai polemik dalam dunia linguistik terkait masalah kebahasaan yang merebak di dunia digital. Para penggiat bahasa diharapkan banyak melakukan penelaahan terhadap praktik dan peran bahasa di era digital ini. Tema “Bahasa di Era Digital: Peluang atau Ancaman?” ini diharapkan mampu mewadahi semua elemen masyarakat untuk berpatisipasi dan ikut andil dalam menilai dan menelisik kedudukan bahasa dari sudut pandang yang beraneka ragam sehingga dapat melahirkan beraragamnya perspektif di jagat linguistik Indonesia. Akhir kata, dengan memohon petunjuk dan keridhaan Allah Swt., saya berharap agar penyelenggaraan Setali 2018 ini dapat berjalan dengan tertib dan lancar. Selain itu, saya juga berharap semoga dokumentasi akademik seperti ini dapat memberikan kontribusi nyata bagi perkembangan linguistik di Indonesia. Dalam kesempatan ini, saya merasa perlu untuk mengucapkan terima kasih kepada para pihak yang telah turut serta membantu terlaksananya Setali 2018 ini berjalan dengan baik. Selamat berseminar
    corecore