Search CORE

22 research outputs found

Parsing and beyond : Tools and resources for Estonian

Author: Muischnek Kadri
Müürisep Kaili
Puolakainen Tiina
Publication venue: 'Akademiai Kiado Zrt.'
Publication date: 01/01/2017
Field of study

This article gives an overview of the state of art of tools and resources for syntactic analysis of Estonian. A morphosyntactic disambiguator, surface-syntactic analyzer and dependency parser are all based on the Constraint Grammar formalism. As for language resources, a 400,000-word manually annotated dependency treebank has been created, its annotation scheme is compatible with the output of the Constraint Grammar dependency parser. Part of the treebank has been converted to the Universal Dependencies annotation scheme. Our tools have also been tested by large-scale corpus annotation

Crossref

Repository of the Academy's Library

Relatório de estágio em farmácia comunitária

Author: Abrams Mitchell
Ackermann Elia
Aepli Noëmi
Aghaei Hamid
Agić Željko
Ahmadi Amir
Ahrenberg Lars
Ajede Chika Kennedy
Aleksandravičiūtė Gabrielė
Alfina Ika
Antonsen Lene
Aplonova Katya
Aquino Angelina
Aragon Carolina
Aranzabe Maria Jesus
Arnardóttir Þórunn
Arutie Gashaw
Arwidarasti Jessica Naraiswari
Asahara Masayuki
Ateyah Luma
Atmaca Furkan
Attia Mohammed
Atutxa Aitziber
Augustinus Liesbeth
Badmaeva Elena
Balasubramani Keerthana
Ballesteros Miguel
Banerjee Esha
Bank Sebastian
Barbu Mititelu Verginica
Basmov Victoria
Batchelor Colin
Bauer John
Bedir Seyyit Talha
Bengoetxea Kepa
Berk Gözde
Berzak Yevgeni
Bhat Irshad Ahmad
Bhat Riyaz Ahmad
Biagetti Erica
Bick Eckhard
Bielinskienė Agnė
Bjarnadóttir Kristín
Blokland Rogier
Bobicev Victoria
Boizou Loïc
Borges Völker Emanuel
Bosco Cristina
Bouma Gosse
Bowman Sam
Boyd Adriane
Brokaitė Kristina
Burchardt Aljoscha
Börstell Carl
Candito Marie
Caron Bernard
Caron Gauthier
Cavalcanti Tatiana
Cebiroğlu Eryiğit Gülşen
Cecchini Flavio Massimiliano
Celano Giuseppe G. A.
Cetin Savas
Chalub Fabricio
Chi Ethan
Cho Yongseok
Choi Jinho
Chun Jayeol
Cignarella Alessandra T.
Cinková Silvie
Collomb Aurélie
Connor Miriam
Courtin Marine
Davidson Elizabeth
de Marneffe Marie-Catherine
de Paiva Valeria
de Souza Elvis
Derin Mehmet Oguz
Diaz de Ilarraza Arantza
Dickerson Carly
Dinakaramani Arawinda
Dione Bamba
Dirix Peter
Dobrovoljc Kaja
Dozat Timothy
Droganova Kira
Dwivedi Puneet
Eckhoff Hanne
Eli Marhaba
Elkahky Ali
Ephrem Binyam
Erina Olga
Erjavec Tomaž
Etienne Aline
Evelyn Wograine
Facundes Sidney
Farkas Richárd
Fernanda Marília
Fernandez Alcalde Hector
Foster Jennifer
Freitas Cláudia
Fujita Kazunori
Gajdošová Katarína
Galbraith Daniel
Garcia Marcos
Garza Sebastian
Gerardi Fabrício Ferraz
Gerdes Kim
Ginter Filip
Goenaga Iakes
Gojenola Koldo
Goldberg Yoav
González Saavedra Berta
Griciūtė Bernadeta
Grioni Matias
Grobol Loïc
Grūzītis Normunds
Guillaume Bruno
Guillot-Barbance Céline
Gärdenfors Moa
Gómez Guinovart Xavier
Gökırmak Memduh
Güngör Tunga
Habash Nizar
Hafsteinsson Hinrik
Hajič jr. Jan
Hajič Jan
Han Na-Rae
Hanifmuti Muhammad Yudistira
Hardwick Sam
Harris Kim
Haug Dag
Heinecke Johannes
Hellwig Oliver
Hennig Felix
Hladká Barbora
Hlaváčová Jaroslava
Hociung Florinel
Hohle Petter
Huber Eva
Hwang Jena
Hà Mỹ Linh
Hämäläinen Mika
Ikeda Takumi
Ingason Anton Karl
Ion Radu
Irimia Elena
Ishola Ọlájídé
Jelínek Tomáš
Johannsen Anders
Juutinen Markus
Jónsdóttir Hildur
Jørgensen Fredrik
K Sarveswaran
Kaasen Andre
Kabaeva Nadezhda
Kahane Sylvain
Kanayama Hiroshi
Kanerva Jenna
Katz Boris
Kayadelen Tolga
Kaşıkara Hüner
Kenney Jessica
Kettnerová Václava
Kirchner Jesse
Klementieva Elena
Kopacewicz Kamil
Korkiakangas Timo
Kotsyba Natalia
Kovalevskaitė Jolanta
Krek Simon
Krishnamurthy Parameswari
Kwak Sookyoung
Köhn Arne
Köksal Abdullatif
Laippala Veronika
Lam Lucia
Lambertino Lorenzo
Lando Tatiana
Larasati Septina Dian
Lavrentiev Alexei
Lee John
Lenci Alessandro
Lertpradit Saran
Leung Herman
Levina Maria
Li Cheuk Ying
Li Josie
Li Keying
Li Yuan
Lim KyungTae
Lindén Krister
Ljubešić Nikola
Loginova Olga
Luthfi Andry
Luukko Mikko
Lyashevskaya Olga
Lynn Teresa
Lê Hồng Phương
Macketanz Vivien
Makazhanov Aibek
Mandl Michael
Manning Christopher
Manurung Ruli
Mareček David
Marheinecke Katrin
Martins André
Martínez Alonso Héctor
Matsuda Hiroshi
Matsumoto Yuji
Mašek Jan
McDonald Ryan
McGuinness Sarah
Mendonça Gustavo
Miekka Niko
Mischenkova Karina
Misirpashayeva Margarita
Missilä Anna
Mititelu Cătălin
Mitrofan Maria
Miyao Yusuke
Mojiri Foroushani AmirHossein
Moloodi Amirsaeid
Montemagni Simonetta
More Amir
Moreno Romero Laura
Mori Keiko Sophie
Mori Shinsuke
Morioka Tomohiko
Moro Shigeki
Mortensen Bjartur
Moskalevskyi Bohdan
Muischnek Kadri
Munro Robert
Murawaki Yugo
Müürisep Kaili
Mărănduc Cătălina
Nainwani Pinkey
Nakhlé Mariam
Navarro Horñiacek Juan Ignacio
Nedoluzhko Anna
Nešpore-Bērzkalne Gunta
Nguyễn Thị Minh Huyền
Nguyễn Thị Lương
Nikaido Yoshihiro
Nikolaev Vitaly
Nitisaroj Rattima
Nivre Joakim
Nourian Alireza
Nurmi Hanna
Ojala Stina
Ojha Atul Kr.
Olúòkun Adédayọ̀
Omura Mai
Onwuegbuzia Emeka
Osenova Petya
Partanen Niko
Pascual Elena
Passarotti Marco
Patejuk Agnieszka
Paulino-Passos Guilherme
Peljak-Łapińska Angelika
Peng Siyao
Perez Cenel-Augusto
Perkova Natalia
Perrier Guy
Petrov Slav
Petrova Daria
Phelan Jason
Piitulainen Jussi
Pirinen Tommi A
Pitler Emily
Plank Barbara
Poibeau Thierry
Ponomareva Larisa
Popel Martin
Pretkalniņa Lauma
Prokopidis Prokopis
Przepiórkowski Adam
Prévost Sophie
Puolakainen Tiina
Pyysalo Sampo
Qi Peng
Rademaker Alexandre
Rama Taraka
Ramasamy Loganathan
Ramisch Carlos
Rashel Fam
Rasooli Mohammad Sadegh
Ravishankar Vinit
Real Livy
Rebeja Petru
Reddy Siva
Rehm Georg
Riabov Ivan
Rießler Michael
Rimkutė Erika
Rinaldi Larissa
Rituma Laura
Rocha Luisa
Romanenko Mykhailo
Rosa Rudolf
Rovati Davide
Roșca Valentin
Rudina Olga
Rueter Jack
Rääbis Andriela
Rögnvaldsson Eiríkur
Rúnarsson Kristján
Sadde Shoval
Safari Pegah
Sagot Benoît
Sahala Aleksi
Saleh Shadi
Salomoni Alessio
Samardžić Tanja
Samson Stephanie
Sanguinetti Manuela
Saulīte Baiba
Sawanakunanon Yanin
Scannell Kevin
Scarlata Salvatore
Schneider Nathan
Schuster Sebastian
Seddah Djamé
Seeker Wolfgang
Seraji Mojgan
Shen Mo
Shimada Atsuko
Shirasu Hiroyuki
Shohibussirri Muh
Sichinava Dmitry
Sigurðsson Einar Freyr
Silveira Aline
Silveira Natalia
Simi Maria
Simionescu Radu
Simkó Katalin
Simov Kiril
Skachedubova Maria
Smith Aaron
Soares-Bastos Isabela
Spadine Carolyn
Steingrímsson Steinþór
Stella Antonio
Straka Milan
Strickland Emmett
Strnadová Jana
Suhr Alane
Sulestio Yogi Lesmana
Sulubacak Umut
Suzuki Shingo
Szántó Zsolt
Särg Dage
Taji Dima
Takahashi Yuta
Tamburini Fabio
Tan Mary Ann C.
Tanaka Takaaki
Tella Samson
Tellier Isabelle
Thomas Guillaume
Torga Liisi
Toska Marsida
Trosterud Trond
Trukhina Anna
Tsarfaty Reut
Tyers Francis
Türk Utku
Uematsu Sumire
Untilov Roman
Urešová Zdeňka
Uria Larraitz
Uszkoreit Hans
Utka Andrius
Vajjala Sowmya
van Niekerk Daniel
van Noord Gertjan
Varga Viktor
Villemonte de la Clergerie Eric
Vincze Veronika
Wakasa Aya
Wallenberg Joel C.
Wallin Lars
Walsh Abigail
Wang Jing Xian
Washington Jonathan North
Wendt Maximilan
Widmer Paul
Williams Seyi
Wirén Mats
Wittern Christian
Woldemariam Tsegay
Wong Tak-sum
Wróblewska Alina
Yako Mary
Yamashita Kayo
Yamazaki Naoki
Yan Chunxiao
Yasuoka Koichi
Yavrumyan Marat M.
Yu Zhuoran
Zahra Shorouq
Zeldes Amir
Zeman Daniel
Zhu Hanzhi
Zhuravleva Anna
Çetinoğlu Özlem
Çöltekin Çağrı
Östling Robert
Özateş Şaziye Betül
Özgür Arzucan
Öztürk Başaran Balkız
Øvrelid Lilja
Čéplö Slavomír
Šimková Mária
Žabokrtský Zdeněk
Publication venue
Publication date: 01/09/2016
Field of study

Relatório de estágio realizado no âmbito do Mestrado Integrado em Ciências Farmacêuticas, apresentado à Faculdade de Farmácia da Universidade de Coimbr

LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University

Estonian Dependency Treebank and its annotation scheme

Author: Dage Särg
Eleri Aedmaa
Kirt Riin
Muischnek Kadri
Müürisep Kaili
Puolakainen Tiina
Publication venue: University of Tübingen
Publication date: 03/12/2014
Field of study

<p>In this article, we present Estonian Dependency Treebank, an ongoing corpus annotation project. The size of the treebank, once finished, will be ca 400,000 words. The treebank annotation consists of three layers: morphology, syntactic functions and dependency relations. For each layer, an overview of the labels and the annotation scheme is given.</p><p>As for the actual treebank creation, each text is annotated by two independent annotators, plus a super-annotator, whose task is to solve the discrepancies. The article also gives a short overview of the most frequent sources of dissensions between the annotators.</p&gt

ZENODO

Universal Dependencies 2.0

Author: Agić Željko
Ahrenberg Lars
Aranzabe Maria Jesus
Asahara Masayuki
Atutxa Aitziber
Ballesteros Miguel
Bauer John
Bengoetxea Kepa
Bhat Riyaz Ahmad
Bick Eckhard
Bosco Cristina
Bouma Gosse
Bowman Sam
Candito Marie
Cebiroğlu Eryiğit Gülşen
Celano Giuseppe G. A.
Chalub Fabricio
Choi Jinho
Connor Miriam
Davidson Elizabeth
de Marneffe Marie-Catherine
de Paiva Valeria
Diaz de Ilarraza Arantza
Dobrovoljc Kaja
Dozat Timothy
Droganova Kira
Dwivedi Puneet
Eli Marhaba
Erjavec Tomaž
Farkas Richárd
Foster Jennifer
Freitas Cláudia
Gajdošová Katarína
Galbraith Daniel
Garcia Marcos
Ginter Filip
Goenaga Iakes
Gojenola Koldo
Goldberg Yoav
Gonzáles Saavedra Berta
Grioni Matias
Grūzītis Normunds
Guillaume Bruno
Gómez Guinovart Xavier
Gökırmak Memduh
Habash Nizar
Hajič Jan
Haug Dag
Hladká Barbora
Hohle Petter
Hà Mỹ Linh
Ion Radu
Irimia Elena
Johannsen Anders
Jørgensen Fredrik
Kanayama Hiroshi
Kanerva Jenna
Kaşıkara Hüner
Kotsyba Natalia
Krek Simon
Laippala Veronika
Lenci Alessandro
Ljubešić Nikola
Lyashevskaya Olga
Lynn Teresa
Lê Hồng Phương
Makazhanov Aibek
Manning Christopher
Mareček David
Martins André
Martínez Alonso Héctor
Matsumoto Yuji
Mašek Jan
McDonald Ryan
Missilä Anna
Mititelu Verginica
Miyao Yusuke
Montemagni Simonetta
More Amir
Mori Shunsuke
Moskalevskyi Bohdan
Muischnek Kadri
Mustafina Nina
Müürisep Kaili
Mărănduc Cătălina
Nguyễn Thị Minh Huyền
Nguyễn Thị Lương
Nikolaev Vitaly
Nivre Joakim
Nurmi Hanna
Ojala Stina
Osenova Petya
Pascual Elena
Passarotti Marco
Perez Cenel-Augusto
Perrier Guy
Petrov Slav
Piitulainen Jussi
Plank Barbara
Popel Martin
Pretkalniņa Lauma
Prokopidis Prokopis
Puolakainen Tiina
Pyysalo Sampo
Rademaker Alexandre
Ramasamy Loganathan
Real Livy
Rituma Laura
Rosa Rudolf
Saleh Shadi
Sanguinetti Manuela
Saulīte Baiba
Schuster Sebastian
Seddah Djamé
Seeker Wolfgang
Seraji Mojgan
Shakurova Lena
Shen Mo
Sichinava Dmitry
Silveira Natalia
Simi Maria
Simionescu Radu
Simkó Katalin
Simov Kiril
Smith Aaron
Suhr Alane
Sulubacak Umut
Szántó Zsolt
Taji Dima
Tanaka Takaaki
Tsarfaty Reut
Tyers Francis
Uematsu Sumire
Uria Larraitz
van Noord Gertjan
Varga Viktor
Vincze Veronika
Washington Jonathan North
Zeldes Amir
Zeman Daniel
Zhu Hanzhi
Çöltekin Çağrı
Øvrelid Lilja
Šimková Mária
Žabokrtský Zdeněk
Publication venue: Universal Dependencies Consortium
Publication date: 13/03/2017
Field of study

Universal Dependencies is a project that seeks to develop cross-linguistically consistent treebank annotation for many languages, with the goal of facilitating multilingual parser development, cross-lingual learning, and parsing research from a language typology perspective. The annotation scheme is based on (universal) Stanford dependencies (de Marneffe et al., 2006, 2008, 2014), Google universal part-of-speech tags (Petrov et al., 2012), and the Interset interlingua for morphosyntactic tagsets (Zeman, 2008). This release is special in that the treebanks will be used as training/development data in the CoNLL 2017 shared task (http://universaldependencies.org/conll17/). Test data are not released, except for the few treebanks that do not take part in the shared task. 64 treebanks will be in the shared task, and they correspond to the following 45 languages: Ancient Greek, Arabic, Basque, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, Galician, German, Gothic, Greek, Hebrew, Hindi, Hungarian, Indonesian, Irish, Italian, Japanese, Kazakh, Korean, Latin, Latvian, Norwegian, Old Church Slavonic, Persian, Polish, Portuguese, Romanian, Russian, Slovak, Slovenian, Spanish, Swedish, Turkish, Ukrainian, Urdu, Uyghur and Vietnamese. This release fixes a bug in http://hdl.handle.net/11234/1-1976. Changed files: ud-tools-v2.0.tgz (conllu_to_text.pl, conllu_to_conllx.pl; added text_without_spaces.pl), ud-treebanks-conll2017.tgz (fi_ftb-ud-train.txt, he-ud-train.txt, it-ud-train.txt, pt_br-ud-train.txt, es-ud-train.txt) and ud-treebanks-v2.0.tgz (fi_ftb-ud-train.txt, he-ud-train.txt, it-ud-train.txt, pt_br-ud-train.txt, es-ud-train.txt, ar_nyuad-ud-dev.txt, ar_nyuad-ud-test.txt, ar_nyuad-ud-train.txt, cop-ud-dev.txt, cop-ud-test.txt, cop-ud-train.txt, sa-ud-dev.txt, sa-ud-test.txt, sa-ud-train.txt)

LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University

Universal Dependencies 2.0 alpha (obsolete)

Author: Agić Željko
Ahrenberg Lars
Aranzabe Maria Jesus
Asahara Masayuki
Atutxa Aitziber
Ballesteros Miguel
Bauer John
Bengoetxea Kepa
Bhat Riyaz Ahmad
Bick Eckhard
Bosco Cristina
Bouma Gosse
Bowman Sam
Candito Marie
Cebiroğlu Eryiğit Gülşen
Celano Giuseppe G. A.
Chalub Fabricio
Choi Jinho
Connor Miriam
Davidson Elizabeth
de Marneffe Marie-Catherine
de Paiva Valeria
Diaz de Ilarraza Arantza
Dobrovoljc Kaja
Dozat Timothy
Droganova Kira
Dwivedi Puneet
Eli Marhaba
Erjavec Tomaž
Farkas Richárd
Foster Jennifer
Freitas Cláudia
Gajdošová Katarína
Galbraith Daniel
Garcia Marcos
Ginter Filip
Goenaga Iakes
Gojenola Koldo
Goldberg Yoav
Gonzáles Saavedra Berta
Grioni Matias
Grūzītis Normunds
Guillaume Bruno
Gómez Guinovart Xavier
Gökırmak Memduh
Habash Nizar
Hajič Jan
Haug Dag
Hladká Barbora
Hohle Petter
Hà Mỹ Linh
Ion Radu
Irimia Elena
Johannsen Anders
Jørgensen Fredrik
Kanayama Hiroshi
Kanerva Jenna
Kaşıkara Hüner
Kotsyba Natalia
Krek Simon
Laippala Veronika
Lenci Alessandro
Ljubešić Nikola
Lyashevskaya Olga
Lynn Teresa
Lê Hồng Phương
Makazhanov Aibek
Manning Christopher
Mareček David
Martins André
Martínez Alonso Héctor
Matsumoto Yuji
Mašek Jan
McDonald Ryan
Missilä Anna
Mititelu Verginica
Miyao Yusuke
Montemagni Simonetta
More Amir
Mori Shunsuke
Moskalevskyi Bohdan
Muischnek Kadri
Mustafina Nina
Müürisep Kaili
Mărănduc Cătălina
Nguyễn Thị Minh Huyền
Nguyễn Thị Lương
Nikolaev Vitaly
Nivre Joakim
Nurmi Hanna
Ojala Stina
Osenova Petya
Pascual Elena
Passarotti Marco
Perez Cenel-Augusto
Perrier Guy
Petrov Slav
Piitulainen Jussi
Plank Barbara
Popel Martin
Pretkalniņa Lauma
Prokopidis Prokopis
Puolakainen Tiina
Pyysalo Sampo
Rademaker Alexandre
Ramasamy Loganathan
Real Livy
Rituma Laura
Rosa Rudolf
Saleh Shadi
Sanguinetti Manuela
Saulīte Baiba
Schuster Sebastian
Seddah Djamé
Seeker Wolfgang
Seraji Mojgan
Shakurova Lena
Shen Mo
Sichinava Dmitry
Silveira Natalia
Simi Maria
Simionescu Radu
Simkó Katalin
Simov Kiril
Smith Aaron
Suhr Alane
Sulubacak Umut
Szántó Zsolt
Taji Dima
Tanaka Takaaki
Tsarfaty Reut
Tyers Francis
Uematsu Sumire
Uria Larraitz
van Noord Gertjan
Varga Viktor
Vincze Veronika
Washington Jonathan North
Zeldes Amir
Zeman Daniel
Zhu Hanzhi
Çöltekin Çağrı
Øvrelid Lilja
Šimková Mária
Žabokrtský Zdeněk
Publication venue: Universal Dependencies Consortium
Publication date: 01/03/2017
Field of study

This release contains errors in several files. Please use http://hdl.handle.net/11234/1-1983 instead

LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University

LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University - Corpus - Project code: 15-10472S; Project name: Morphologically and Syntactically Annotated Corpora of Many LanguagesUniversal Dependencies is a project that seeks to develop cross-linguistically consistent treebank annotation for many languages, with the goal of facilitating multilingual parser development, cross-lingual learning, and parsing research from a language typology perspective. The annotation scheme is based on (universal) Stanford dependencies (de Marneffe et al., 2006, 2008, 2014), Google universal part-of-speech tags (Petrov et al., 2012), and the Interset interlingua for morphosyntactic tagsets (Zeman, 2008).http://hdl.handle.net/11234/1-251

INRIA a CCSD electronic archive server