Search CORE

1 research outputs found

The large language model GreekLegalRoBERTa

Author: SAKETOS VASILEIOS
ΣΑΚΕΤΟΣ ΒΑΣΙΛΕΙΟΣ
Publication venue
Publication date: 01/01/2023
Field of study

Σε αυτή την πτυχιακή αναπτύσσουμε το μοντέλο GreekLegalRoBERTa πάνω σε κείμενα Ελληνικής νομοθεσίας. Έπειτα αξιολογούμε την απόδοση του μοντέλου μας σε 2 προκλήσεις νομικού περιεχομένου οι οποίες είναι η αναγνώριση ονοματισμένων οντοτήτων και ο διαχωρισμός νομικών κειμένων σε κατηγορίες. Στο τέλος αποδεικνύουμε ότι η απόδοση του μοντέλου μας ξεπερνάει την απόδοση των μοντέλων GreekLegalBERT και GreekBERT. Η πτυχιακή αυτή αποτελεί μία συνεισφορά στο πεδίο της επεξεργασίας φυσικής γλώσσας συγκεκριμένου περιεχομένου. Η συνεισφορά αυτή είναι ιδιαίτερα σημαντική για μια γλώσσα περιορισμένου περιεχομένου όσον αφορά την επεξεργασίας φυσικής γλώσσας όπως τα ελληνικά.We develop GreekLegalRoBERTa, a large language model trained on Greek legislation. We show that our model surpasses the performance of both GreekLegalBERT and GreekBERT in two tasks involving Greek legal documents: named entity recognition and multi-class legal topic classification. We view our work as a contribution to the study of domain-specific NLP tasks in low-resource languages, like Greek, using modern NLP techniques and methodologies

Pergamos : Unified Institutional Repository / Digital Library Platform of the National and Kapodistrian University of Athens