1 research outputs found
The large language model GreekLegalRoBERTa
Σε αυτή την πτυχιακή αναπτύσσουμε το μοντέλο GreekLegalRoBERTa πάνω σε κείμενα Ελληνικής νομοθεσίας. Έπειτα αξιολογούμε την απόδοση του μοντέλου μας σε 2 προκλήσεις νομικού περιεχομένου οι οποίες είναι η αναγνώριση ονοματισμένων οντοτήτων και ο διαχωρισμός νομικών κειμένων σε κατηγορίες. Στο τέλος αποδεικνύουμε ότι η απόδοση του μοντέλου μας ξεπερνάει την απόδοση των μοντέλων GreekLegalBERT και GreekBERT. Η πτυχιακή αυτή αποτελεί μία συνεισφορά στο πεδίο της επεξεργασίας φυσικής γλώσσας συγκεκριμένου περιεχομένου. Η συνεισφορά αυτή είναι ιδιαίτερα σημαντική για μια γλώσσα περιορισμένου περιεχομένου όσον αφορά την επεξεργασίας φυσικής γλώσσας όπως τα ελληνικά.We develop GreekLegalRoBERTa, a large language model trained on Greek legislation.
We show that our model surpasses the performance of both GreekLegalBERT and GreekBERT in two tasks involving Greek legal documents: named entity recognition and multi-class legal topic classification. We view our work as a contribution to the study of domain-specific NLP tasks in low-resource languages, like Greek, using modern NLP techniques and methodologies