1 research outputs found

    The large language model GreekLegalRoBERTa

    Get PDF
    Σε αυτή την πτυχιακή αναπτύσσουμε το μοντέλο GreekLegalRoBERTa πάνω σε κείμενα Ελληνικής νομοθεσίας. Έπειτα αξιολογούμε την απόδοση του μοντέλου μας σε 2 προκλήσεις νομικού περιεχομένου οι οποίες είναι η αναγνώριση ονοματισμένων οντοτήτων και ο διαχωρισμός νομικών κειμένων σε κατηγορίες. Στο τέλος αποδεικνύουμε ότι η απόδοση του μοντέλου μας ξεπερνάει την απόδοση των μοντέλων GreekLegalBERT και GreekBERT. Η πτυχιακή αυτή αποτελεί μία συνεισφορά στο πεδίο της επεξεργασίας φυσικής γλώσσας συγκεκριμένου περιεχομένου. Η συνεισφορά αυτή είναι ιδιαίτερα σημαντική για μια γλώσσα περιορισμένου περιεχομένου όσον αφορά την επεξεργασίας φυσικής γλώσσας όπως τα ελληνικά.We develop GreekLegalRoBERTa, a large language model trained on Greek legislation. We show that our model surpasses the performance of both GreekLegalBERT and GreekBERT in two tasks involving Greek legal documents: named entity recognition and multi-class legal topic classification. We view our work as a contribution to the study of domain-specific NLP tasks in low-resource languages, like Greek, using modern NLP techniques and methodologies
    corecore