A corpus based anaphora resolution study for Turkish

Abstract

Yüksek Lisans TeziBu tez çalışmasının temelde iki amacı vardır. Bunlardan ilki, Türkçe gibi artgönderim çözümlemesi bakış açısıyla üzerinde çok çalışılmamış ve makine öğrenmesi deneylerine fazlaca konu olmamış bir dilde, çeşitli makine öğrenmesi modelleri kullanarak artgönderim çözümlemesinin modellenmeye çalışılmasıdır. Çalışmanın bir diğer amacı da, elimizdeki bir iş için kullanılacak modelin seçimine ilişkin, öğrenme modellerinin sınıflandırma performansları açısından değerlendirmesini yaparak, bu konuda yol gösterici olmaktır. Beklenen bir gözlem olan ve deneyler sonucunda elde edilen, her bir modelin aşırı ve yetersiz uyumdan kaçınarak optimum düzeyinin belirlenmesi gerekliliğinin yanında, elde edilen sonuçlara göre doğrusal olmayan modeller aşırı uyumdan kaçınacak şekilde düzgün olarak eniyileştirildiklerinde doğrusal olan modelleri de geride bırakmıştır.The aim of this thesis is two-fold. On the one hand, it attempts to explore several machine learning models for pronoun resolution in Turkish, a language not sufficiently studied with respect to anaphora resolution and rarely being subjected to machine learning experiments. On the other hand, the thesis offers an evaluation of the classification performances of the learning models in order to gain insight into the question of how to match a model to the task at hand. In addition to the expected observation that each model should be tuned to an optimum level of expressive power so as to avoid underfitting and overfitting, the results also suggest that non-linear models properly tuned to avoid overfitting outperform linear ones when applied to the data used in the experiments

    Similar works