2 research outputs found

    Türkçe için az bilgili bir adıl çözümleme sistemi

    No full text
    This thesis presents a knowledge-poor pronoun resolution system for Turkish which resolves third person personal pronouns and possessive pronouns. The system is knowledge-poor in the sense that it makes use of limited linguistic and semantic knowledge to resolve the pronouns. As pronoun resolution proposals for languages like English, French and Spanish, the core of the system is the constraints and preferences which are determined empirically. The system has four modules: sentence splitting, pronoun extraction, forming the list of candidate antecedents and determination of the antecedent. It takes a Turkish text as input and rewrites this text with the considered pronouns replaced with their proposed antecedents. In order to compare the success rate of the system, two different baseline algorithms are implemented. The original system is tested against these baseline algorithms on two sample Turkish texts from different sources. Some suggestions to improve the success rate of the system and to extend the domain of the system are also presented.M.S. - Master of Scienc

    A syntax-based pronoun resolution system for Turkish

    No full text
    Doktora TeziBu tez, sözdizim bilgisi kullanarak Türkçe'deki üçüncü kişi adıllarını çözümlemeye çalışan bir sistem sunar. Sistem, verilen bir metinde tümcelerin sadece sözdizim yapılarını kullanan Hobbs'un Naif Yaklaşımı (Hobbs, 1976, 1978) ile sözdizimsel kuram ve dil işleme modelleri içinde temel bir rol oynayan Chomsky'nin Bağlama Kuramına (Chomsky, 1981, 1995) dayanmaktadır. Algoritma, çeşitli metinlerden çıkartılmış, tümceler içeren bazı söylem parçacıklarına uygulanmıştır. Türkçe'deki üçüncü kişi adıllarını çözümlemek için oluşturulan bu model, derin söylem analizi yapmadan metinden çıkartılabilen basit sözdizimsel bilgi ve dünya bilgisini kullanmaktadır. Algoritma Hobbs'un Naif Algoritmasında olduğu gibi belirli bir dilbilgisi kuralları tarafından üretilmiş, ayrıştırma ağaçları biçimindeki tümcelere uygulanmaktadır. Algoritma, adılların olası aday öncüllerini kendi yerel alanları dışında, ilgili ayrıştırma ağaçları üzerinden giderek araştırmak için Chomsky'nin Bağlama Kuramı'ndan çıkartılmış sözdizimsel kısıtlamalarını kullanmaktadır. Tüm olası aday öncüller arasından en iyi öncülün belirlenmesinde önemli bir rol oynayan etkili bazı faktörler, bir kısıtlar ve tercihler listesi şeklinde tanımlanmıştır. Bu çalışmada önerilen sistem, iki farklı dayanak algoritması ve Türkçe için kişi adıl çözümlemesi yapan az bilgili bir sistem (Küçük ve Turhan-Yöndem, 2007) ile karşılaştırılmıştır. Asıl sistem, bu dayanak algoritmaları ve az-bilgili sisteme karşı, farklı kaynaklardan iki örnek metin üzerinde denenmiştir. Bu tezin temel amacı Bilgisayarlı Türkçe Adıl Çözümlemesi yapmak ve elde edilen sonuçları Türkçe için bu alanda yapılmış bir başka önemli çalışma olan az-bilgili sistem ile kıyaslayarak gelecek için bir tartışma başlatmaktır.This thesis presents a system intended to resolve third personal pronouns in Turkish using syntactic information. The system is based on Hobbs Naïve Algorithm (Hobbs, 1978), which exploits only the surface syntax of sentences in a given text and Chomsky's Binding Theory (Chomsky, 1981, 1995), which has played a central role in both syntactic theory and models of language processing. The algorithm is applied to some discourse fragments which consist of sentences extracted from various texts. The model for third personal pronoun resolution in Turkish utilizes simple syntactic information, which can be extracted from the text without deep discourse analysis and world knowledge. The algorithm is applied to the sentences which are presented as parse trees produced by a particular grammar like that used in Hobbs' Naïve Algorithm. The algorithm focuses on syntactic restrictions which are derived from Chomsky's Binding Theory to search for the possible candidate antecedents of the pronouns outside their local domain by traversing the relevant parse trees. Some effective factors, which come into play in order to determine the best antecedent among all possible candidates, are defined as a list of constraints and preferences. The system proposed in this study is compared with two different baseline algorithms and a knowledge-poor pronoun resolution system for Turkish (Kucuk and Turhan-Yöndem, 2007). The original system is tested against these baseline algorithms and the knowledge-poor system on two sample Turkish texts from different sources. Thus, the main goal of the study is to provide a computational implemented system for resolving third personal pronouns in Turkish and to compare the results produced by our syntax-based system with the knowledge-poor system, which is an another important work about the same topic for Turkish, and to start a discussion about it