Basit öğe kaydını göster

dc.contributor.advisorYıldız, Olcay Taneren_US
dc.contributor.authorAkçakaya, Sinanen_US
dc.contributor.otherIşık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.date.accessioned2019-10-21T02:54:34Z
dc.date.available2019-10-21T02:54:34Z
dc.date.issued2019-09-06
dc.identifier.citationAkçakaya, S. (2019). All-words word sense disambiguation in Turkish. İstanbul: Işık Üniversitesi Fen Bilimleri Enstitüsü.en_US
dc.identifier.urihttps://hdl.handle.net/11729/2204
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 41-43)en_US
dc.descriptionx, 43 leavesen_US
dc.description.abstractWord sense disambiguation (WSD) is the identi cation of the meaning of words in context in a computational manner. The main subject of this study is to implement and compare the WSD results of various supervised classi ers (Naive Bayes, K Nearest Neighbor, Rocchio and C4.5) in all-words setting. To this end, we have constructed an all-words sense annotated Turkish corpus, using traditional method of manual tagging. During the annotation, a pre-built parallel treebank (aligned from Penn Treebank) has been tagged with the senses of Turkish Language Institutions dictionary. The approach of annotating a treebank allowed us to generate a full-coverage resource, in which syntactic and semantic information merged. In the WSD evaluations, three distinct experiments have been organized to determine the efect of using different feature sets on the disambiguation performance. First experiment has been conducted with a simple feature set that includes the fundamental local features. In the second experiment, the initial feature set has been augmented with several effective morphological features, and in the third one, the feature set has further been extended with the syntactic features. Our test results show that all classi ers have achieved better results in parallel to growing feature set. Additionally, integration of syntactic features has proved to be useful for WSD.en_US
dc.description.abstractAnlam belirsizliğini giderme, kelimelerin bağlam içerisindeki anlamının hesaplamalı yöntemlerle belirlenmesidir. Bu çalışmanın ana konusu, çeşitli gözetimli sınıflandırma metodlarını (Naive Bayes, K Nearest Neighbor, Rocchio ve C4.5) Türkçe bir metindeki tüm sözcüklerin anlam belirsizliğini gidermek için uygulamak ve elde edilen sonuçları karşılaştırmaktır. Bu amaçla, geleneksel elle işaretleme yöntemini kullanarak Türkçe tüm sözcükler için bir derlem oluşturduk. Etiketleme esnasında, önceden çözümlenmiş (Penn Treebank) ve Türkçe ye uyarlanmış paralel bir derlem Türk Dil Kurumunun sözlüğündeki anlamlarla etiketlenmiştir. Çözümlenmiş bir derlemin etiketlenmesi bize içerisinde anlamsal ve sözdizimsel bilginin harmanlandığı tam kapsamlı bir derlem meydana getirme imkanı tanımıştır. Anlam belirsizliğini giderme testlerinde farklı özellik kümelerinin performansa olan etkisini saptamak için üç ayrı deney hazırlanmıştır. Birinci deney, temel lokal özellikleri içeren yalın bir özellik seti ile yapılmıştır. İkinci deneyde bu yalın küme çeşitli morfolojik (biçimbilimsel) özelliklerle genişletilmiştir. Üçüncü deneyde ise sözdizimsel özelliklerin eklenmesiyle daha da kapsamlı bir özellik kümesi oluşturulmuştur. Deney sonuçları tüm sınıflandırma yöntemlerinin özellik kümesinin genişletilmesine paralel olarak daha yüksek performans değerleri elde ettiğini göstermektedir. Ayrıca, sözdizimsel özelliklerin entegrasyonunun anlam belirsizliğini gidermede faydalı olduğu gösterilmiştir.en_US
dc.description.tableofcontentsApproaches to WSD Problemen_US
dc.description.tableofcontentsWSD Variantsen_US
dc.description.tableofcontentsWSD Approachesen_US
dc.description.tableofcontentsKnowledge-Based Disambiguationen_US
dc.description.tableofcontentsCorpus-Based Disambiguationen_US
dc.description.tableofcontentsSupervised Disambiguationen_US
dc.description.tableofcontentsk-Nearest Neighboren_US
dc.description.tableofcontentsRocchio Algorithmen_US
dc.description.tableofcontentsNaive Bayesen_US
dc.description.tableofcontentsC4.5 Algorithmen_US
dc.description.tableofcontentsSemi-supervised Disambiguationen_US
dc.description.tableofcontentsUnsupervised Disambiguationen_US
dc.description.tableofcontentsRelated Worken_US
dc.description.tableofcontentsThe SENSEVAL/SEMEVAL Competitionsen_US
dc.description.tableofcontentsTurkish WSD Worksen_US
dc.description.tableofcontentsDataset Constructionen_US
dc.description.tableofcontentsInput Corpusen_US
dc.description.tableofcontentsAlignmenten_US
dc.description.tableofcontentsMorphological Analysisen_US
dc.description.tableofcontentsAnnotation Methodologyen_US
dc.description.tableofcontentsSense Inventoryen_US
dc.description.tableofcontentsBasic Data Formaten_US
dc.description.tableofcontentsAnnotation Toolen_US
dc.description.tableofcontentsFeatures and Statistics of the Corpusen_US
dc.description.tableofcontentsFeaturesen_US
dc.description.tableofcontentsEvaluationen_US
dc.description.tableofcontentsEvaluation Measuresen_US
dc.description.tableofcontentsBaselinesen_US
dc.description.tableofcontentsExperimental Resultsen_US
dc.language.isoengen_US
dc.publisherIşık Üniversitesien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectAll-words WSDen_US
dc.subjectNatural language processingen_US
dc.subjectSupervised learningen_US
dc.subjectSyntactic featuresen_US
dc.subjectAnlam belirsizliğini gidermeen_US
dc.subjectDenetimli öğrenmeen_US
dc.subjectDoğal dil işlemeen_US
dc.subjectSözdizimsel özellikleren_US
dc.subject.lccQA76.9.N38 A33 2019
dc.subject.lcshNatural language processing (Computer science)en_US
dc.titleAll-words word sense disambiguation in Turkishen_US
dc.title.alternativeTürkçe tüm sözcükler için anlam belirsizliğini gidermeen_US
dc.typemasterThesisen_US
dc.contributor.departmentIşık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.relation.publicationcategoryTezen_US
dc.contributor.institutionauthorAkçakaya, Sinanen_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster

info:eu-repo/semantics/openAccess
Aksi belirtilmediği sürece bu öğenin lisansı: info:eu-repo/semantics/openAccess