An approach to anaylse Turkish syntax at morphosyntactic level

dc.authorid0000-0003-2008-243X
dc.contributor.advisorSolak, Ercanen_US
dc.contributor.authorÖzenç, Berkeen_US
dc.contributor.otherIşık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Doktora Programıen_US
dc.contributor.otherIşık University, School of Graduate Studies, Ph.D. in Computer Engineeringen_US
dc.date.accessioned2025-05-27T08:26:06Z
dc.date.available2025-05-27T08:26:06Z
dc.date.issued2025-01-20
dc.departmentIşık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Doktora Programıen_US
dc.departmentIşık University, School of Graduate Studies, Ph.D. in Computer Engineeringen_US
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 83-87)en_US
dc.descriptionx, 90 leavesen_US
dc.description.abstractSyntactic analysis allows us to analyse the sentence structure in various ways. Constituency parsing is one of the various ways of conducting syntactic analysis. This parsing method defines sentence structure as hierarchical relationships between words or phrases and represents them in tree form. Constituency parsing employs constituency grammar which defines how constituents combine and form other constituents. In this grammar, any syntactic structure from the sentence to the words is represented by the constituents. Although this approach is designed to focus on universal aspects of the languages, English has always been in its focus. This situation makes the constituency approach miss the details that the morphology puts in the syntax of morphologically rich languages. In this study, we implement an extension for the constituency parsing which overcomes the challenges in parsing of MRL (Morphologically Rich Language). We propose ideas tailored to Turkish, yet they can be used for any language like Turkish. Our extension enables the constituency parsing to start at the morpheme level. Thus, we involve morphemic structures in the parsing process and express their syntactic effects on the structure. We have our implementations by extending the CYK (Cocke Younger Kasami) algorithm. During parsing, we utilize extra rules to transfer the ambiguity in morphology to the parsing. In addition, we designed a morpheme-focused constituency set for Turkish. This set involves affixes, stems and phrases headed by a stem. We demonstrate our work with a mini treebank and the grammar generated from it.en_US
dc.description.abstractSözdizim analizi Doğal Dil İşleme alanında kullanılan temel yöntemlerden biridir. Sözdizimsel Analiz işlemi tümce yapısının çeşitli şekillerde analiz edilmesine imkan tanır. Bileşen analizi de bu yollardan bir tanesidir. Bu yöntem tümce yapısını sözcükler ve tamlamalar arasındaki hiyerarşik ilişkiler olarak tanımlar ve ilişkilerin oluşturduğu bu yapıyı ağaç formatında gösterir. Bileşen çözümlemesi, bileşenlerin nasıl birleştiğini ve hangi bileşenleri oluşturduğunu açıklayan bileşen gramerini kullanır. Bu gramerde sözcüklerden tümcenin kendisine kadar olan tüm yapılar bileşenlerce temsil edilir. Tasarımı gereği, bu yaklaşım dilin evrensel özelliklerine odaklanıyor olsa da yaklaşımın odağı hep İngilizce üzerine olmuştur. Bu durum bileşen yönteminin biçimbirim yönünden zengin dillerde biçimbirimlerin sözdizime kattığı detayları kaçırmasına neden olur. Bu çalışmada, biçimbirim yönünden zengin dillerin için bileşen yöntemindeki zorlukların üstesinden gelen bir uzantı öneriyoruz. Fikirlerimiz Türkçeye için kurgulanmış olsa da Türkçeye benzer herhangi bir dil için de kullanılabilir. Uzantımız bileşen çözümlemesinin biçimbirim düzeyinden başlamasını sağlar. Böylece, biçimbirimsel yapıların sözdizim analizine katılmasını sağlıyoruz ve sözdizime olan etkilerini gösteriyoruz. Önerilerimizi CYK algoritması üzerinde uyguladık. Sözdizim analizinde, özel kurallarla, biçimbirimlerden kaynaklanan muğlaklıkları analiz sürecine dahil ediyoruz. Ek olarak, Türkçe için, biçimbirim odaklı bir bileşen kümesi tasarladık. Tasarladığımız bu küme ekleri, gövdeleri ve başı gövde olan tamlamaları içerir. Çalışmamızı küçük bir ağaç bankası ve ondan üretilen gramer ile gösteriyoruz.en_US
dc.identifier.citationÖzenç, B. (2025). An approach to anaylse Turkish syntax at morphosyntactic level. İstanbul: Işık Üniversitesi Lisansüstü Eğitim Enstitüsü.en_US
dc.identifier.urihttps://hdl.handle.net/11729/6398
dc.identifier.yoktezid927102
dc.institutionauthorÖzenç, Berkeen_US
dc.institutionauthorid0000-0003-2008-243X
dc.language.isoenen_US
dc.publisherIşık Üniversitesi, Lisansüstü Eğitim Enstitüsüen_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectTürkçeen_US
dc.subjectBileşen analizien_US
dc.subjectBileşen gramerien_US
dc.subjectTurkishen_US
dc.subjectConstituency parsingen_US
dc.subjectConstituency grammaren_US
dc.subject.lccP98 .O94 2025
dc.subject.lcshNatural language processing (Computer science).en_US
dc.subject.lcshTurkish language -- Syntax analyses.en_US
dc.subject.lcshTurkish language -- Morphosyntax.en_US
dc.subject.lcshTurkish language -- Parsing.en_US
dc.titleAn approach to anaylse Turkish syntax at morphosyntactic levelen_US
dc.title.alternativeTürkçe sözdiziminin biçim-sözdizimsel seviyede analiz edilmesi yöntemien_US
dc.typeDoctoral Thesisen_US
dspace.entity.typePublicationen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
An_approach_to_anaylse_Turkish_syntax_at_morphosyntactic_level.pdf
Boyut:
2.54 MB
Biçim:
Adobe Portable Document Format
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.17 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: