Basit öğe kaydını göster

dc.contributor.advisorGüz, Ümiten_US
dc.contributor.authorRevidi, İzel D.en_US
dc.contributor.otherIşık Üniversitesi, Fen Bilimleri Enstitüsü, Elektronik Mühendisliği Yüksek Lisans Programıen_US
dc.date.accessioned2016-06-08T06:07:31Z
dc.date.available2016-06-08T06:07:31Z
dc.date.issued2014-06-05
dc.identifier.citationRevidi, İ. D., (2014). Prosodic, morpological and lexical feature extraction of Turkish broadcast news data. İstanbul: Işık Üniversitesi Fen Bilimleri Enstitüsü.en_US
dc.identifier.urihttps://hdl.handle.net/11729/958
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 92-95)en_US
dc.descriptionxii, 115 leavesen_US
dc.description.abstractSentence segmentation from speech is part of a process that aims at enriching the unstructured stream of words that are the output of standard speech recognizers. Its role is to find the sentence units in this stream of words. Sentence segmentation is a preliminary step toward speech understanding. Once the sentence boundaries are detected, further syntactic and/or semantic analysis can be performed on these sentences. Usually, speech recognizer output lacks the textual cues to these entities (such as headers, paragraphs, sentence punctuation, and capitalization). However, speech provides extra non-lexical cues, related to features like pitch, energy, pause and word durations as prosodic features; verb, noun or adjective as a morphological features and also lexical features. These prosodic, morphological and lexical features are provides a complementary information for segmentation of speech into sentences. Our goal is examine feature the extraction and use of prosodic information which has been done in previous works, in addition to lexical features and morphological for spoken language processing of Turkish with open source tools.en_US
dc.description.abstractCümle bölütlemesi otomatik konuşma tanıma sisteminden çıkan sözcüklerin içeriğini zenginleştirmeyi hedefleyen sürecin bir parçasıdır. Cümle bölütlemesi, gelen kelime akışının bütün bir cümle olarak tanımlanması görevini üstlenir ve konuşma anlamının çıkarılması sürecinin bir önceki aşamasını oluşturur. Cümle sınırlarının bulunması ile birlikte cümle üzerinde sözdizimi ve/veya anlamsal analiz yapılabilmektedir. Genellikle otomatik konuşma tanıma sisteminden alınan çıktılarda başlık, paragraf, noktalama, büyük/küçük harf gibi bilgileri içeren metin işaretleri yer almamaktadır. Ancak konuşma hali hazırda enerji, duraklama bilgisi, kelimenin geçiş süresi gibi bürünsel özellikleri; kelimenin yüklem, isim veya sıfat olması gibi biçimsel özellikleri ve sözcüksel özellikleri barındırmaktadır. Bu bürünsel, biçimsel ve sözcüksel özellikler cümle bölütlemesinin yapılabilmesi için tamamlayıcı bir bilgi sağlamaktadır. Yapılan çalışmadaki amacımız daha önceki çalışmalarda yapılmış bürünsel özelliklerin çıkarımı ve kullanımına ek olarak; biçimsel ve sözcüksel özellikler açık kaynak kodlu araçlar ile Türkçe Konuşma Dili üzerinde çıkarımı ve kullanımıdır.en_US
dc.description.tableofcontentsIntroductionen_US
dc.description.tableofcontentsRelated Worksen_US
dc.description.tableofcontentsAutomatic Speech Recognitionen_US
dc.description.tableofcontentsDefinitionen_US
dc.description.tableofcontentsASR With Turkish Spoken Languageen_US
dc.description.tableofcontentsStart-Upen_US
dc.description.tableofcontentsModelingen_US
dc.description.tableofcontentsHidden Markov Toolkiten_US
dc.description.tableofcontentsProsodic Featuresen_US
dc.description.tableofcontentsFeaturesen_US
dc.description.tableofcontentsProsodic Feature Extractionen_US
dc.description.tableofcontentsMorphological Featuresen_US
dc.description.tableofcontentsMorphological Processesen_US
dc.description.tableofcontentsCombining Morphemesen_US
dc.description.tableofcontentsMorphological Feature Extractionen_US
dc.description.tableofcontentsLexical Featuresen_US
dc.description.tableofcontentsN-gram Usageen_US
dc.description.tableofcontentsSentence Segmentationen_US
dc.description.tableofcontentsApproachen_US
dc.description.tableofcontentsSoftware Usage(Icsiboost)en_US
dc.description.tableofcontentsExperiments and Conclusionen_US
dc.description.tableofcontentsOverviewen_US
dc.description.tableofcontentsExperimentsen_US
dc.description.tableofcontentsConclusionen_US
dc.language.isoengen_US
dc.publisherIşık Üniversitesien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subject.lccTK7882.S65 R48 2014
dc.subject.lcshSpeech processing systems.en_US
dc.subject.lcshSpeech synthesis.en_US
dc.subject.lcshAutomatic speech recognition.en_US
dc.titleProsodic, morphological and lexical feature extraction of Turkish broadcast news dataen_US
dc.title.alternativeTürkçe haber verisinden bürünsel, biçimsel ve sözcüksel özelliklerin çıkarımıen_US
dc.typemasterThesisen_US
dc.contributor.departmentIşık Üniversitesi, Fen Bilimleri Enstitüsü, Elektronik Mühendisliği Yüksek Lisans Programıen_US
dc.relation.publicationcategoryTezen_US
dc.contributor.institutionauthorRevidi, İzel D.en_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster

info:eu-repo/semantics/openAccess
Aksi belirtilmediği sürece bu öğenin lisansı: info:eu-repo/semantics/openAccess