• Türkçe
    • English
  • Türkçe 
    • Türkçe
    • English
  • Giriş
Öğe Göster 
  •   DSpace@Işık
  • 1- Fakülteler | Faculties
  • Mühendislik Fakültesi / Faculty of Engineering
  • Elektrik-Elektronik Mühendisliği Bölümü / Department of Electrical-Electronics Engineering
  • MF - Bildiri Koleksiyonu | Elektrik-Elektronik Mühendisliği Bölümü / Department of Electrical-Electronics Engineering
  • Öğe Göster
  •   DSpace@Işık
  • 1- Fakülteler | Faculties
  • Mühendislik Fakültesi / Faculty of Engineering
  • Elektrik-Elektronik Mühendisliği Bölümü / Department of Electrical-Electronics Engineering
  • MF - Bildiri Koleksiyonu | Elektrik-Elektronik Mühendisliği Bölümü / Department of Electrical-Electronics Engineering
  • Öğe Göster
JavaScript is disabled for your browser. Some features of this site may not work without it.

Extension of conventional co-training learning strategies to three-view and committee-based learning strategies for effective automatic sentence segmentation

Thumbnail

Göster/Aç

Publisher's Version (211.4Kb)

Tarih

2018

Yazar

Dalva, Doğan
Güz, Ümit
Gürkan, Hakan

Üst veri

Tüm öğe kaydını göster

Künye

Dalva, D., Güz, Ü. & Gürkan, H. (2018). Extension of conventional co-training learning strategies to three-view and committee-based learning strategies for effective automatic sentence segmentation. Paper presented at the 2018 IEEE Spoken Language Technology Workshop (SLT), 750-755. doi:10.1109/SLT.2018.8639533

Özet

The objective of this work is to develop effective multi-view semi-supervised machine learning strategies for sentence boundary classification problem when only small sets of sentence boundary labeled data are available. We propose three-view and committee-based learning strategies incorporating with co-training algorithms with agreement, disagreement, and self-combined learning strategies using prosodic, lexical and morphological information. We compare experimental results of proposed three-view and committee-based learning strategies to other semi-supervised learning strategies in the literature namely, self-training and co-training with agreement, disagreement, and self-combined strategies. The experiment results show that sentence segmentation performance can be highly improved using multi-view learning strategies that we propose since data sets can be represented by three redundantly sufficient and disjoint feature sets. We show that the proposed strategies substantially improve the average performance when only a small set of manually labeled data is available for Turkish and English spoken languages, respectively.

Kaynak

2018 IEEE Spoken Language Technology Workshop (SLT)

Bağlantı

https://hdl.handle.net/11729/1594
http://dx.doi.org/10.1109/SLT.2018.8639533

Koleksiyonlar

  • MF - Bildiri Koleksiyonu | Elektrik-Elektronik Mühendisliği Bölümü / Department of Electrical-Electronics Engineering [222]
  • Scopus İndeksli Bildiri Koleksiyonu [452]
  • WoS İndeksli Bildiri Koleksiyonu [353]

İlgili Öğeler

Başlık, yazar, küratör ve konuya göre gösterilen ilgili öğeler.

  • Effective semi-supervised learning strategies for automatic sentence segmentation 

    Dalva, Doğan; Güz, Ümit; Gürkan, Hakan (Elsevier Science BV, 2018-04-01)
    The primary objective of sentence segmentation process is to determine the sentence boundaries of a stream of words output by the automatic speech recognizers. Statistical methods developed for sentence segmentation requires ...
  • Co-training using prosodic, lexical and morphological information for automatic sentence segmentation of Turkish spoken language 

    Dalva, Doğan (Işık Üniversitesi, 2018-01-15)
    Sentence segmentation of speech aims detecting sentence boundaries in a stream of words output by the speech recognizer. Sentence segmentation is a preliminary step toward speech understanding. It is of particular importance ...
  • Shallow parsing in Turkish 

    Topsakal, Ozan; Açıkgöz, Onur; Gürkan, Ali Tunca; Kanburoğlu, Ali Buğra; Ertopçu, Burak; Özenç, Berke; Çam, İlker; Avar, Begüm; Ercan, Gökhan; Yıldız, Olcay Taner (IEEE, 2017)
    In this study, shallow parsing is applied on Turkish sentences. These sentences are used to train and test the per-formances of various learning algorithms with various features specified for shallow parsing in Turkish.



DSpace software copyright © 2002-2015  DuraSpace
İletişim | Geri Bildirim
Theme by 
@mire NV
 

 




| Politika | Rehber | İletişim |

DSpace@Işık

by OpenAIRE
Gelişmiş Arama

sherpa/romeo

Göz at

Tüm DSpaceBölümler & KoleksiyonlarTarihe GöreYazara GöreBaşlığa GöreKonuya GöreTüre GöreDile GöreBölüme GöreKategoriye GöreYayıncıya GöreErişim ŞekliIşık Yazarına GöreKünyeye GöreBu KoleksiyonTarihe GöreYazara GöreBaşlığa GöreKonuya GöreTüre GöreDile GöreBölüme GöreKategoriye GöreYayıncıya GöreErişim ŞekliIşık Yazarına GöreKünyeye Göre

Hesabım

GirişKayıt

İstatistikler

Google Analitik İstatistiklerini Görüntüle

DSpace software copyright © 2002-2015  DuraSpace
İletişim | Geri Bildirim
Theme by 
@mire NV
 

 


|| Politika || Rehber || Kütüphane || Işık Üniversitesi || OAI-PMH ||

Işık Üniversitesi Kütüphane ve Dokümantasyon Daire Başkanlığı, Şile, İstanbul, Türkiye
İçerikte herhangi bir hata görürseniz lütfen bize bildirin

Creative Commons License
Işık Üniversitesi Institutional Repository is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 4.0 Unported License..

DSpace@Işık:


DSpace 6.2

tarafından İdeal DSpace hizmetleri çerçevesinde özelleştirilerek kurulmuştur.