Basit öğe kaydını göster

dc.contributor.advisorDehkharghani, Rahimen_US
dc.contributor.authorEzerceli, Özayen_US
dc.contributor.otherIşık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.date.accessioned2023-09-11T09:47:45Z
dc.date.available2023-09-11T09:47:45Z
dc.date.issued2023-08-24
dc.identifier.citationEzerceli, Ö. (2023). Suicidal ideation detection from social media. İstanbul: Işık Üniversitesi Lisansüstü Eğitim Enstitüsü.en_US
dc.identifier.urihttps://hdl.handle.net/11729/5704
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 46-50)en_US
dc.descriptionxiv, 51 leavesen_US
dc.description.abstractSuicidal ideation is a global cause of life-threatening injury and, most of the time, death. Mental health issues have been rapidly increasing, and most are being avoided without adequate treatment. Due to the developments in social media platforms and the online anonymity that these platforms provide, people would like to interact more with others on social platforms. Social platforms are surveillance tools for mining social content and suicidal tendencies. The current thesis attempts to present a solution to detect depression/suicidal ideation by using state-of-the-art natural language processing (NLP) and deep learning (DL) approaches (BiLSTM, BERT Transformer). Three different novel approaches are proposed for three different datasets of textual content. The SuicideDetection dataset is a publicly available dataset which is a collection from the social platform of Reddit’s subreddits (“SuicideWatch”, ”depression”, ”bipolar”, ”offmychest”, ”anxiety”) in Kaggle and the SWMH dataset is a collection from only “SuicideWatch” subreddit. The CEASEv2.0 dataset is another used dataset which is a collection of 4932 suicide notes. The proposed models outperformed the latest models by 2% and 1% F1 scores on SuicideDetection and CEASEv2.0 datasets, respectively. The best models for each dataset have been analyzed and discussed in terms of performance, along with the characteristics of the datasets and limitations in the suicidal ideation classification. This performance can be measured by common metrics such as Accuracy, Precision, Recall, F1-Score, and ROC curve. As its application in the real world, this project can assist psychologists in the early identification of suicidal ideation before the suicidal person harms him/herself. The thesis also demonstrates the potential of employing DL algorithms such as transformers along with the latest word embedding techniques and NLP techniques that could improve the issue of suicidal ideation.en_US
dc.description.abstractİntihar düşüncesi, yaşamı tehdit eden yaralanmaların ve çoğu zaman ölümün küresel bir nedenidir. Dünyada ruh sağlığı sorunları hızla artmakta ve birçoğu yeterli tedavi görülmeksizin göz ardı edilmektedir. Günümüzdeki sosyal medya platformlarındaki gelişmeler ve bu platformların sağladığı çevrimiçi anonimlik nedeniyle insanlar bu gibi platformlarda başkalarıyla sürekli olarak etkileşim halindedirler. Sosyal media platformları, sosyal içerikler ve intihar eğilimleri madenciliği için gözetim araçları olarak kullanılabilmektedir. Bu tez, son teknoloji doğal dil işleme ve derin öğrenmek yaklaşımlarını (BiLSTM, BERT Transformatörü) kullanarak metinsel içerik üzerinden depresyon/intihar düşüncesini tespit etmek için bir çözüm sunmaya çalışmaktadır. Üç farklı metinsel veri seti için üç farklı yeni yaklaşım önerilmiştir. SuicideDetection veri kümesi, Kaggle'da sunulan halka açık bir veri setidir ve de bu veri seti Reddit'in alt dizinlerinden ("SuicideWatch", "depression", "bipolar", "offmychest", "anxiety") oluşturulan bir koleksiyondur. SWMH veri kümesi sadece "SuicideWatch" alt dizininden toplanan içeriklerle oluşturulmuş bir koleksiyondur. CEASEv2.0 veri kümesi, 4932 intihar notundan oluşan ve kullandığımız bir diğer veri setidir. Önerilen modeller, SuicideDetection ve CEASEv2.0 veri setlerinde sırasıyla %2 ve %1 F1 puanları ile en son modellerden daha iyi performans göstermiştir. Her veri seti için en iyi modeller, veri setlerinin özellikleri ve intihar düşüncesi sınıflandırmasındaki sınırlamalarla birlikte performans açısından analiz edilmiş ve tartışılmıştır. Bu performans, Doğruluk, Kesinlik, Geri Çağırma, F1-Skoru ve ROC eğrisi gibi yaygın ölçütlerle ölçülüp karşılaştırılmıştır. Gerçek dünyadaki uygulaması itibariyle bu proje, intihara meyilli kişi kendisine zarar vermeden önce intihar düşüncesinin erken teşhisinde psikologlara yardımcı olabilir. Ayrıca, intihar düşüncesi sorununu iyileştirebilecek en son kelime gömme teknikleri ve doğal dil işleme teknikleriyle birlikte dönüştürücüler gibi derin öğrenme algoritmalarının kullanılma potansiyelini de göstermektedir.en_US
dc.description.tableofcontentsSuicide Statisticsen_US
dc.description.tableofcontentsBasis of Suicidal Ideationen_US
dc.description.tableofcontentsSuicidal Ideation on Social Platformsen_US
dc.description.tableofcontentsSuicidal Ideation Detectionen_US
dc.description.tableofcontentsMachine Learning Based Studiesen_US
dc.description.tableofcontentsDeep Learning Based Studiesen_US
dc.description.tableofcontentsTransformer Based Studiesen_US
dc.description.tableofcontentsPROPOSED METHODOLOGYen_US
dc.description.tableofcontentsFramework of Proposed Methodologyen_US
dc.description.tableofcontentsPreprocessingen_US
dc.description.tableofcontentsWord Embeddingen_US
dc.description.tableofcontentsWord2Vecen_US
dc.description.tableofcontentsGloVe: Global Vectors for Word Representationen_US
dc.description.tableofcontentsFastTexten_US
dc.description.tableofcontentsTransformer Based Sentence Embeddingen_US
dc.description.tableofcontentsActivation Functionsen_US
dc.description.tableofcontentsReLUen_US
dc.description.tableofcontentsHyperbolic Tangent (Tanh)en_US
dc.description.tableofcontentsSigmoiden_US
dc.description.tableofcontentsSoftmaxen_US
dc.description.tableofcontentsLoss Functionsen_US
dc.description.tableofcontentsCallback Functionsen_US
dc.description.tableofcontentsEarly Stoppingen_US
dc.description.tableofcontentsReduce Learning Rateen_US
dc.description.tableofcontentsModel Checkpointen_US
dc.description.tableofcontentsClassificationen_US
dc.description.tableofcontentsBiLSTM Networksen_US
dc.description.tableofcontentsBERT Transformeren_US
dc.description.tableofcontentsEXPERIMENTAL EVALUATIONSen_US
dc.description.tableofcontentsDatasetsen_US
dc.description.tableofcontentsSuicide Detection Dataseten_US
dc.description.tableofcontentsCEASEv2.0 Dataseten_US
dc.description.tableofcontentsSWMH Dataseten_US
dc.description.tableofcontentsEvaluation Metricsen_US
dc.description.tableofcontentsResults and Comparisonen_US
dc.description.tableofcontentsSuicideDetectionen_US
dc.description.tableofcontentsCEASEv2.0en_US
dc.description.tableofcontentsSWMHen_US
dc.description.tableofcontentsReview of methodologies for suicidal ideation detectionen_US
dc.description.tableofcontentsPreprocessing steps for each of the datasetsen_US
dc.description.tableofcontentsExample preprocessings for each dataseten_US
dc.description.tableofcontentsDifferences of Binary cross entropy and Sparse categorical cross entropyen_US
dc.description.tableofcontentsDetails of Experimented DL models for SuicideDetection dataseten_US
dc.description.tableofcontentsComparison and evaluation of ML models for SuicideDetection dataseten_US
dc.description.tableofcontentsDetails of Experimented DL models for CEASEv2.0 dataseten_US
dc.description.tableofcontentsComparison and evaluation of ML models for SWMH dataseten_US
dc.description.tableofcontentsComparison and evaluation of DL models for SWMH dataseten_US
dc.description.tableofcontentsBest proposed models for each of the dataseten_US
dc.description.tableofcontentsSimilarity review of different embedding techniquesen_US
dc.description.tableofcontentsSuicide rates between 15-29 age group (per 100.000 population)en_US
dc.description.tableofcontentsSuicide rates (per 100.000 population)en_US
dc.description.tableofcontentsRate of emergency department visits with suicidal ideation, by age group: United States, 2016–2020en_US
dc.description.tableofcontentsProposed Suicidal Ideation Detection Classifier Frameworken_US
dc.description.tableofcontentsReLU graphen_US
dc.description.tableofcontentsTanh graphen_US
dc.description.tableofcontentsSigmoid graphen_US
dc.description.tableofcontentsBiLSTM Network Structureen_US
dc.description.tableofcontentsSWMH Model Summaryen_US
dc.description.tableofcontentsOverview of SuicideDetection Dataseten_US
dc.description.tableofcontentsOverview of CEASEv2.0 Dataseten_US
dc.description.tableofcontentsOverview of SWMH Dataseten_US
dc.description.tableofcontentsConfusion Matrix for Binary Classificationen_US
dc.description.tableofcontentsAccuracy & Loss Graph of Best Proposed Model for SuicideDetection dataseten_US
dc.description.tableofcontentsProposed Model Architecture for SuicideDetection Dataseten_US
dc.description.tableofcontentsAccuracy & Loss Graph of Best Proposed Model for CEASEv2.0 dataseten_US
dc.description.tableofcontentsProposed Model Architecture for CEASEv2.0 Dataseten_US
dc.description.tableofcontentsProposed Model Architecture for SWMH Dataseten_US
dc.description.tableofcontentsWeight rates of each label on SWMHen_US
dc.description.tableofcontentsDistribution rates of each class label for SWMHen_US
dc.description.tableofcontentsWordCloud of SuicideDetection dataseten_US
dc.description.tableofcontentsWordCloud of CEASEv2.0 dataseten_US
dc.description.tableofcontentsWordCloud of SWMH dataseten_US
dc.description.tableofcontentsSentence Features of SuicideDetection Dataset (Non-suicidal - Suicidal)en_US
dc.description.tableofcontentsSentence Features of CEASEv2.0 Dataset (Non-suicidal – Suicidal)en_US
dc.language.isoenen_US
dc.publisherIşık Üniversitesien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectSuicidal ideation detectionen_US
dc.subjectSocial media contenten_US
dc.subjectWord embeddingen_US
dc.subjectDeep neural networken_US
dc.subjectBERT transformersen_US
dc.subjectİntihar düşüncesi tespitien_US
dc.subjectSosyal medya içeriğien_US
dc.subjectKelime temsilen_US
dc.subjectDerin sinir ağıen_US
dc.subjectBERT transformatörüen_US
dc.subject.lccRC569 .E94 2023
dc.subject.lcshSocial media and society.en_US
dc.subject.lcshSuicidal behavior -- Diagnosis.en_US
dc.subject.lcshSuicide -- Prevention.en_US
dc.subject.lcshDeep learning.en_US
dc.titleSuicidal ideation detection from social mediaen_US
dc.title.alternativeSosyal medya içeriğinden intihar düşüncesi algılamaen_US
dc.typeMaster Thesisen_US
dc.departmentIşık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.authorid0000-0002-7877-7528
dc.authorid0000-0002-7877-7528en_US
dc.relation.publicationcategoryTezen_US
dc.institutionauthorEzerceli, Özayen_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster

info:eu-repo/semantics/openAccess
Aksi belirtilmediği sürece bu öğenin lisansı: info:eu-repo/semantics/openAccess