Kamuya açık büyük dil modelleri ile bağlam duyarlı siber risk değerlendirmesi: uzman doğrulamalı bir çerçeve ve insan–yapay zekâ karşılaştırması

Ünal, Nezih Mahmut

Kamuya açık büyük dil modelleri ile bağlam duyarlı siber risk değerlendirmesi: uzman doğrulamalı bir çerçeve ve insan–yapay zekâ karşılaştırması

dc.authorid	0009-0009-4710-2569
dc.contributor.advisor	Çeliktaş, Barış	en_US
dc.contributor.author	Ünal, Nezih Mahmut	en_US
dc.contributor.other	Işık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Siber Güvenlik Yüksek Lisans Programı	en_US
dc.contributor.other	Işık University, School of Graduate Studies, Master’s Program in Cybersecurity	en_US
dc.date.accessioned	2026-04-22T11:16:46Z
dc.date.available	2026-04-22T11:16:46Z
dc.date.issued	2026-01-19
dc.department	Işık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Siber Güvenlik Yüksek Lisans Programı	en_US
dc.department	Işık University, School of Graduate Studies, Master’s Program in Cybersecurity	en_US
dc.description	Text in Turkish ; Abstract: Turkish and English	en_US
dc.description	Includes bibliographical references (leaves 58-63)	en_US
dc.description	xiv, 71 leaves	en_US
dc.description.abstract	Geleneksel siber risk değerlendirme metodolojileri kritik bir ikilemle karşı karşıyadır: Bu yöntemler ya nicel ancak statik ve bağlamdan bağımsızdır (Örn: CVSS) ya da bağlama duyarlı ancak yoğun emek gerektiren ve özneldir (Örn: NIST SP 800-30). Sonuç olarak kuruluşlar, risk değerlendirme süreçlerini gelişen tehditlerin hızına uyum sağlayacak şekilde ölçeklendirmekte zorlanmaktadır. Bu çalışma; uzman bilgisini işlevsel hale getirmek amacıyla kamuya açık Büyük Dil Modellerinin (LLM) akıl yürütme yeteneklerinden yararlanan, otomatik ve bağlama duyarlı bir risk değerlendirme çerçevesi sunmaktadır. Karmaşık "kapalı kutu" (black-box) makine öğrenmesi modellerinin aksine, önerilen yaklaşım yapay zekanın akıl yürütme sürecini şeffaf bir Dinamik Metrik Motoruna dayandırmaktadır. Bu motorun ağırlıkları, 101 siber güvenlik profesyoneli ile gerçekleştirilen bir anket çalışmasından Sıralı Derece Ağırlık Merkezi (Rank Order Centroid - ROC) yöntemi kullanılarak elde edilmiştir. Geliştirilen çerçeve, 15 farklı gerçek dünya zafiyet senaryosu (C1--C15) ve üç ek duyarlılık stres testi (C16--C18) içeren karşılaştırmalı bir çalışma aracılığıyla değerlendirilmiştir. Doğrulama senaryoları, on kıdemli uzmandan oluşan bir grup ve iki modern LLM ajanı (GPT-4o ve Gemini 2.0 Flash) tarafından bağımsız olarak analiz edilmiştir. Elde edilen sonuçlar, LLM tabanlı ajanların oldukça güvenilir bir uzman temel çizgisine (Cronbach's α = 0,996) karşı, insan medyanıyla yakından uyumlu bir puanlama tutarlılığı (Pearson r değeri 0,9390 ile 0,9717 ; Spearman ρ değeri 0,8472 ile 0,9276 aralığında) sergilediğini göstermiştir. Ayrıca sistem, değerlendirme döngü süresini 100 kattan fazla azaltmıştır (vaka başına ortalama 6 dakikalık insan süresine karşı 4 saniyenin altı). Dahası, özel bir bağlam duyarlılık analizi (C13--C15); çerçevenin, özdeş teknik zafiyetler için risk skorlarını kurumsal bağlama (örneğin KOBİ'ye karşı Kritik Altyapı) göre uyarlayabildiğini kanıtlamıştır. Genel olarak bu bulgular, ticari olarak erişilebilen LLM'lerin uzmanlarca doğrulanmış metrik şemalarıyla sınırlandırıldığında; tekrarlanabilir, doğru ve gerçek zamanlı risk değerlendirmelerini destekleyebileceğini ortaya koymaktadır.	en_US
dc.description.abstract	Traditional cyber risk assessment methodologies face a critical dilemma: they are either quantitative yet static and context-agnostic (e.g., CVSS), or context-aware yet highly labor-intensive and subjective (e.g., NIST SP 800-30). Consequently, organizations struggle to scale risk assessment to match the pace of evolving threats. This paper presents an automated, context-aware risk assessment framework that leverages the reasoning capabilities of publicly available Large Language Models (LLMs) to operationalize expert knowledge. Unlike complex black-box machine learning models, our approach anchors the AI's reasoning to a transparent Dynamic Metric Engine, with weights derived using the Rank Order Centroid (ROC) method from a survey of 101 cybersecurity professionals. We evaluated the framework through a comparative study involving 15 diverse real-world vulnerability scenarios (C1--C15) and three supplementary sensitivity stress tests (C16--C18). The validation scenarios were independently assessed by a cohort of ten senior human experts and two stateof-the-art LLM agents (GPT-4o and Gemini 2.0 Flash). The results show that the LLM-driven agents achieve scoring consistency closely aligned with the human median (Pearson r ranging from 0.9390 to 0.9717, Spearman ρ from 0.8472 to 0.9276) against a highly reliable expert baseline (Cronbach's α=0.996$), while reducing the assessment cycle time by more than 100$\times$ (averaging under 4 seconds per case vs. a human average of 6 minutes). Furthermore, a dedicated context sensitivity analysis (C13--C15) indicates that the framework adapts risk scores based on organizational context (e.g., SME vs. Critical Infrastructure) for identical technical vulnerabilities. Overall, these findings suggest that commercially available LLMs, when constrained by expert-validated metric schemas, can support reproducible, accurate, and realtime risk assessments.	en_US
dc.description.tableofcontents	TANDART PUANLAMA METODOLOJİLERİ	en_US
dc.description.tableofcontents	GELENEKSEL RİSK DEĞERLENDİRME METODOLOJİLERİ	en_US
dc.description.tableofcontents	BAĞLAM TEMELLİ VE GÜNCEL YAKLAŞIMLAR	en_US
dc.description.tableofcontents	LİTERATÜRDEKİ EKSİKLİKLER VE ÖZGÜN KATKI	en_US
dc.description.tableofcontents	UZMAN GÖRÜŞÜNE DAYALI METRİK TASARIMI	en_US
dc.description.tableofcontents	PARAMETRE VE METRİK AĞIRLIKLARININ BELİRLENMESİ İÇİN ANKET TASARIMI	en_US
dc.description.tableofcontents	PARAMETRE GRUPLARI VE SIRALAMA DÜZENİ	en_US
dc.description.tableofcontents	METRİK (ALT PARAMETRE) PUANLAMA YÖNTEMİ VE MANTIĞI	en_US
dc.description.tableofcontents	AĞIRLIK TÜRETME YAKLAŞIMI	en_US
dc.description.tableofcontents	ROC Yöntemi ile Parametre Ağırlıklandırma (WF)	en_US
dc.description.tableofcontents	Deterministik Risk Puanı Hesaplaması	en_US
dc.description.tableofcontents	Alt Parametre Metrik Kalibrasyonu	en_US
dc.description.tableofcontents	OPERASYONEL SINIRLAR VE "ÖNCE GÜVENLİK" MODELLEME İLKELERİ	en_US
dc.description.tableofcontents	KATILIMCI DEMOGRAFİSİ VE UZMANLIK PROFİLİ	en_US
dc.description.tableofcontents	ETİK HUSUSLAR VE AYDINLATILMIŞ ONAM	en_US
dc.description.tableofcontents	ÖNERİLEN ÇERÇEVE MİMARİSİ	en_US
dc.description.tableofcontents	Genel Mimari	en_US
dc.description.tableofcontents	Veri Katmanı: Tanımlama ve Toplama	en_US
dc.description.tableofcontents	Besleme Katmanı: Doğrulama ve Normalizasyon	en_US
dc.description.tableofcontents	Hesaplama Katmanı: LLM Tabanlı Akıl Yürütme	en_US
dc.description.tableofcontents	Ön İşleme (Besleme Katmanı)	en_US
dc.description.tableofcontents	Bağlam Enjeksiyonu	en_US
dc.description.tableofcontents	YZ Akıl Yürütme ve İhtiyatlı Protokol	en_US
dc.description.tableofcontents	Çıktı ve Hesaplama	en_US
dc.description.tableofcontents	Değerlendirme Katmanı: Puanlama ve Önceliklendirme	en_US
dc.description.tableofcontents	Müdahale Katmanı: Yanıt ve Yönetişim	en_US
dc.description.tableofcontents	KARŞILAŞTIRMALI DOĞRULAMA: İNSAN UZMANLAR VE YZ AJANI PERFORMANSI	en_US
dc.description.tableofcontents	Deney Tasarımı ve Senaryo Bazlı Veri Kümesi	en_US
dc.description.tableofcontents	YZ Ajanının Yapılandırılması ve Sonuçların Tutarlılığı	en_US
dc.description.tableofcontents	Uzman Değerlendirme Temeli ve Ölçüm	en_US
dc.description.tableofcontents	Bağlamsal Değişkenlerin Etkisini Ölçen Kontrollü Deney (C13 - C15)	en_US
dc.description.tableofcontents	Ardışık Testlerde Üretilen Sonuçların Kararlılığı	en_US
dc.description.tableofcontents	Karşılaştırmalı Analizden Elde Edilen Temel Bulgular	en_US
dc.description.tableofcontents	YZ ve İnsan Kararlarındaki Puanlama Uyumu	en_US
dc.description.tableofcontents	Sonuçların İstatistiksel Bağıntısı ve Güvenilirlik Testleri	en_US
dc.description.tableofcontents	Tutarlılık ve Kararlılık	en_US
dc.description.tableofcontents	Operasyonel Verimlilik	en_US
dc.description.tableofcontents	Niteliksel Fark Analizi ve Anlamsal Çıkarım Kapasitesi	en_US
dc.description.tableofcontents	Kurumsal Bağlam Duyarlılığı ve Değişen Risk Algısı	en_US
dc.description.tableofcontents	Kontrol Önlemlerinin Etkisi ve Stres Testi Bulguları	en_US
dc.description.tableofcontents	Telafi Edici Kontrollerin Risk Puanına Etkisi	en_US
dc.description.tableofcontents	Algoritmik Sapmalar ve İyileştirme Stratejileri	en_US
dc.description.tableofcontents	Katmanlı Ayrıştırma ile Sorumlulukların Ayrılması	en_US
dc.description.tableofcontents	"Önce Güvenlik" Odaklı Sistematik Sapmanın Analizi	en_US
dc.description.tableofcontents	Bağlamsal Duyarlılık ve Matematiksel Risk Alt Sınırı	en_US
dc.description.tableofcontents	Yüksek Hassasiyetli ve Tekrarlanabilir Bulgular	en_US
dc.description.tableofcontents	Bulguların Yorunlanması: Hız ve Doğruluk	en_US
dc.description.tableofcontents	Sistem Şeffaflığında Uzman Doğrulamasının Payı	en_US
dc.identifier.citation	Ünal, N. M. (2026). Kamuya açık büyük dil modelleri ile bağlam duyarlı siber risk değerlendirmesi: uzman doğrulamalı bir çerçeve ve insan–yapay zekâ karşılaştırması. İstanbul: Işık Üniversitesi Lisansüstü Eğitim Enstitüsü.	en_US
dc.identifier.uri	https://hdl.handle.net/11729/7335
dc.institutionauthor	Ünal, Nezih Mahmut	en_US
dc.institutionauthorid	0009-0009-4710-2569
dc.language.iso	tr	en_US
dc.publisher	Işık Üniversitesi, Lisansüstü Eğitim Enstitüsü	en_US
dc.relation.publicationcategory	Tez	en_US
dc.rights	info:eu-repo/semantics/openAccess	en_US
dc.subject	Siber risk değerlendirmesi	en_US
dc.subject	Büyük Dil Modelleri (LLM)	en_US
dc.subject	Sıralı Derece Ağırlık Merkezi (ROC)	en_US
dc.subject	Otomatik risk puanlama	en_US
dc.subject	İnsan-YZ karşılaştırması	en_US
dc.subject	Cyber risk assessment	en_US
dc.subject	Large Language Models (LLMs)	en_US
dc.subject	Generative AI	en_US
dc.subject	Automated risk scoring	en_US
dc.subject	Human-AI comparison	en_US
dc.title	Kamuya açık büyük dil modelleri ile bağlam duyarlı siber risk değerlendirmesi: uzman doğrulamalı bir çerçeve ve insan–yapay zekâ karşılaştırması	en_US
dc.title.alternative	LLM-assisted context-aware cyber risk assessment: an expert-calibrated framework and scoring	en_US
dc.type	Master Thesis	en_US
dspace.entity.type	Publication	en_US

Dosyalar

Orijinal paket

Listeleniyor 1 - 1 / 1

İsim:: Kamuya_acik_buyuk_dil_modelleri_ile_baglam_duyarli_siber_risk_degerlendirmesi_uzman_dogrulamali_bir_cerceve_ve_insan_yapay_zeka_karsilastirmasi.pdf
Boyut:: 2.73 MB
Biçim:: Adobe Portable Document Format

İndir

Lisans paketi

Listeleniyor 1 - 1 / 1

İsim:: license.txt
Boyut:: 1.17 KB
Biçim:: Item-specific license agreed upon to submission
Açıklama:

İndir

Koleksiyon

Lisansüstü Eğitim Enstitüsü Tez Koleksiyonu