Kamuya açık büyük dil modelleri ile bağlam duyarlı siber risk değerlendirmesi: uzman doğrulamalı bir çerçeve ve insan–yapay zekâ karşılaştırması
| dc.authorid | 0009-0009-4710-2569 | |
| dc.contributor.advisor | Çeliktaş, Barış | en_US |
| dc.contributor.author | Ünal, Nezih Mahmut | en_US |
| dc.contributor.other | Işık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Siber Güvenlik Yüksek Lisans Programı | en_US |
| dc.contributor.other | Işık University, School of Graduate Studies, Master’s Program in Cybersecurity | en_US |
| dc.date.accessioned | 2026-04-22T11:16:46Z | |
| dc.date.available | 2026-04-22T11:16:46Z | |
| dc.date.issued | 2026-01-19 | |
| dc.department | Işık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Siber Güvenlik Yüksek Lisans Programı | en_US |
| dc.department | Işık University, School of Graduate Studies, Master’s Program in Cybersecurity | en_US |
| dc.description | Text in Turkish ; Abstract: Turkish and English | en_US |
| dc.description | Includes bibliographical references (leaves 58-63) | en_US |
| dc.description | xiv, 71 leaves | en_US |
| dc.description.abstract | Geleneksel siber risk değerlendirme metodolojileri kritik bir ikilemle karşı karşıyadır: Bu yöntemler ya nicel ancak statik ve bağlamdan bağımsızdır (Örn: CVSS) ya da bağlama duyarlı ancak yoğun emek gerektiren ve özneldir (Örn: NIST SP 800-30). Sonuç olarak kuruluşlar, risk değerlendirme süreçlerini gelişen tehditlerin hızına uyum sağlayacak şekilde ölçeklendirmekte zorlanmaktadır. Bu çalışma; uzman bilgisini işlevsel hale getirmek amacıyla kamuya açık Büyük Dil Modellerinin (LLM) akıl yürütme yeteneklerinden yararlanan, otomatik ve bağlama duyarlı bir risk değerlendirme çerçevesi sunmaktadır. Karmaşık "kapalı kutu" (black-box) makine öğrenmesi modellerinin aksine, önerilen yaklaşım yapay zekanın akıl yürütme sürecini şeffaf bir Dinamik Metrik Motoruna dayandırmaktadır. Bu motorun ağırlıkları, 101 siber güvenlik profesyoneli ile gerçekleştirilen bir anket çalışmasından Sıralı Derece Ağırlık Merkezi (Rank Order Centroid - ROC) yöntemi kullanılarak elde edilmiştir. Geliştirilen çerçeve, 15 farklı gerçek dünya zafiyet senaryosu (C1--C15) ve üç ek duyarlılık stres testi (C16--C18) içeren karşılaştırmalı bir çalışma aracılığıyla değerlendirilmiştir. Doğrulama senaryoları, on kıdemli uzmandan oluşan bir grup ve iki modern LLM ajanı (GPT-4o ve Gemini 2.0 Flash) tarafından bağımsız olarak analiz edilmiştir. Elde edilen sonuçlar, LLM tabanlı ajanların oldukça güvenilir bir uzman temel çizgisine (Cronbach's α = 0,996) karşı, insan medyanıyla yakından uyumlu bir puanlama tutarlılığı (Pearson r değeri 0,9390 ile 0,9717 ; Spearman ρ değeri 0,8472 ile 0,9276 aralığında) sergilediğini göstermiştir. Ayrıca sistem, değerlendirme döngü süresini 100 kattan fazla azaltmıştır (vaka başına ortalama 6 dakikalık insan süresine karşı 4 saniyenin altı). Dahası, özel bir bağlam duyarlılık analizi (C13--C15); çerçevenin, özdeş teknik zafiyetler için risk skorlarını kurumsal bağlama (örneğin KOBİ'ye karşı Kritik Altyapı) göre uyarlayabildiğini kanıtlamıştır. Genel olarak bu bulgular, ticari olarak erişilebilen LLM'lerin uzmanlarca doğrulanmış metrik şemalarıyla sınırlandırıldığında; tekrarlanabilir, doğru ve gerçek zamanlı risk değerlendirmelerini destekleyebileceğini ortaya koymaktadır. | en_US |
| dc.description.abstract | Traditional cyber risk assessment methodologies face a critical dilemma: they are either quantitative yet static and context-agnostic (e.g., CVSS), or context-aware yet highly labor-intensive and subjective (e.g., NIST SP 800-30). Consequently, organizations struggle to scale risk assessment to match the pace of evolving threats. This paper presents an automated, context-aware risk assessment framework that leverages the reasoning capabilities of publicly available Large Language Models (LLMs) to operationalize expert knowledge. Unlike complex black-box machine learning models, our approach anchors the AI's reasoning to a transparent Dynamic Metric Engine, with weights derived using the Rank Order Centroid (ROC) method from a survey of 101 cybersecurity professionals. We evaluated the framework through a comparative study involving 15 diverse real-world vulnerability scenarios (C1--C15) and three supplementary sensitivity stress tests (C16--C18). The validation scenarios were independently assessed by a cohort of ten senior human experts and two stateof-the-art LLM agents (GPT-4o and Gemini 2.0 Flash). The results show that the LLM-driven agents achieve scoring consistency closely aligned with the human median (Pearson r ranging from 0.9390 to 0.9717, Spearman ρ from 0.8472 to 0.9276) against a highly reliable expert baseline (Cronbach's α=0.996$), while reducing the assessment cycle time by more than 100$\times$ (averaging under 4 seconds per case vs. a human average of 6 minutes). Furthermore, a dedicated context sensitivity analysis (C13--C15) indicates that the framework adapts risk scores based on organizational context (e.g., SME vs. Critical Infrastructure) for identical technical vulnerabilities. Overall, these findings suggest that commercially available LLMs, when constrained by expert-validated metric schemas, can support reproducible, accurate, and realtime risk assessments. | en_US |
| dc.description.tableofcontents | TANDART PUANLAMA METODOLOJİLERİ | en_US |
| dc.description.tableofcontents | GELENEKSEL RİSK DEĞERLENDİRME METODOLOJİLERİ | en_US |
| dc.description.tableofcontents | BAĞLAM TEMELLİ VE GÜNCEL YAKLAŞIMLAR | en_US |
| dc.description.tableofcontents | LİTERATÜRDEKİ EKSİKLİKLER VE ÖZGÜN KATKI | en_US |
| dc.description.tableofcontents | UZMAN GÖRÜŞÜNE DAYALI METRİK TASARIMI | en_US |
| dc.description.tableofcontents | PARAMETRE VE METRİK AĞIRLIKLARININ BELİRLENMESİ İÇİN ANKET TASARIMI | en_US |
| dc.description.tableofcontents | PARAMETRE GRUPLARI VE SIRALAMA DÜZENİ | en_US |
| dc.description.tableofcontents | METRİK (ALT PARAMETRE) PUANLAMA YÖNTEMİ VE MANTIĞI | en_US |
| dc.description.tableofcontents | AĞIRLIK TÜRETME YAKLAŞIMI | en_US |
| dc.description.tableofcontents | ROC Yöntemi ile Parametre Ağırlıklandırma (WF) | en_US |
| dc.description.tableofcontents | Deterministik Risk Puanı Hesaplaması | en_US |
| dc.description.tableofcontents | Alt Parametre Metrik Kalibrasyonu | en_US |
| dc.description.tableofcontents | OPERASYONEL SINIRLAR VE "ÖNCE GÜVENLİK" MODELLEME İLKELERİ | en_US |
| dc.description.tableofcontents | KATILIMCI DEMOGRAFİSİ VE UZMANLIK PROFİLİ | en_US |
| dc.description.tableofcontents | ETİK HUSUSLAR VE AYDINLATILMIŞ ONAM | en_US |
| dc.description.tableofcontents | ÖNERİLEN ÇERÇEVE MİMARİSİ | en_US |
| dc.description.tableofcontents | Genel Mimari | en_US |
| dc.description.tableofcontents | Veri Katmanı: Tanımlama ve Toplama | en_US |
| dc.description.tableofcontents | Besleme Katmanı: Doğrulama ve Normalizasyon | en_US |
| dc.description.tableofcontents | Hesaplama Katmanı: LLM Tabanlı Akıl Yürütme | en_US |
| dc.description.tableofcontents | Ön İşleme (Besleme Katmanı) | en_US |
| dc.description.tableofcontents | Bağlam Enjeksiyonu | en_US |
| dc.description.tableofcontents | YZ Akıl Yürütme ve İhtiyatlı Protokol | en_US |
| dc.description.tableofcontents | Çıktı ve Hesaplama | en_US |
| dc.description.tableofcontents | Değerlendirme Katmanı: Puanlama ve Önceliklendirme | en_US |
| dc.description.tableofcontents | Müdahale Katmanı: Yanıt ve Yönetişim | en_US |
| dc.description.tableofcontents | KARŞILAŞTIRMALI DOĞRULAMA: İNSAN UZMANLAR VE YZ AJANI PERFORMANSI | en_US |
| dc.description.tableofcontents | Deney Tasarımı ve Senaryo Bazlı Veri Kümesi | en_US |
| dc.description.tableofcontents | YZ Ajanının Yapılandırılması ve Sonuçların Tutarlılığı | en_US |
| dc.description.tableofcontents | Uzman Değerlendirme Temeli ve Ölçüm | en_US |
| dc.description.tableofcontents | Bağlamsal Değişkenlerin Etkisini Ölçen Kontrollü Deney (C13 - C15) | en_US |
| dc.description.tableofcontents | Ardışık Testlerde Üretilen Sonuçların Kararlılığı | en_US |
| dc.description.tableofcontents | Karşılaştırmalı Analizden Elde Edilen Temel Bulgular | en_US |
| dc.description.tableofcontents | YZ ve İnsan Kararlarındaki Puanlama Uyumu | en_US |
| dc.description.tableofcontents | Sonuçların İstatistiksel Bağıntısı ve Güvenilirlik Testleri | en_US |
| dc.description.tableofcontents | Tutarlılık ve Kararlılık | en_US |
| dc.description.tableofcontents | Operasyonel Verimlilik | en_US |
| dc.description.tableofcontents | Niteliksel Fark Analizi ve Anlamsal Çıkarım Kapasitesi | en_US |
| dc.description.tableofcontents | Kurumsal Bağlam Duyarlılığı ve Değişen Risk Algısı | en_US |
| dc.description.tableofcontents | Kontrol Önlemlerinin Etkisi ve Stres Testi Bulguları | en_US |
| dc.description.tableofcontents | Telafi Edici Kontrollerin Risk Puanına Etkisi | en_US |
| dc.description.tableofcontents | Algoritmik Sapmalar ve İyileştirme Stratejileri | en_US |
| dc.description.tableofcontents | Katmanlı Ayrıştırma ile Sorumlulukların Ayrılması | en_US |
| dc.description.tableofcontents | "Önce Güvenlik" Odaklı Sistematik Sapmanın Analizi | en_US |
| dc.description.tableofcontents | Bağlamsal Duyarlılık ve Matematiksel Risk Alt Sınırı | en_US |
| dc.description.tableofcontents | Yüksek Hassasiyetli ve Tekrarlanabilir Bulgular | en_US |
| dc.description.tableofcontents | Bulguların Yorunlanması: Hız ve Doğruluk | en_US |
| dc.description.tableofcontents | Sistem Şeffaflığında Uzman Doğrulamasının Payı | en_US |
| dc.identifier.citation | Ünal, N. M. (2026). Kamuya açık büyük dil modelleri ile bağlam duyarlı siber risk değerlendirmesi: uzman doğrulamalı bir çerçeve ve insan–yapay zekâ karşılaştırması. İstanbul: Işık Üniversitesi Lisansüstü Eğitim Enstitüsü. | en_US |
| dc.identifier.uri | https://hdl.handle.net/11729/7335 | |
| dc.institutionauthor | Ünal, Nezih Mahmut | en_US |
| dc.institutionauthorid | 0009-0009-4710-2569 | |
| dc.language.iso | tr | en_US |
| dc.publisher | Işık Üniversitesi, Lisansüstü Eğitim Enstitüsü | en_US |
| dc.relation.publicationcategory | Tez | en_US |
| dc.rights | info:eu-repo/semantics/openAccess | en_US |
| dc.subject | Siber risk değerlendirmesi | en_US |
| dc.subject | Büyük Dil Modelleri (LLM) | en_US |
| dc.subject | Sıralı Derece Ağırlık Merkezi (ROC) | en_US |
| dc.subject | Otomatik risk puanlama | en_US |
| dc.subject | İnsan-YZ karşılaştırması | en_US |
| dc.subject | Cyber risk assessment | en_US |
| dc.subject | Large Language Models (LLMs) | en_US |
| dc.subject | Generative AI | en_US |
| dc.subject | Automated risk scoring | en_US |
| dc.subject | Human-AI comparison | en_US |
| dc.title | Kamuya açık büyük dil modelleri ile bağlam duyarlı siber risk değerlendirmesi: uzman doğrulamalı bir çerçeve ve insan–yapay zekâ karşılaştırması | en_US |
| dc.title.alternative | LLM-assisted context-aware cyber risk assessment: an expert-calibrated framework and scoring | en_US |
| dc.type | Master Thesis | en_US |
| dspace.entity.type | Publication | en_US |
Dosyalar
Orijinal paket
1 - 1 / 1
Yükleniyor...
- İsim:
- Kamuya_acik_buyuk_dil_modelleri_ile_baglam_duyarli_siber_risk_degerlendirmesi_uzman_dogrulamali_bir_cerceve_ve_insan_yapay_zeka_karsilastirmasi.pdf
- Boyut:
- 2.73 MB
- Biçim:
- Adobe Portable Document Format
Lisans paketi
1 - 1 / 1
Küçük Resim Yok
- İsim:
- license.txt
- Boyut:
- 1.17 KB
- Biçim:
- Item-specific license agreed upon to submission
- Açıklama:












