Arama Sonuçları

Listeleniyor 1 - 5 / 5
  • Yayın
    İlişkisel veri tabanlarında mükerrer kayıtların makine öğrenmesiyle tespiti
    (Institute of Electrical and Electronics Engineers Inc., 2018-07-05) Bayrak, Ahmet Tuğrul; Yılmaz, Aykut İnan; Yılmaz, Kemal Burak; Düzağaç, Remzi; Yıldız, Olcay Taner
    Veri miktarının artışına paralel olarak, ilişkisel veri tabanlarında mükerrer kayıtlar da artmaktadır. Artan bu kayıtlar kullanıldıkları rapor veya analizlerde tutarsızlığa sebep olabilmektedir. Bu sorunu en aza indirgemek için yaptığımız çalışmada, kayıtların birbirlerine olan benzerlikleri ve alan uzmanlık bilgisiyle belirlenen ağırlıklar, öznitelik olarak kullanılarak makine öğrenmesi algoritmaları ile mükerrer kayıtların bulunması hedeflenmiştir. Yapılan işlem sonucunda 9301467 satır veride 28412 mükerrer çift tespit edilmiştir. Bulunan bu mükerrer kayıtlar veri kaynağından temizlenerek verinin daha tutarlı hale gelmesi sağlanmaktadır.
  • Yayın
    Aynı oteli temsil eden farklı kayıtlar için akıllı eşleştirme
    (Institute of Electrical and Electronics Engineers Inc., 2019-09) Bayrak, Ahmet Tuğrul; Özbek, Eyüp Erkan; Kestepe, Sedat; Yıldız, Olcay Taner
    Otel sayısının her geçen gün arttığı turizm sektöründe, aracı firmaların tüm oteller ile ayrı ayrı çalışma imkanı bulunmadığından, firmalar dünya üzerinde bir çok otelle anlaşması bulunan servis sağlayıcılarıyla beraber çalışmaktadır. Farklı servis sağlayıcılarından alınan otel kayıtlarında tekrarlayan otel verileri olabilmektedir. Tekrarlayan bu kayıtlar aynı bilgilere sahip olabileceği gibi, farklı bilgilere sahip olmasına rağmen aynı oteli temsil edebilmektedir. Otel verilerini tutarlı hale getirmek için aynı oteli temsil eden kayıtlar eşleştirilmelidir. Bu amaçla, otel kayıtları üzerinde çalışılarak, adres zenginleştirmesi ve ön işleme yapılan aday kayıtlar için kategorik ve görsel verilerin benzerliklerinin kullanıldığı makine öğrenmesi algoritmaları uygulanmıştır. Yapılan işlem sonucunda, 132.287 satırlık otel verisinde 14.985 adet otel %99,12 doğruluk oranı ile eşleştirilmiştir.
  • Yayın
    Doğrudan pazarlama amaçlı hedef kitle analizi
    (Institute of Electrical and Electronics Engineers Inc., 2018-07-05) Kegeci, Sinan; Özbek, Eyüp Erkan; Türkel, Mustafa Sertaç; Düzağaç, Remzi; Yıldız, Olcay Taner
    Doğrudan pazarlama, uygun ürünleri uygun kişilerle en kısa yoldan buluşturma sürecidir. Son yılların en popüler pazarlama yaklaşımlarından birisidir. Bu çalışmada turizm sektörüne ait isimsizleştirilmiş bir veri tabanını kullandık. Bir otel zinciri için yapılan kampanya kapsamında veri madenciliği tekniklerini uygulayarak hedef kitle seçimi yaptık. Çalışmada birçok makine öğrenmesi yöntemini denedik. Sonuç olarak; geçmişte yapılan ve herhangi bir makine öğrenmesi yöntemi kullanılmadan hazırlanan kampanya sonuçlarına göre daha iyi sonuçlar elde ederken benzer analizlerde kullanılabilecek bir altyapı oluşturmuş olduk.
  • Yayın
    An intrusion detection approach based on the combination of oversampling and undersampling algorithms
    (Istanbul University Press, 2023-06-14) Arık, Ahmet Okan; Çavdaroğlu, Gülsüm Çiğdem
    The threat of network intrusion has become much more severe due to the increasing network flow. Therefore, network intrusion detection is one of the most concerned areas of network security. As demand for cybersecurity assurance increases, the requirement for intrusion detection systems to meet current threats is also growing. However, network-based intrusion detection systems have several shortcomings due to the structure of the systems, the nature of the network data, and uncertainty related to future data. The imbalanced class problem is also crucial since it significantly negatively affects classification performance. Although high performance has been achieved in deep learning-based methodologies in recent years, machine learning techniques may also provide high performance in network intrusion detection. This study suggests a new intrusion detection system called ROGONG-IDS (Robust Gradient Boosting – Intrusion Detection System) which has a unique two-stage resampling model to solve the imbalanced class problem that produces high accuracy on the UNSW-NB15 dataset using machine learning techniques. ROGONGIDS is based on gradient boosting. The system uses Synthetic Minority Over-Sampling Technique (SMOTE) and NearMiss-1 methods to handle the imbalanced class problem. The proposed model's performance on multi-class classification was tested with the UNSW-NB15, and then its robust structure was validated with the NSL-KDD dataset. ROGONG-IDS reached the highest attack detection rate and F1 score in the literature, with a 97.30% detection rate and 97.65% F1 score using the UNSW-NB15 dataset. ROGONG-IDS provides a robust, efficient intrusion detection system for the UNSW-NB15 dataset, which suffered from imbalanced class distribution. The proposed methodology outperforms state-of-the-art and intrusion detection methods.
  • Yayın
    Mikro ölçekli hisselerde anormal fiyat hareketlerinin LSTM ile tahmini
    (Institute of Electrical and Electronics Engineers Inc., 2025-08-15) Recal, Füsun; Kayaçetin, Nuri Volkan; Kayahan, İsmail
    Bireysel yatırımcıların karar alma süreçlerinde gözlemlenen aşırı iyimserlik, sürü psikolojisi ve yakın geçmişteki performansa aşırı tepki gibi davranışsal eğilimler dar yatırımcı tabanları ve düşük likiditeleri nedeniyle arbitraj mekanizmasının göreceli olarak zor işlediği mikro ölçekli hisselerin değerlerini makul ekonomik temellerden koparabilir. Bu çalışmada, bu tip davranışsal eğilimlerin hisse fiyatı ve işlem hacmi üzerinde belli örüntüler bırakacağı fikrinden yola çıkılarak, Borsa İstanbul’da işlem gören mikro ölçek hisselerdeki anormal fiyat ayrışmalarını, geçmiş fiyat ve hacim bazlı değişkenler yardımıyla tahmin eden bir LSTM modeli geliştirilmiştir. İncelenen hisselerin yarısından çoğunda modelden elde edilen tahminler gerçekleşen getirilerle pozitif ve istatistiksel olarak anlamlı bir ilişki içindedir. Sonuçlar, mikro ölçekli hisselerdeki fiyat ayrışmalarının geçmiş fiyat ve hacim verisiyle kısmen de olsa açıklanabildiğini göstermektedir.