Arama Sonuçları

Listeleniyor 1 - 10 / 13
  • Yayın
    İlişkisel veri tabanlarında mükerrer kayıtların makine öğrenmesiyle tespiti
    (Institute of Electrical and Electronics Engineers Inc., 2018-07-05) Bayrak, Ahmet Tuğrul; Yılmaz, Aykut İnan; Yılmaz, Kemal Burak; Düzağaç, Remzi; Yıldız, Olcay Taner
    Veri miktarının artışına paralel olarak, ilişkisel veri tabanlarında mükerrer kayıtlar da artmaktadır. Artan bu kayıtlar kullanıldıkları rapor veya analizlerde tutarsızlığa sebep olabilmektedir. Bu sorunu en aza indirgemek için yaptığımız çalışmada, kayıtların birbirlerine olan benzerlikleri ve alan uzmanlık bilgisiyle belirlenen ağırlıklar, öznitelik olarak kullanılarak makine öğrenmesi algoritmaları ile mükerrer kayıtların bulunması hedeflenmiştir. Yapılan işlem sonucunda 9301467 satır veride 28412 mükerrer çift tespit edilmiştir. Bulunan bu mükerrer kayıtlar veri kaynağından temizlenerek verinin daha tutarlı hale gelmesi sağlanmaktadır.
  • Yayın
    Comparison of Turkish proposition banks by frame matching
    (IEEE, 2018-12-06) Ak, Koray; Bakay, Özge; Yıldız, Olcay Taner
    By indicating semantic relations between a predicate and its associated participants in a sentence and identifying the role-bearing constituents, SRL provides an extensive dataset to understand natural languages and to enhance several NLP applications such as information retrieval, machine translation, information extraction, and question answering. The availability of large resources and the development of statistical machine learning methods have increased the studies in the field of SRL. One of the widely-used semantic resources applied for multiple languages is PropBank. In this paper, PropBanks applied for Turkish are compared by checking semantic roles in the frame files of matched verb senses. As this integrated lexical resource for Turkish is aimed to be used in a multilingual resource along with English, creation of an inclusive lexical resource for Turkish is of great importance.
  • Yayın
    Hotel sales forecasting with LSTM and N-BEATS
    (IEEE, 2023-09-15) Özçelik, Şuayb Talha; Tek, Faik Boray; Şekerci, Erdal
    Time series forecasting aims to model the change in data points over time. It is applicable in many areas, such as energy consumption, solid waste generation, economic indicators (inflation, currency), global warming (heat, water level), and hotel sales forecasting. This paper focuses on hotel sales forecasting with machine learning and deep learning solutions. A simple forecast solution is to repeat the last observation (Naive method) or the average of the past observations (Average method). More sophisticated solutions have been developed over the years, such as machine learning methods that have linear (Linear Regression, ARIMA) and nonlinear (Polynomial Regression and Support Vector Regression) methods. Different kinds of neural networks are developed and used in time series forecasting problems, and two of the successful ones are Recurrent Neural Networks and N-BEATS. This paper presents a forecasting analysis of hotel sales from Türkiye and Cyprus. We showed that N-BEATS is a solid choice against LSTM, especially in long sequences. Moreover, N-BEATS has slightly better inference time results in long sequences, but LSTM is faster in short sequences.
  • Yayın
    Convolutional neural network (CNN) algorithm based facial emotion recognition (FER) system for FER-2013 dataset
    (IEEE, 2022-11-18) Ezerceli, Özay; Eskil, Mustafa Taner
    Facial expression recognition (FER) is the key to understanding human emotions and feelings. It is an active area of research since human thoughts can be collected, processed, and used in customer satisfaction, politics, and medical domains. Automated FER systems had been developed and have been used to recognize humans’ emotions but it has been a quite challenging problem in machine learning due to the high intra-class variation. The first models were using known methods such as Support Vector Machines (SVM), Bayes classifier, Fuzzy Techniques, Feature Selection, Artificial Neural Networks (ANN) in their models but still, some limitations affect the accuracy critically such as subjectivity, occlusion, pose, low resolution, scale, illumination variation, etc. The ability of CNN boosts FER accuracy. Deep learning algorithms have emerged as the greatest way to produce the best results in FER in recent years. Various datasets were used to train, test, and validate the models. FER2013, CK+, JAFFE and FERG are some of the most popular datasets. To improve the accuracy of FER models, one dataset or a mix of datasets has been employed. Every dataset includes limitations and issues that have an impact on the model that is trained for it. As a solution to this problem, our state-of-the-art model based on deep learning architectures, particularly convolutional neural network architectures (CNN) with supportive techniques has been implemented. The proposed model achieved 93.7% accuracy with the combination of FER2013 and CK+ datasets for FER2013.
  • Yayın
    An incremental model selection algorithm based on cross-validation for finding the architecture of a Hidden Markov model on hand gesture data sets
    (IEEE, 2009-12-13) Ulaş, Aydın; Yıldız, Olcay Taner
    In a multi-parameter learning problem, besides choosing the architecture of the learner, there is the problem of finding the optimal parameters to get maximum performance. When the number of parameters to be tuned increases, it becomes infeasible to try all the parameter sets, hence we need an automatic mechanism to find the optimum parameter setting using computationally feasible algorithms. In this paper, we define the problem of optimizing the architecture of a Hidden Markov Model (HMM) as a state space search and propose the MSUMO (Model Selection Using Multiple Operators) framework that incrementally modifies the structure and checks for improvement using cross-validation. There are five variants that use forward/backward search, single/multiple operators, and depth-first/breadth-first search. On four hand gesture data sets, we compare the performance of MSUMO with the optimal parameter set found by exhaustive search in terms of expected error and computational complexity.
  • Yayın
    Subset selection for tuning of hyper-parameters in artificial neural networks
    (IEEE, 2017) Aki, K.K.Emre; Erkoç, Tuğba; Eskil, Mustafa Taner
    Hyper-parameters of a machine learning architecture define its design. Tuning of hyper-parameters is costly and for large data sets outright impractical, whether it is performed manually or algorithmically. In this study we propose a Neocognitron based method for reducing the training set to a fraction, while keeping the dynamics and complexity of the domain. Our approach does not require processing of the entire training set, making it feasible for larger data sets. In our experiments we could successfully reduce the MNIST training data set to less than 2.5% (1,489 images) by processing less than 10% of the 60K images. We showed that the reduced data set can be used for tuning of number of hidden neurons in a multi-layer perceptron.
  • Yayın
    Aynı oteli temsil eden farklı kayıtlar için akıllı eşleştirme
    (Institute of Electrical and Electronics Engineers Inc., 2019-09) Bayrak, Ahmet Tuğrul; Özbek, Eyüp Erkan; Kestepe, Sedat; Yıldız, Olcay Taner
    Otel sayısının her geçen gün arttığı turizm sektöründe, aracı firmaların tüm oteller ile ayrı ayrı çalışma imkanı bulunmadığından, firmalar dünya üzerinde bir çok otelle anlaşması bulunan servis sağlayıcılarıyla beraber çalışmaktadır. Farklı servis sağlayıcılarından alınan otel kayıtlarında tekrarlayan otel verileri olabilmektedir. Tekrarlayan bu kayıtlar aynı bilgilere sahip olabileceği gibi, farklı bilgilere sahip olmasına rağmen aynı oteli temsil edebilmektedir. Otel verilerini tutarlı hale getirmek için aynı oteli temsil eden kayıtlar eşleştirilmelidir. Bu amaçla, otel kayıtları üzerinde çalışılarak, adres zenginleştirmesi ve ön işleme yapılan aday kayıtlar için kategorik ve görsel verilerin benzerliklerinin kullanıldığı makine öğrenmesi algoritmaları uygulanmıştır. Yapılan işlem sonucunda, 132.287 satırlık otel verisinde 14.985 adet otel %99,12 doğruluk oranı ile eşleştirilmiştir.
  • Yayın
    Doğrudan pazarlama amaçlı hedef kitle analizi
    (Institute of Electrical and Electronics Engineers Inc., 2018-07-05) Kegeci, Sinan; Özbek, Eyüp Erkan; Türkel, Mustafa Sertaç; Düzağaç, Remzi; Yıldız, Olcay Taner
    Doğrudan pazarlama, uygun ürünleri uygun kişilerle en kısa yoldan buluşturma sürecidir. Son yılların en popüler pazarlama yaklaşımlarından birisidir. Bu çalışmada turizm sektörüne ait isimsizleştirilmiş bir veri tabanını kullandık. Bir otel zinciri için yapılan kampanya kapsamında veri madenciliği tekniklerini uygulayarak hedef kitle seçimi yaptık. Çalışmada birçok makine öğrenmesi yöntemini denedik. Sonuç olarak; geçmişte yapılan ve herhangi bir makine öğrenmesi yöntemi kullanılmadan hazırlanan kampanya sonuçlarına göre daha iyi sonuçlar elde ederken benzer analizlerde kullanılabilecek bir altyapı oluşturmuş olduk.
  • Yayın
    Assessing dyslexia with machine learning: a pilot study utilizing Google ML Kit
    (IEEE, 2023-12-19) Eroğlu, Günet; Harb, Mhd Raja Abou
    In this study, we explore the application of Google ML Kit, a machine learning development kit, for dyslexia detection in the Turkish language. We collected face-tracking data from two groups: 49 dyslexic children and 22 typically developing children. Using Google ML Kit and other machine learning algorithms based on eye-tracking data, we compared their performance in dyslexia detection. Our findings reveal that Google ML Kit achieved the highest accuracy among the tested methods. This study underscores the potential of machine learning-based dyslexia detection and its practicality in academic and clinical settings.
  • Yayın
    Mikro ölçekli hisselerde anormal fiyat hareketlerinin LSTM ile tahmini
    (Institute of Electrical and Electronics Engineers Inc., 2025-08-15) Recal, Füsun; Kayaçetin, Nuri Volkan; Kayahan, İsmail
    Bireysel yatırımcıların karar alma süreçlerinde gözlemlenen aşırı iyimserlik, sürü psikolojisi ve yakın geçmişteki performansa aşırı tepki gibi davranışsal eğilimler dar yatırımcı tabanları ve düşük likiditeleri nedeniyle arbitraj mekanizmasının göreceli olarak zor işlediği mikro ölçekli hisselerin değerlerini makul ekonomik temellerden koparabilir. Bu çalışmada, bu tip davranışsal eğilimlerin hisse fiyatı ve işlem hacmi üzerinde belli örüntüler bırakacağı fikrinden yola çıkılarak, Borsa İstanbul’da işlem gören mikro ölçek hisselerdeki anormal fiyat ayrışmalarını, geçmiş fiyat ve hacim bazlı değişkenler yardımıyla tahmin eden bir LSTM modeli geliştirilmiştir. İncelenen hisselerin yarısından çoğunda modelden elde edilen tahminler gerçekleşen getirilerle pozitif ve istatistiksel olarak anlamlı bir ilişki içindedir. Sonuçlar, mikro ölçekli hisselerdeki fiyat ayrışmalarının geçmiş fiyat ve hacim verisiyle kısmen de olsa açıklanabildiğini göstermektedir.