Arama Sonuçları

Listeleniyor 1 - 10 / 10
  • Yayın
    Çok-hipotezli süperpikseller ile sahne bölütleme ve etiketleme
    (IEEE, 2015-06-19) Ak, Kenan Emir; Ateş, Hasan Fehmi
    Süperpikseller son zamanlarda imge bölütleme ve sınıflandırma problemlerinde giderek önem kazanmaktadır. Sahne etiketlemede imge öncelikle bir süperpiksel algoritması ile görsel olarak tutarlı küçük parçalara bölütlenmekte; daha sonra süperpikseller farklı sınıflara ayrı¸stırılmaktadır. Sınıflandırma performansı kullanılan süperpiksel algoritmasının özellikleri ve parametre ayarlarından önemli ölçüde etkilenmektedir. Bu bildiride sahne etiketleme doğruluğunu iyileştirmek için birden fazla süperpiksel bölütleme sonucunu sınıflandırıcı seviyesinde kaynaştıran bir yöntem önerilmiştir. Öncelikle basit, parametrik olmayan ve eğitim gerektirmeyen SuperParsing algoritması kullanılarak süperpiksel etiketleri için olabilirlik oranları tespit edilir. Daha sonra alternatif süperpiksel bölütleme senaryoları için hesaplanan olabilirlik oranları piksel seviyesinde kaynaştırılarak, ilgili sahnenin bölütlenmesi ve etiketlenmesi tamamlanır. Önerilen yöntem 2,688 imge ve 33 etiket içeren SIFT Flow veri kümesi üzerinde test edilmiş ve SuperParsing’den daha yüksek sınıflandırma doğruluğu elde edilmiştir.
  • Yayın
    A haar classifier based call number detection and counting method for library books
    (IEEE, 2018-12-06) Kanburoğlu, Ali Buğra; Tek, Faik Boray
    Counting and organization of books in libraries is a routine and time-consuming task The task gets more complicated by misplaced books in shelves. In order to solve these problems, we propose an automated visual call number (book-id) detection and counting system in this paper. The method employs a Haar feature-based classifier from OpenCV library and cloud-based OCR system to decode characters from images. To develop and test the method, we have acquired and organized a dataset of 1000 book call numbers. The proposed method has been tested on 20 bookshelves images that contain 233 call numbers, which resulted in a true detection rate of 96% and false detection rate of 1.75 per image. For OCR step, the number of false recognized characters per call number was 0.76.
  • Yayın
    Bir otomatik hedef tanıma algoritmasının geliştirilmesi
    (IEEE, 2013-04-24) Aldemir, Erdoğan; Yıldız, Nerhun; Tavşanoğlu, Ahmet Vedat
    Bu bildiri kapsamında bir Otomatik Hedef Tanıma (OHT) sistemi ele alınarak geliştirilmiş ve geliştirilen sistemin Matlab benzetimleri bildiride sunulmuştur. İkinci olarak OHT sistemlerinde kullanılan ve literatürde sıkça karşılaşılan klasik kenar belirleme algoritmalarının dışında yeni bir kenar belirleme algoritması önerilmiştir. Son olarak da Freeman zincir kodlamasının özellik çıkartma aşamasında kullanılabileceği gösterilmiştir. İlgili sistemin sınıflandırma ve karar verme aşaması hariç tamamı değişik test görüntüleri üzerinde denenmiş ve insan gözüne hitap edebilecek seviyede başarılı sonuçlar elde edilmiştir. İleride sınıflandırma aşamasının da gerçeklenmesi ile tasarlanan OHT sisteminin başarımının daha tarafsız bir ölçüt ile test edilmesi hedeflenmektedir. Ayrıca sistemin donanıma yönelik olarak optimizasyonu ile bir Field Programmable Gate Array (FPGA) gerçeklemesinin yapılması hedefler arasındadır.
  • Yayın
    VİSKON-RS : Uzaktan algılama ile hızlı afet hasar analiz yazılımı
    (IEEE, 2015-06-19) Kahraman, Fatih; İmamoğlu, Mümin; Özcan, Büşra Yüksel; Huruoğlu, Cengiz; Alasağ, Tolga; Gemici, Ömer Faruk; Hocaoğlu, Muhammet A.; Ateş, Hasan Fehmi
    Afet sonrası, acil müdahale ekiplerinin yönlendirilmesi ve iyileştirme çalışmalarının planlanması amacıyla hızlı hasar değerlendirmesine ihtiyaç duyulmaktadır. Bu çalışmada, AFAD ihtiyaçları doğrultusunda uzaktan (uzay/hava) algılama teknolojileri ile elde edilen görüntülerin afet hasar analizinde kullanılmasına yönelik VİSKON-RS yazılımı geliştirilmiştir. Geliştirilen yazılım; deprem, sel ve orman yangını gibi afet türlerinin hasar analizlerine özelleşmiş uygulamalar içermektedir. Ayrıca genel görüntü analizinde kullanılabilecek değişiklik analizi, eğitimli/eğitimsiz sınıflandırma, nesne tabanlı görüntü analizi ve doku analizi gibi uygulamalar yazılıma entegre edilmiştir. VİSKON-RS yazılımın temel amacı, afet sonrası uzaktan algılama verilerinin, açılması, işlenmesi, analiz edilmesi, sonuçların sergilenmesi ve karar destek sistemlerine aktarılması adımlarını içeren bütünleşik bir yazılım çözümü sunmaktır.
  • Yayın
    Derin öznitelikler ile anlambilimsel görüntü bölütleme
    (Institute of Electrical and Electronics Engineers Inc., 2018-07-05) Sünetci, Sercan; Ateş, Hasan Fehmi
    Derin evrişimsel sinir ağları (ESA) pek çok sınıflandırma probleminde olduğu gibi anlambilimsel görüntü bölütlemede de çok ciddi başarı göstermiştir. Fakat derin ağların eğitilmesi hem zaman alıcıdır hem de geniş bir eğitim veri kümesine ihtiyaç duymaktadır. Bir veri kümesinde eğitilen ağın başka bir görev ya da veri kümesine uygulanabilmesi için transfer öğrenme ile yeniden eğitilmesi gerekmektedir. Transfer öğrenmeye alternatif olarak ağ katmanlarından çıkarılan öznitelik vektörleri doğrudan sınıflandırma amaçlı kullanılabilir. Bu bildiride genel ESA mimarilerinden elde edilen özniteliklerin eğitim gerektirmeyen bir görüntü etiketleme yönteminde kullanılmasının sınıflandırma başarımına katkısı incelenmiştir. Derin ağlarda ‘öğrenilmiş’ öznitelikler ile SIFT gibi ‘el yapımı’ özniteliklerin birlikte kullanılmasının etiketleme doğruluğunu artırdığı gösterilmiştir. Varolan ön eğitimli ağların kullanılması sayesinde önerilen yaklaşım herhangi bir veri kümesinde yeniden eğitime gerek olmadan kolayca uygulanabilmektedir. Önerilen yöntem iki veri kümesinde test edilmiş ve etiketleme doğruluğu benzer yöntemlerle karşılaştırmalı olarak sunulmuştur.
  • Yayın
    Convolutional attention network for MRI-based Alzheimer's disease classification and its interpretability analysis
    (IEEE, 2021-09-17) Türkan, Yasemin; Tek, Faik Boray
    Neuroimaging techniques, such as Magnetic Resonance Imaging (MRI) and Positron Emission Tomography (PET), help to identify Alzheimer's disease (AD). These techniques generate large-scale, high-dimensional, multimodal neuroimaging data, which is time-consuming and difficult to interpret and classify. Therefore, interest in deep learning approaches for the classification of 3D structural MRI brain scans has grown rapidly. In this research study, we improved the 3D VGG model proposed by Korolev et al. [2]. We increased the filters in the 3D convolutional layers and then added an attention mechanism for better classification. We compared the performance of the proposed approaches for the classification of Alzheimer's disease versus mild cognitive impairments and normal cohorts on the Alzheimer's Disease Neuroimaging Initiative (ADNI) dataset. We observed that both the accuracy and area under curve results improved with the proposed models. However, deep neural networks are black boxes that produce predictions that require further explanation for medical usage. We compared the 3D-data interpretation capabilities of the proposed models using four different interpretability methods: Occlusion, 3D Ultrametric Contour Map, 3D Gradient-Weighted Class Activation Mapping, and SHapley Additive explanations (SHAP). We observed that explanation results differed in different network models and data classes.
  • Yayın
    İfade tanıma için yüz anatomisine dayalı öznitelikler
    (IEEE, 2014-04-23) Benli, Kristin Surpuhi; Eskil, Mustafa Taner
    Bu çalışmada yüz ifadesi tanıma için kas kuvvetlerine dayalı yeni öznitelikler öneriyoruz. Yüz üzerinde seçtiğimiz noktaların video üzerindeki hareketlerini izleyerek kas kuvvetlerini çözüyoruz. Yüz noktaları, ilk video çerçevesi üzerinde, kas kuvvet alanları üzerinde ilklendirilir. Bu noktalar optik akış algoritması ile izlenir. Noktaların devinimleri yüzün 3 boyutlu yönelimi ve yüz ifadesine dayalı bağıl devinimleri kestirmek için kullanılır. İnsan yüzünü yaylarla, artık-belirtilmiş doğrusal bir denklem sistemi olarak modelliyoruz. Bu sistemi yüz anatomisi kısıtı altında, kas kuvvetleri için çözüyoruz. Ardışık ileri seçim yaparak, temel yüz ifadeleri için en betimleyici kas kümesini belirliyoruz.
  • Yayın
    Wavelet-based image compression by hierarchical quantization indexing
    (IEEE, 2009) Ateş, Hasan Fehmi; Tamer, Engin
    In this paper, we introduce the quantization index hierarchy, which is used for efficient coding of quantized wavelet coefficients. A hierarchical classification map is defined in each wavelet subband, which describes the quantized data through a series of index classes. Going from bottom to the top of the tree, neighboring coefficients are combined to form classes that represent some statistics of the quantization indices of these coefficients. Higher levels of the tree are constructed iteratively by repeating this class assignment to partition the coefficients into larger subsets. The class assignments are optimized using a rate-distortion cost analysis. The optimized tree is coded hierarchically from top to bottom by coding the class membership information at each level of the tree. Despite its simplicity, the algorithm produces PSNR results that are competitive with the state-of-art coders in literature.
  • Yayın
    Hücresel sinir ağları kullanılarak el yazısı karakter tanıma uygulaması
    (IEEE, 2013-06-13) Çalık, Nurullah; Cesur, Evren; Tavşanoğlu, Ahmet Vedat
    El yazısı karakter tanıma, örüntü tanımanın önemli alanlarından biridir. Bu alanın kapsamında önemli belgelerin , arşivlerin ve diğer yazılı metinlerin sayısal ortamlara aktarılması yada yazıcının tanınması gibi problemler çözülmeye çalışılır. Bu problemler için birçok algoritma geliştirilmiştir. Geliştirilen bu algoritmalardan istenen, yüksek doğruluk oranının yanında FPGA gibi sayısal tasarımlara uygulanabilir olmasıdır. Bu nedenle sınıflandırma için kullanılan özellik vektörünün çıkartılmasında Gabor-benzeri Hücresel Sinir Ağı (HSA) filtreleri kullanılmıştır. Bu filtrelerin FPGA üzerinde verimli algoritmalar ile gerçeklenebilmektedir [10]. Bu sayede FIR türünde tasarlanan Gabor filtrelerine göre işlem süresi açısından daha verimli ve büyük harfler üzerinde doğruluk yüzdesi % 80 civarlarında olan bir algoritma geliştirilmiştir.
  • Yayın
    Retinal disease classification using optical coherence tomography angiography images
    (Institute of Electrical and Electronics Engineers Inc., 2024) Aydın, Ömer Faruk; Nazlı, Muhammet Serdar; Tek, Faik Boray; Turkan, Yasemin
    Optical Coherence Tomography Angiography (OCTA) is a non-invasive imaging modality widely used for the detailed visualization of retinal microvasculature, which is crucial for diagnosing and monitoring various retinal diseases. However, manual interpretation of OCTA images is labor-intensive and prone to variability, highlighting the need for automated classification methods. This study presents an aproach that utilizes transfer learning to classify OCTA images into different retinal disease categories, including age-related macular degeneration (AMD) and diapethic retinopathy (DR). We used the OCTA-500 dataset [1], the largest publicly available retinal dataset that contains images from 500 subjects with diverse retinal conditions. To address the class imbalance, we employed k-fold cross-validation and grouped various other conditions under the 'OTHERS' class. Additionally, we compared the performance of the ResNet50 model with OCTA inputs to that of the ResNet50 and RetFound (Vision Transformer) models with OCT inputs to assess the efficiency of OCTA in retinal condition classification. In the three-class (AMD, D R, Normal) classification, ResNet50-OCTA o utperformed ResNet50-OCT, but slightly underperformed compared to RetFound-OCT, which was pretrained on a large OCT dataset. In the four-class (AMD, DR, Normal, Others) classification, ResNet50-OCTA and RetFound-OCT achieved similar classification a ccuracies. This study establishes a baseline for retinal condition classification using the OCTA-500 dataset and provides a comparison between OCT and OCTA input modalities.