Vektör uzayında sıradüzensel ağaç yapısı ile düzenlenmiş metin veri tabanlarının çoklu yollar üzerinden sorgulanması
Künye
Ayan, U., Bayazit, U. & Gürgen, S. F. (2004). Multipath querying of hierarchically tree structured document databases in vector spaces. Paper presented at the Proceedings of the IEEE 12th Signal Processing and Communications Applications Conference, SIU 2004, 619-622. doi:10.1109/SIU.2004.1338605Özet
Web sayfaları, makaleler, kitap veya dergi isimlerinden oluşan büyük doküman yığınları üzerinde sorgulama yaparken dokümanları vektörlere ve doküman topluluklarını matrislere indirgemek sorgulamaları çok daha hızlandırır ve kolaylaştırır. Kullanılan matris ve vektörlerin boyutlarının büyüklüğü sebebiyle sorgulamalarda ortaya çıkan yüksek hesap karmaşıklığından kaçınılması için literatürde tekil değer ayrışımı ve ana bileşen analizi gibi boyut indirgeme yöntemleri önerilmiştir. Boyut indirgemeyle beraber hesap karmaşıklığını indirgeme için [12]’ de veritabanını sıradüzensel ağaç yapısı ile düzenleme ve bu yapı üzerinden tekli ve çoklu yollar kullanarak sorgulama önerilmiştir. Bu bildiride statik ve uyarlanabilir çoklu yolla sorgulama yöntemlerinin hesap karmaşıklığı başarım ödünleşimleri incelenmekte ve karşılaştırılmaktadır. Representation of large document databases consisting of web pages, articles, book and magazine titles in terms of matrices for the purpose of text querying and retrieval simplifies and expedites the querying process. In the literature, dimensionality reduction techniques based on singular value decomposition and principal component analysis have been proposed to reduce the high computational complexity resulting from the use of high dimensional matrices and vectors. In [12], organization of the text database in the form of a hierarchical tree structure, and single path and multi path querying over this structure, was proposed as a technique to reduce the computational complexity in addition to dimensionality reduction. In this paper, we analyze and compare the tradeoff between the computational complexity and the performance of the static and adaptive multipath querying methods by varying the number of paths.
Kaynak
Proceedings of the IEEE 12th Signal Processing and Communications Applications Conference, SIU 2004İlgili Öğeler
Başlık, yazar, küratör ve konuya göre gösterilen ilgili öğeler.
-
Querying sensor networks by using dynamic task sets
Çayırcı, Erdal; Coşkun, Vedat; Çimen, Çağhan (Elsevier B.V., 2006-05-15)A data querying scheme is introduced for sensor networks where queries formed for each sensing task are sent to task sets. The sensor field is partitioned into subregions by using quadtree based addressing, and then a given ... -
Texture recognition for frog identification
Tek, Faik Boray; Cannavo, Flavio; Nunnari, Giuseppe; Kale, İzzet (ACM SIGMM, 2012-11-02)This paper describes a visual processing technique for automatic frog (Xenopus Laevis sp.) localization and identification. The problem of frog identification is to process and classify an unknown frog image to determine ... -
Mixture of Gaussian models and bayes error under differential privacy
Xi, Bowei; Kantarcıoğlu, Murat; İnan, Ali (2011)Gaussian mixture models are an important tool in Bayesian decision theory. In this study, we focus on building such models over statistical database protected under differential privacy. Our approach involves querying ...