Basit öğe kaydını göster

dc.contributor.advisorYıldız, Olcay Taneren_US
dc.contributor.authorDüzağaç, Remzien_US
dc.contributor.otherIşık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.date.accessioned2016-06-08T06:12:53Z
dc.date.available2016-06-08T06:12:53Z
dc.date.issued2014
dc.identifier.citationDüzağaç, R. (2014). Improving search engine performance with context extraction using Lucene, DBPedia-Spotlight, and Wordnet. İstanbul: Işık Üniversitesi Fen Bilimleri Enstitüsü.en_US
dc.identifier.urihttps://hdl.handle.net/11729/959
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 41-45)en_US
dc.descriptionx, 46 leavesen_US
dc.description.abstractSearch engines are common tools which retrieve information from considerable amount of data according to the user needs. The data size that needs to be handled and retrieving relevant information, are the main problems of every search engine. Additionally, in order to improve the performance of a search engine, there are various approaches and methods are applied. On the other hand, using context information besides words in the document is a quite new area. Including Context Information" into the game is a promising eld of work. In this research, we use context information extracted from the documents in the collection to improve the performance of the search engine. In rst step, we extract context using Lucene, DBPedia-Spotlight, and Wordnet. As the second step, we build a graph using extracted context information. In the third step, in order to group similar contexts, we cluster context graph. In the fourth step, we rescore results using context-clusters and context-information of documents, as well as queries. In the fth step, we implement a data collection tool to collect gold-standard data. In the sixth and nal step, we compare the results of our algorithm with gold-standard data set. According to experimental results, using context information may improve the search engine performance but the collection should be relatively big.en_US
dc.description.abstractArama motorları, kullanıcıların ihtiyaçlarına göre ilgili bilgileri kayda değer miktarda veri içerisinden sunan araçlardır. İşlenmesi gereken verinin büyüklüğü ve ilgili bilgileri kullanıcıya sunmak arama motorlarının iki ana problemini oluşturur. Arama motoru performansını artırmak için pek çok yaklaşım ve metod bulunmaktad ır. Bunlara ek olarak arama motorlarının performansını artırmak için dökümanın içerdiği kelimelerin yanında bağlam bilgisini kullanmak oldukça yeni bir alan. Oyuna Bağlam Bilgisini dahil etmek gelecek vaat eden bir çalışma alanı sunmakta. Bu çalışmamızda, arama motoru performansını artırmak için döküman ve sorgulardan çıkardığımız bağlam bilgisini kullanıyoruz. İlk adım olarak Lucene, DBPedia- Spotlight ve Wordnet'i kullanarak bağlam bilgisi çıkarıyoruz. İkinci adımda, çıkardığımız bağlam bilgilerini kullanarak bir çizge oluşturuyoruz. Üçüncü adımda, birbirine yakın bağlamları gruplamak için çizge üzerinde ki kümeleme yapıyoruz. Dördüncü adımda, döküman ve sorguları bağlam çizgesini ve ilgili bağlam bilgilerini kullanarak sonuçları yeniden puanlıyoruz. Beşinci adım olarak referans verisi toplamak için bir uygulama geliştirip bu uygulama ile kullanıcılardan veri topluyoruz. Altıncı ve son adımda ise kullanıcılardam topladığımız referans bilgisi ile sonuçlarımızı karşılaştırıp yaptığımız çalışmanın performansını ölçüyoruz. Aldığımız sonuçların bize gösterdiğine göre bağlam bilgisini kullanmak arama motorlar ının performansını artırabilir ancak kullanılacak döküman kümesi göreceli olarak büyük olmalı.en_US
dc.description.tableofcontentsIntroductionen_US
dc.description.tableofcontentsMotivationen_US
dc.description.tableofcontentsInformation Retrievalen_US
dc.description.tableofcontentsContext Sourcesen_US
dc.description.tableofcontentsProblemen_US
dc.description.tableofcontentsOur Solutionen_US
dc.description.tableofcontentsRelated Worksen_US
dc.description.tableofcontentsA New World: Contexts and Conceptsen_US
dc.description.tableofcontentsA New World: Contexts and Conceptsen_US
dc.description.tableofcontentsWikipedia and Wordnet: Two New Actors in The Gameen_US
dc.description.tableofcontentsSystemen_US
dc.description.tableofcontentsSystem Overviewen_US
dc.description.tableofcontentsCorpusen_US
dc.description.tableofcontentsContext Extractionen_US
dc.description.tableofcontentsContext Analyzersen_US
dc.description.tableofcontentsLucene Context Analyzer - LCAen_US
dc.description.tableofcontentsDBPedia Spotlight Analyzer - DSCAen_US
dc.description.tableofcontentsWordnet Analyzer - WNCAen_US
dc.description.tableofcontentsPairing & Pair Countingen_US
dc.description.tableofcontentsContext Clusteringen_US
dc.description.tableofcontentsLabeling & Scoringen_US
dc.description.tableofcontentsExperimentsen_US
dc.description.tableofcontentsExperimental Setupen_US
dc.description.tableofcontentsSystem Implementationen_US
dc.description.tableofcontentsData Collection & Comparingen_US
dc.description.tableofcontentsExperiment Resultsen_US
dc.description.tableofcontentsConclusionen_US
dc.language.isoengen_US
dc.publisherIşık Üniversitesien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subject.lccTK5105.884 D89 2014
dc.subject.lcshWeb search engines.en_US
dc.subject.lcshSearch engines -- Programming.en_US
dc.titleImproving search engine performance with context extraction using Lucene, DBPedia-Spotlight, and Wordneten_US
dc.title.alternativeArama motoru performansının solr, DBpedia-spotlight ve wordnet kullanılarak yapılan bağlam çıkarımı ile artırılmasıen_US
dc.typemasterThesisen_US
dc.contributor.departmentIşık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.relation.publicationcategoryTezen_US
dc.contributor.institutionauthorDüzağaç, Remzien_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster

info:eu-repo/semantics/openAccess
Aksi belirtilmediği sürece bu öğenin lisansı: info:eu-repo/semantics/openAccess