• Title/Summary/Keyword: 토픽 검색

Search Result 131, Processing Time 0.031 seconds

Assessing Influence of Human Factors according to Topics for Enhancing Social Search (소셜 검색 향상을 위한 토픽별 인적속성의 영향력 산출)

  • Kwon, Oh-Sang;Park, Gun-Woo;Lee, Sang-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.142-145
    • /
    • 2010
  • 정보의 양이 폭발적으로 증가함에 따라 방대한 정보 속에서 사용자의 검색 의도에 맞는 정보를 효과적으로 제공하기란 매우 어려워졌다. 따라서 웹 사용자들의 요구사항을 충족시키기 위한 연구들이 활발히 수행되고 있으며, 많은 방법론들이 제시되고 있다. 본 논문에서는 회귀분석이라는 통계학적 기법을 통해 검색 토픽에 대한 사용자의 인적속성들이 미치는 영향력을 산출하였다. 이는 인간이 가진 내재적 특성이 토픽별 검색 성향과 어떠한 연관관계가 있는지를 규명한 것이다. 또한 특정 토픽에 대해 영향력이 높은 인적속성의 일치 여부가 해당 토픽에 대한 사용자 검색성향의 유사정도와 매우 큰 상관관계가 있는 것을 증명하였다. 이와 같은 사실을 기반으로 사용자가 특정 토픽에 대해 검색 시 해당 토픽에 대해 영향력이 높은 인적속성을 확인하고, 이 속성이 일치하는 사람들의 검색 정보를 제공한다면, 사용자는 보다 만족된 검색결과를 얻을 수 있을 것이다.

An Experimental Study on Topic Distillation Using Web Site Structure (웹 사이트 구조를 이용한 토픽 검색 연구)

  • Lee, Jee-Suk;Chung, Yung-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.3
    • /
    • pp.201-218
    • /
    • 2007
  • This study proposes a topic distillation algorithm that ranks the relevant sites selected from retrieved web pages, and evaluates the performance of the algorithm. The algorithm calculates the topic score of a site using its hierarchical structure. The TREC .GOV test collection and a set of TREC-2004 queries for topic distillation task are used for the experiment. The experimental results showed the algorithm returned at least 2 relevant sites in top ten retrieval results. We peformed an in-depth analysis of the relevant sites list provided by TREC-2004 to find out that the definition of topic distillation was not strictly applied in selecting relevant sites. When we re-evaluated the retrieved sites/sub-sites using the revised list of relevant sites, the performance of the proposed algorithm was improved significantly.

The MeSH-Term Query Expansion Models using LDA Topic Models in Health Information Retrieval (MeSH 기반의 LDA 토픽 모델을 이용한 검색어 확장)

  • You, Sukjin
    • Journal of Korean Library and Information Science Society
    • /
    • v.52 no.1
    • /
    • pp.79-108
    • /
    • 2021
  • Information retrieval in the health field has several challenges. Health information terminology is difficult for consumers (laypeople) to understand. Formulating a query with professional terms is not easy for consumers because health-related terms are more familiar to health professionals. If health terms related to a query are automatically added, it would help consumers to find relevant information. The proposed query expansion (QE) models show how to expand a query using MeSH terms. The documents were represented by MeSH terms (i.e. Bag-of-MeSH), found in the full-text articles. And then the MeSH terms were used to generate LDA (Latent Dirichlet Analysis) topic models. A query and the top k retrieved documents were used to find MeSH terms as topic words related to the query. LDA topic words were filtered by threshold values of topic probability (TP) and word probability (WP). Threshold values were effective in an LDA model with a specific number of topics to increase IR performance in terms of infAP (inferred Average Precision) and infNDCG (inferred Normalized Discounted Cumulative Gain), which are common IR metrics for large data collections with incomplete judgments. The top k words were chosen by the word score based on (TP *WP) and retrieved document ranking in an LDA model with specific thresholds. The QE model with specific thresholds for TP and WP showed improved mean infAP and infNDCG scores in an LDA model, comparing with the baseline result.

A Study on the Design of a Topic Map-based Retrieval System for the Academic Administration Records of Universities (대학 학사행정 기록물의 토픽맵 기반 검색시스템 설계에 관한 연구)

  • Shin, Jiyu;Jung, Youngmi
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.16 no.1
    • /
    • pp.175-193
    • /
    • 2016
  • A topic map was designed as an efficient information retrieval method that is optimized for classification, organization, and navigation through the use of a semantic link network above information resources. With this, this study aims to design a topic map-based university archives retrieval system to provide the relevant information retrieval. For this study, electronic records that relate to the academic administration within two years of D university were collected, and topic map editing was carried out with Ontopia Omnigator. Topics were classified according to their functional analysis of academic administration. In the end, the number of topics was finalized as 626, with 6 types in general: academic work, staff, college register, student, university, etc. Association was separated into six types as well, which were formed with consideration to the relationships among topics. In addition, there are seven occurrence types: register class, register number, register date, receiver, title, creator, and identifier. It is expected that the associative nature of the designed topic map-based retrieval system in this study will make navigation of large records easy and allow incidental discovery of knowledge.

Design and Implementation of Topic Map Generation System based Tag (태그 기반 토픽맵 생성 시스템의 설계 및 구현)

  • Lee, Si-Hwa;Lee, Man-Hyoung;Hwang, Dae-Hoon
    • Journal of Korea Multimedia Society
    • /
    • v.13 no.5
    • /
    • pp.730-739
    • /
    • 2010
  • One of core technology in Web 2.0 is tagging, which is applied to multimedia data such as web document of blog, image and video etc widely. But unlike expectation that the tags will be reused in information retrieval and then maximize the retrieval efficiency, unacceptable retrieval results appear owing to toot limitation of tag. In this paper, in the base of preceding research about image retrieval through tag clustering, we design and implement a topic map generation system which is a semantic knowledge system. Finally, tag information in cluster were generated automatically with topics of topic map. The generated topics of topic map are endowed with mean relationship by use of WordNet. Also the topics are endowed with occurrence information suitable for topic pair, and then a topic map with semantic knowledge system can be generated. As the result, the topic map preposed in this paper can be used in not only user's information retrieval demand with semantic navigation but alse convenient and abundant information service.

Social Relationship Value Computation based on the Influence of Human Attributes classified by Topics (토픽별 인간 속성의 영향력 기반 소셜 관계 지수 산정)

  • Kwon, Oh-Sang;Park, Gun-Woo;Lee, Sang-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.884-887
    • /
    • 2010
  • 최근 검색엔진의 효율성을 향상시키고 검색결과에 있어서 사용자들의 요구사항을 충족시키기 위한 연구들이 활발히 수행되고 있으며, 많은 방법론들이 제시되고 있다. 이는 방대한 정보 속에서 사용자의 검색 의도에 맞는 정보를 효과적으로 제공하는 것을 그 목표로 한다. 특히 본 논문에서는 검색하고자 하는 토픽별 사용자의 인적 속성들이 미치는 영향력을 기반으로 사용자간 소셜 관계 지수(SRV : Social Relationship Value)를 산정하는 방법을 제안한다. 소셜 관계 지수란 인간의 내재적인 특성을 수치로 산정한 것으로, 웹 사용자들에게 있어서는 검색 성향의 유사정도와 직결된다. 따라서 검색하고자 하는 토픽별 개인 성향의 유사정도를 수치로 부여하고 유사성이 높은 사람들의 검색 정보를 이용하면 사용자에 보다 만족된 검색결과를 제공할 수 있다. 본 연구에서는 구글 디렉터리(Google directory)의 정제된 각 토픽별 하위 범주(category)에 대해 선택 결과가 같은 사람들을 대상으로 인적 속성을 분석하고, 그 영향력을 가중치로 적용해 산정된 소셜 관계 지수와 사용자들의 검색 패턴을 비교 하였다. 그 결과 특정인을 기준으로 소셜 관계 지수가 높은 사람들의 검색 패턴이 매우 유사함을 확인 하였다. 이를 통해 토픽별 개인 간 연결 강도가 강할수록, 즉 유사성이 높은 사용자간에는 검색 패턴 또한 유사함을 검증 할 수 있었다.

Reranking Search Results for Mathematical Equation Retrieval Using Topic Models (토픽 모델을 이용한 수학식 검색 결과 재랭킹)

  • Yang, Seon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.77-81
    • /
    • 2013
  • 본 논문은 두 가지 주제에 대해 연구한다. 첫 번째는 수학식 검색에 대한 것이다. 웹에는 양질의 수학식 데이터가 마크업 언어 형태로 저장되어 있으며 이를 활용하기 위한 연구들이 활발히 진행되고 있다. 본 연구에서는 MathML (Mathematical Markup Language)로 저장된 수학식 데이터를 일반 질의어를 이용하여 검색한다. 두 번째 주제는 토픽 모델(topic model)로 검색 성능을 향상시키는 방법에 대한 것이다. 먼저 수학식 데이터를 일반 자연어 문장으로 변환한 후 Indri 시스템을 이용하여 검색을 수행하고, 토픽 모델을 이용하여 미리 산출된 스코어를 적용하여 검색 순위를 재랭킹한 결과, MRR 기준 평균 5%의 성능을 향상시킬 수 있었다.

  • PDF

A Study on the Association between Thesaurus and Topic Map (시소러스와 토픽맵의 연관성 연구)

  • Nam, Young-Joon
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2005.08a
    • /
    • pp.403-408
    • /
    • 2005
  • 현재 정보검색분야에서는 검색도구로써 시소러스가 갖는 장점에도 불구하고 기존에 개발된 시소러스의 유지관리와 활용이 극히 제한적으로 이루어지고 있기 때문이다. 왜냐하면 정보의 급격한 증가로 인하여 전통적인 시소러스의 구조와 유지관리, 활용기법으로는 현대 정보의 홍수 현상에 적극적으로 대처하는데 한계에 직면하였기 때문이다. 이러한 한계점을 극복하기 위해 토픽맵의 구축알고리즘이 절대적으로 필요하였다. 이에 따라 본 연구에서는 토픽맵의 기본요소인 토픽과 대상물, 연관관계, 토픽타입 등을 이용한 시소러스 구조화 알고리즘을 제안하였다. 특히 토픽맵의 기본 요소가운데 대상물(occurrence)은 시소러스의 검색효율가운데 정도율의 확보를 가능하게 하며, 시소러스의 구축에 필요한 지식베이스의 역할을 수행하는 주요한 기법임을 확인하였다.

  • PDF

SRR(Social Relation Rank) and TS_SRR(Topic Sensitive_Social Relation Rank) Algorithm; toward Social Search (소셜 관계 랭크 및 토픽기반_소셜 관계 랭크 알고리즘; 소셜 검색을 향해)

  • Park, GunWoo;Jung, JeaHak;Lee, SangHoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.364-368
    • /
    • 2009
  • "소셜 네트워크(Social Network)와 검색(Search)의 만남"은 현재 인터넷 상에서 매우 의미 있는 두 영역의 결합이다. 이와 같은 두 영역의 결합을 통해 소셜 네트워크 내에서 친구들의 생각이나 관심사 및 활동을 검색하고 공유함으로써 검색의 효율성과 적합성을 높이기 위한 연구들이 활발히 수행되고 있다. 본 논문에서는 일반적인 소셜 관계 랭크(SRR : Social Relation Rank) 및 토픽이 반영된 소셜 관계 랭크(TS_SRR : Topic Sensitive_Social Relation Rank) 알고리즘을 제안한다. SRR은 소셜 네트워크 내에 존재하는 웹 사용자들의 내재적인 특성 및 검색 성향 등에 대한 관련성(또는 유사정도)을 수치로 산정한 '소셜 관계 지수(SRV : Social Relation Value)'에 랭킹(Ranking)을 부여한 것을 의미한다. 제안하는 알고리즘의 검색 적용 가능성을 검증하기 위해 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜네트워크를 구성 한다. 둘째, 웹 사용자들의 속성에 내재된 정보를 이용하여 토픽별 SRV를 산정한 후 랭킹을 부여하고, 토픽별 변화되는 랭킹에 따라 소셜 네트워크를 재구성 한다. 마지막으로 (TS_)SRR과 웹 사용자들의 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 (TS_)SRR이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 결론적으로 (TS_)SRR 알고리즘을 기반으로 관심분야에 연관성이 높은, 즉 상위에 랭크 된 웹 사용자들을 검색하여 검색 패턴을 공유 또는 상속받는 다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성과 신뢰성 향상에 기여 할 수 있다.

Subtopic Mining of Two-level Hierarchy Based on Hierarchical Search Intentions and Web Resources (계층적 검색 의도와 웹 자원을 활용한 2계층 구조의 서브토픽 마이닝)

  • Kim, Se-Jong;Lee, Jong-Hyeok
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.2
    • /
    • pp.83-88
    • /
    • 2016
  • Subtopic mining is the extraction and ranking of possible subtopics, which disambiguate and specify the search intentions of an input query in terms of relevance, popularity, and diversity. This paper describes the limitations of previous studies on the utilization of web resources, and proposes a subtopic mining method with a two-level hierarchy based on hierarchical search intentions and web resources, in order to overcome these limitations. Considering the characteristics of resources provided by the official subtopic mining task, we extract various second-level subtopics reflecting hierarchical search intentions from web documents, and expand and re-rank them using other provided resources. Terms in subtopics with wider search intentions are used to generate first-level subtopics. Our method performed better than state-of-the-art methods in almost every aspect.