• Title/Summary/Keyword: 단어 검색

Search Result 560, Processing Time 0.036 seconds

A Study on Resolving Word Sense Ambiguity Using Mutual Information (상호 정보를 이용한 어의 모호성 해소에 관한 연구)

  • Jeon, Mee-Sun;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.369-373
    • /
    • 1994
  • 정보 검색 시스템의 정확성은 색인어의 정확성과 질의 해석의 정확성에 의존한다. 한국어 정보 검색분야에서는 한국어의 특성을 고려하는 것이 무엇보다 중요하다. 한국어의 문서 색인과 질의 해석시 야기되는 어의 모호성(word sense ambiguity)을 가지는 단어에 대해서는 어의 모호성을 해소한 정확한 색인과 질의 해석이 전제되어야 정확한 문서를 검색해낼 수 있다. 본 논문은 한국어 문서 색인시 동음이의어(homonym)에 의해 발생하는 어의 모호성을 해소하기 위한 방안에 대해 다루고 있으며 의미적 관련 정보를 이용할 것을 제안하고 타당성을 보이는 실험 결과를 제시한다.

  • PDF

Construction of User Profile for Personal Web Agent (개인 웹 에이전트를 위한 사용자 프로파일 구축)

  • 이상섭;소영준;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.126-128
    • /
    • 1998
  • 본 논문에서 구현하고자 하는 웹기반 사용자별 에이전트는 웹을 이용해 정보를 검색하는 사용자들에 대한 사용자 관심도를 사용자의 웹검색 행위를 감시하는 모니터 에이전트에 사용자가 직접 기술하게 하고 이를 별도의 학습서버를 두어 사용자별 프로파일을 만들어 이를 사용자가 확인 및 편집할 수 있게 하였다. 서버에서의 학습 과정은 웹 브라우저를 통하여 수집된 정보를 바탕으로 사용자가 관심을 가지는 웹 문서의 일반적인 내용에 대한 관심 정확도를 높이는 일련의 단어 정제 과정을 통하여 최적의 관심 키워드를 추출하는 작업으로 이루어지며 이는 표현 모델인 사용자 프로파일을 구축하여, 관심 문서를 검색하는데 적절한 정보를 제시하는 것을 목적으로 한다. 이 시스템에서 적용되는 학습 방식은 사용자의 웹 문서 관심도에 의존하므로 웹 문서에 나타나는 텍스트들을 대상으로 C4.5 학습 시스템을 적용한다.

  • PDF

A Reasearch on Signature File Methods for Korean Text Retrieval (한글 텍스트 검색을 위한 요약 화일 기법에 관한 연구)

  • Song, Byoung-Ho;Lee, Suk-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.231-237
    • /
    • 1991
  • 텍스트에 대한 내용 본위 검색 기법으로서 요약 화일(signature file) 기법은 역화일(inverted file)이 허용되지 않을 때 매우 유용하다. 그러나 한글은 영문과 달리 어절의 형성이 복잡하고 띄어쓰기 형태가 고정되지 않음에 따라 기존의 단어 위주 영문 본위 요약 화일 기법을 그대로 적용시킬 수 없다. 본 논문에서는 이를 위하여 띄어쓰기를 무시하고 중복된 2음절 패턴을 도출하여 요약 화일을 구성, 검색하는 기법을 제안한다. 이 기법은 일본어, 중국어 등 비슷한 문제를 가진 외국어에도 적용될 수 있다.

  • PDF

XML&RDF Retrieve Agent Processing XML and RDF Document in The Next Generation Web (차세대 웹에서 XML과 RDF 문서를 처리하는 XML&RDF 검색 에이전트)

  • Han Gi-Deok;Kwon Hyuk-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.163-165
    • /
    • 2006
  • 차세대 웹을 표현하는 단어로 XML(extensible markup language)과 시맨틱 웹(Semantic Web)을 꼽을 수 있다. XML은 1996년 W3C (World Wide Consortium)에서 제안한 데이터 표현 능력이 높은 언어이며, 시맨틱 웹은 사람이 읽고 해석하기에 편한 현재의 웹 대신에 컴퓨터가 이해할 수 있는 형태의 새로운 언어로 표현해 기계들끼리 서로 의사소통을 할 수 있는 지능형 웹을 말하는 것으로써 현재 XML을 기반으로 하는 RDF(Resource Description Framework)나 온톨로지 기술을 통해 시맨틱 웹 구축방안에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 차세대 웹에서의 정보 공유를 위한 검색 에이전트의 역할 및 에이전트간의 구조에 관한 설명, XML&RDF 검색 에이전트의 설계 모델 및 현재까지 구현된 시스템의 개요를 보여준다.

  • PDF

Bookmark-Based Personalized Search through Query-Level User Profile (질의어 단위 사용자 프로파일을 이용한 북마크 기반 개인화 검색 방법)

  • Kim, Hyun-Ji;Bae, Dong-Hwan;Ko, Min-Sam;Yi, Mun-Yong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.42-44
    • /
    • 2012
  • 본 논문에서는 개인화 검색 시 사용자의 단일 프로파일이 개인의 다양한 정보 요구를 만족시키지 못하는 문제를 개선하고자, 질의어에 따라 프로파일을 조정하는 방법을 제안한다. 특히, 제안하는 방법은 북마크 데이터로부터 질의어에 관해 사용자가 중요하게 생각하는 단어들을 추출하여 프로파일을 조정하는데 활용한다. 유명 북마크 서비스인 CiteULike의 데이터를 활용한 실험에서, 제안하는 방법이 단일 프로파일에 기반한 기존의 방법보다 더 뛰어난 개인화 검색 결과를 제공함을 확인할 수 있었다.

A Link control of the word associated relation with using HITS Algorithm (HITS 알고리즘을 이용한 단어 연관 관계 링크 제어)

  • Moon, Sung-Cheon;Lee, Jung-Hun;Cheon, Suh-H.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.395-398
    • /
    • 2010
  • 많은 정보들을 인터넷을 통하여 접할 수 있게 됨에 따라 사용자가 만족하는 결과를 보여주는 것이 검색 엔진의 궁극적인 목표가 되었다. 하지만 방대한 양을 가진 다양한 정보에서 원하는 검색 결과를 검색하는 것은 과거와 현재까지 많은 연구를 통해 많은 시간과 노력이 필요하다는 것이 증명 되었다. 기존의 HITS 알고리즘을 개선하여 링크 제어를 이용한 페이지와 페이지간에 관련성을 높였다.

  • PDF

Tagged Web Image Retrieval with Wikipedia Semantic Information (위키피디아 의미정보를 이용한 태깅된 웹 이미지 검색)

  • Lee, Sungjae;Cho, Soosun
    • Annual Conference of KIPS
    • /
    • 2011.11a
    • /
    • pp.361-364
    • /
    • 2011
  • 오늘날, 웹 공간에서는 사진과 같은 멀티미디어 자료를 공유하기 위하여 다양한 방법으로 문서의 정보를 표현하고 있다. 이러한 정보를 이용하기 위해 제목, 내용등에서 형태소 분석을 통해 의미가 있는 단어들을 이용하는 경우도 있지만 그 문서 혹은 자료와 관련있는 태그를 기입하고 활용하는 것이 보편화 되어 있다. 본 연구에서는 위키피디아 문서를 이용하여 이미지 태그들 사이의 연관성을 활용하여 이미지 검색 순위를 조정하였다. 약 1000만건의 문서로 이루어진 위키피디아를 이용하여 태그들의 연관성을 계산하였으며, 실험결과 태그 기반의 이미지를 검색 할 때 향상된 결과를 얻을 수 있었다.

A Study on the Improvement Model of Document Retrieval Efficiency of Tax Judgment (조세심판 문서 검색 효율 향상 모델에 관한 연구)

  • Lee, Hoo-Young;Park, Koo-Rack;Kim, Dong-Hyun
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.6
    • /
    • pp.41-47
    • /
    • 2019
  • It is very important to search for and obtain an example of a similar judgment in case of court judgment. The existing judge's document search uses a method of searching through key-words entered by the user. However, if it is necessary to input an accurate keyword and the keyword is unknown, it is impossible to search for the necessary document. In addition, the detected document may have different contents. In this paper, we want to improve the effectiveness of the method of vectorizing a document into a three-dimensional space, calculating cosine similarity, and searching close documents in order to search an accurate judge's example. Therefore, after analyzing the similarity of words used in the judge's example, a method is provided for extracting the mode and inserting it into the text of the text, thereby providing a method for improving the cosine similarity of the document to be retrieved. It is hoped that users will be able to provide a fast, accurate search trying to find an example of a tax-related judge through the proposed model.

Personalized Search Technique using Users' Personal Profiles (사용자 개인 프로파일을 이용한 개인화 검색 기법)

  • Yoon, Sung-Hee
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.14 no.3
    • /
    • pp.587-594
    • /
    • 2019
  • This paper proposes a personalized web search technique that produces ranked results reflecting user's query intents and individual interests. The performance of personalized search relies on an effective users' profiling strategy to accurately capture their interests and preferences. User profile is a data set of words and customized weights based on recent user queries and the topic words of web documents from their click history. Personal profile is used to expand a user query to the personalized query before the web search. To determine the exact meaning of ambiguous queries and topic words, this strategy uses WordNet to calculate semantic similarities to words in the user personal profile. Experimental results with query expansion and re-ranking modules installed on general search systems shows enhanced performance with this personalized search technique in terms of precision and recall.

Customized Query Recommendation by Agent Based on User's Query Pattern (사용자 질의패턴 기반 에이전트에 의한 맞춤형 질의추천)

  • Lim, Yo-Han;Park, Gun-Woo;Lee, Sang-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.200-204
    • /
    • 2008
  • 검색엔진을 사용해 질의를 입력 후 사용자가 원하는 정보를 얻을 때까지의 검색 결과정보의 탐색 범위에 대해 설문한 연구 보고서에 검색 결과정보의 첫 페이지만 보는 사용자가 설문인원의 41%를 차지했고, 상위 3페이지만 사용하는 사용자는 88%에 달한다고 하였다. 따라서 검색결과의 상위순위는 사용자의 정보 존재여부를 판단하는 중요한 척도가 된다. 또한 인터넷의 방대한 정보로 인해 정보 홍수에 빠진 사람들은 정보에 대한 까다로운 요구를 하고 있다. 이를 테면 개인화 또는 맞춤화된 정보를 제공 받기를 원하고 있다. 정보검색시 대다수의 사용자들은 질의의 길이를 2단어 이하의 키워드를 사용하여 질의가 특정한 토픽을 지향하도록 하고 있다. 본 논문에서는 데이터 마이닝의 연관규칙을 적용 사용자 프로파일 DB내 질의에 대한 사용자 질의패턴을 분석하여 '분석 Agent' 통한 연관 질의 리스트를 생성하고 '추천 Agent'는 사용자들의 취향변화 즉 시간에 따라 변하는 관심영역 또는 사용자 질의 변화에 대해서 날짜별 가중치를 부여하여 사용자와 상호교류를 통해 사용자에게 맞춤형 질의를 추천하는 방안을 제시하고자 한다.

  • PDF