• 제목/요약/키워드: 검색어 확장 시스템

검색결과 122건 처리시간 0.025초

사용자의 선호도를 반영한 확장 퍼지 정보 검색 시스템의 설계 (Design of a Extended Fuzzy Information Retrieval System using User한s Preference)

  • 김대원;이광형
    • 한국지능시스템학회논문지
    • /
    • 제10권4호
    • /
    • pp.299-303
    • /
    • 2000
  • 정보 검색 시스템의 목표는 사용자가 원하는 정보를 빠른 시간 내에 효율적으로 검색하는 것이다. 이를 위해 불리언 모델, 벡터 모델을 비롯한 기존의 많은 검색 모델들과 퍼지 이론에 기반한 퍼지 검색 모델들이 제안되어져 왔다. 그러나 기존의 모델들은 관련 문서를 검색하는데 잇어서 사용자의 선호도를 반영하지 못하는 한계점을 지닌다. 본 논문에서는 기존의 퍼지 검색 모델의 단점을 보완하기 위해서 확장 퍼지 검색 모델을 제안하고 설계하였다. 제안하는 모델은 색인어와 문서 가중치의 유사도를 결정하는데 있어서 사용자의 선호도를 반영할 수 있도록 설계하였다.

  • PDF

질의기반 사용자 프로파일을 이용하는 개인화 웹 검색 (Personalized Web Search using Query based User Profile)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제17권2호
    • /
    • pp.690-696
    • /
    • 2016
  • 사용자 입력 질의와 웹 문서에 포함된 단어들의 형태적 일치를 검사하여 관련 문서를 검색하는 검색엔진은 사용자의 개인별 관심 분야를 반영하는 검색 결과를 생성하기 어렵다. 본 논문에서는 개인별 관심사를 파악하여 질의 의도에 적합한 내용의 문서를 검색하는 개인화된 웹 검색 방법을 제안한다. 개인화 검색의 성능은 사용자의 개인적 관심사를 정확하게 표현하는 우수한 사용자 프로파일을 생성하는 전략에 좌우된다. 본 연구에서 개인 프로파일은 사용자가 최근 입력한 질의어들과 검색에서 클릭했던 문서들에 나타나는 주제어들이 출현 빈도를 반영한 가중치와 함께 등록된 데이터베이스이다. 특히 중의적 질의어의 정확한 의미를 결정하기 위해 워드넷을 기반으로 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 기존 웹 검색 시스템의 사용자 측에 질의확장 모듈과 순위재계산 모듈을 추가하는 확장모듈을 구축하여 비교 실험하였으며, 본 연구의 방법을 적용한 개인화 웹 검색의 결과는 특히 10위 이내 상위의 결과 문서들에 대해 92%의 정확률과 82%의 재현율을 보여 향상된 성능을 검증하였다.

한글 워드임베딩과 아프리오리를 이용한 검색 시스템의 질의어 확장 (Query Extension of Retrieve System Using Hangul Word Embedding and Apriori)

  • 신동하;김창복
    • 한국항행학회논문지
    • /
    • 제20권6호
    • /
    • pp.617-624
    • /
    • 2016
  • 한글 워드임베딩은 명사 추출과정을 거치지 않으면, 학습에 필요하지 않은 단어까지 학습하게 되어 효율적인 임베딩 결과를 도출할 수 없다. 본 연구는 한글 워드임베딩, 아프리오리, 텍스트 마이닝을 이용하여, 특정 도메인에서 질의어 확장에 의해 보다 효율적으로 답변을 검색할 수 있는 모델을 제안하였다. 워드임베딩과 아프리오리는 질의어에 대해서 의미와 맥락에 따라 연관 단어를 추출하여, 질의어를 확장하는 단계이다. 한글 텍스트 마이닝은 명사 추출, TF-IDF, 코사인 유사도를 이용하여, 유사답변 추출과 사용자에게 답변하는 단계이다. 제안모델은 특정 도메인의 답변을 학습하고, 연관성 높은 질의어를 확장함으로서 답변의 정확성을 높일 수 있다. 향후 연구과제로서, 데이터베이스에 저장된 사용자 질의를 분석하고, 보다 연관성 높은 질의어를 추출하는 연구가 필요하다.

인용 지표를 이용한 재순위화 및 질의 확장의 성능 평가 - 인용색인 데이터베이스를 기반으로 - (Performance Evaluation of Re-ranking and Query Expansion for Citation Metrics: Based on Citation Index Databases)

  • 이혜경;이용구
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.249-277
    • /
    • 2023
  • 본 연구의 목적은 인용 지표가 인용 색인 데이터베이스의 검색성능 향상에 기여할 가능성을 파악하는 데에 있다. 이를 위하여 본 연구는 문헌정보학 분야 10개의 질의를 Web of Science에서 검색하여 수집한 3,467건의 문헌과 2000년부터 2021년까지 SSCI 문헌정보학 분야 저널 85종에 수록된 60,734건의 문헌을 기반으로 적합성 판단을 거쳐, 검색 결과의 상위 100순위에 대한 성능 및 검색 방식과 인용 지표를 활용한 재순위화, 그리고 벡터 공간모형 검색시스템 구축 등에 따른 질의 확장 실험을 수행하였다. 그 결과 첫째, 인용 지표를 단독으로 사용한 재순위화의 성능은 Web of Science의 검색성능과 상이하였으며, 인용 지표는 Web of Science 기존 시스템에 적용되지 않는 독립적인 지표로 작용하고 있었다. 둘째, 고유 질의어 수에 질의어의 총 출현 빈도를 조합하고 인용수를 보조적으로 사용했을 때, 성능에 긍정적인 영향을 미칠 것으로 확인하였다. 셋째, 질의 확장에서는 전반적으로 벡터 공간모형 기반 검색시스템의 기본 성능 대비 성능이 향상되었다. 넷째, 이용자 적합성을 통해 질의 확장을 적용한 경우가 시스템 적합성을 적용한 경우보다 성능이 향상 되었다. 다섯째, 피인용 수를 적합 문헌과 더불어 사용하면 최상위권 내 적합 문헌에서의 순위 변동 가능성을 보여주었다.

자동 도서분류를 위한 확장된 나이브베이지안 알고리즘 (An Extended Naive Bayesian Algorithm for Automatic Book Classification)

  • 김성수;정현준;백두권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.547-550
    • /
    • 2014
  • 국내 공공도서관에서는 잘못 분류된 도서의 서가(bookshelf) 배치로 인해 이용자의 불편과 해당 도서관의 도서분류체계와의 불일치 등으로 도서관리에 어려움을 겪고 있다. 또한 자동 도서분류를 위한 기계학습 등 다양한 알고리즘의 연구가 진행되어 왔으나 적은 학습데이터에서의 분류효과 향상에 한계가 있었다. 이에 이 연구에서는 KORMARC(Korea Machine Readable Cataloging) 의 색인어(키워드) 정보를 결합한 확장된 나이브베이지안 알고리즘을 제안하였다. 색인어 정보는 일반적으로 도서검색시스템에서 검색 효과를 높이기 위해 이용되고 있으며 실제 공공도서관에서의 실험을 통해 도서량이 적은 경우에 보다 높은 분류효과를 얻을 수 있음을 실험 평가하였다.

다국어를 지원하는 XML 문서 검색 시스템: HyREX (HyREX: Universal XML Retrieval Engine for XML)

  • 한예지;채종대;김수희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1713-1716
    • /
    • 2002
  • HyREX는 연구용 프로토타입 XML 하이퍼미디어 문서 검색시스템으로 다국어를 지원하고 있다. HyREX는 검색을 위한 효율적인 접근 경로들을 처리하는 물리적 계층 HyPath와 질의어를 처리하는 논리적 계층 XIRQL 그리고 사용자 인터페이스인 HyGate 계층으로 이루어져 있다. 이 연구에서는 영어와 독일어 등의 검색을 지원하는 기존의 HyREX 시스템을 한글 XML 문서 검색시스템으로 확장하기 위해 먼저 한글 데이터타입을 위한 클래스를 구현하였다. 앞으로 한글 XML 문서 검색에서 정확율과 재현율을 향상하기 위해 각 문서의 인덱스에 대해 $tf{\cdot}idf$ 공식을 이용하여 가중치를 부여하고 이를 개발하고자 한다.

  • PDF

SQL:1999를 이용한 XPath질의 처리기의 설계 (Design of XPath Query Processor Using SQL: 1999)

  • 황정수;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.160-162
    • /
    • 2004
  • 인터넷에서 XML은 새로운 정보 환경의 요구사항인 확장성과 문서 관계성의 우수성을 만족하는 표준이다. 이러한 XML 문서 안의 정보 검색을 위해서 XPath 질의어가 널리 사용 중이다. 또한, XML 문서의 체계적인 운용을 위해 데이터베이스에 효율적으로 저장하고 검색하는 연구들이 진행되고 있다. 본 연구에서는 분할 저장 시스템에서 RDBMS 또는 ORDBMS에 XML 문서를 저장하고 검색할 수 있도록 하는 XPath 질의 처리기를 SQL:1999를 이용하여 설계함으로써 좀더 정확하고 빠르게 처리가 가능하도록 하였다.

  • PDF

온톨로지를 이용한 맞춤형 여행정보 시스템 (The System of customized Travel Information based on Ontology)

  • 조미영;최창;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2006
  • 본 논문에서는 지능형 여행 정보 제공을 위해 제주여행 온톨로지를 구축하여 사용자별 맞춤형 여행정보 제공 및 검색을 위한 시스템을 제안하고자 한다. 기존의 일반 검색이 제한된 정보에 대한 키워드 매칭이 라면, 온톨로지 기반 검색은 키워드 검색, 사전에 의한 확장 검색, 지식입력에 의한 검색이 모두 가능하여 좀 더 지능적 검색이라 할 수 있겠다. 이러한 온톨로지 검색의 장정으로는 속성값, 분류, 메타 정보 등 관련된 여행정보를 모두 활용할 수 있다는 것과. 유사어 활용이 가능하다는 것이다. 또한 검색 어휘의 역할에 따른 차등적인 가중치값 등을 적용하여 Many-Answers-Problem 해결할 수 있다. 즉, 가장 관련 있는 정보를 상위에 랭크시켜 사용자의 체감 정확률을 향상시킬 수 있다.

  • PDF

클러스터링 기법을 이용한 키워드 유사도 순위화 알고리즘에 따른 사용자 질의 확장 (User Query Expansion Through Keyword Similarity Ranking Algorithm Us ins Cluster ing Methods)

  • 이상훈;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.479-481
    • /
    • 2003
  • 본 논문에서는 여러 가지 클러스터링 기법들을 사용하여 키워드 유사도롤 순위화하여 사용자의 질의를 확장하는 기법을 제안한다. 클러스터링 기법에는 연관(Association) 클러스터링, 메트릭(Metric) 클러스터링, 스칼라(Scalar) 클러스터링 기법을 사용하고, 이들간의 가중치를 적절히 조절하여 검색 시스템을 만든다. 사용자의 질의가 주어졌을 때, 질의 키워드와 연관된 키워드들을 순위화 하여 사용자에게 보여주고, 사용자의 추가입력을 받아서 질의를 확장한다. 사용자가 적당한 질의어로 판단하여 확장된 질의로 검색을 수행할 때까지 이 과정을 반복한다. 실험에서 사용한 문헌집합은 Korea Herald의 2003년 1월과 2월의 경제 관련 기사들을 수집하여 사용하였고, 실험을 거쳐서 질의를 확장한 결과 만족할 만한 결과가 도출되었다.

  • PDF

의미 네트워크 모델을 이용한 탐색 용어 선택 시스템의 설계 및 구현에 관한 연구

  • 이효숙
    • 정보관리학회지
    • /
    • 제5권1호
    • /
    • pp.131-152
    • /
    • 1988
  • 본 연구에서는 컴퓨터를 이용하는 탐색 시스템에서 탐색 용어와 관련된 제한점을 해결하고자 의미 네트워크 모델에 지식 베이스를 설계하였다. 이것은 탐색 전략에서 주제분 야의 용어 및 용어간의 어의적 관계에 대한 지식을 확장 이용하였을 때 검색의 효율을 높이 는 데에 촛점을 두었다. 이를 위해서 정보의 탐색과 지식 표현에 관한 문헌 연구를 하였으 며, 실제로 한글 문헌의 화학 공학분야에서 색인어 실험을 통하여 '유체의 흐름'과 '연소'에 관한 지식 베이스를 구성하였다. 탐색 방법은 두가지로 구분되었는데 용어에 관한 탐색과 질문식과 관련된 문헌 검색으로 실시되었다.

  • PDF