• 제목/요약/키워드: Web Search Engine

검색결과 248건 처리시간 0.027초

범주 기반 평가를 이용한 검색시스템의 성능 향상 (Improving Performance of Search Engine Using Category based Evaluation)

  • 김형일;윤현님
    • 한국콘텐츠학회논문지
    • /
    • 제13권1호
    • /
    • pp.19-29
    • /
    • 2013
  • 정보에 대한 공간 복잡도가 높은 현재의 인터넷 환경에서는 사용자가 원하는 정보를 정확히 제공하는 것이 검색엔진의 목표이다. 그러나 대다수 검색엔진이 활용하는 내용 기반 기법은 현재의 인터넷 환경에서는 효과적인 도구로 사용될 수 없다. 내용 기반 기법은 어휘의 형태적 특성을 이용하여 웹페이지 가중치를 결정하기 때문에 웹페이지에 대한 변별력이 우수하지 못하다는 단점이 있다. 이러한 문제점을 해결하여 사용자에게 효과적인 정보를 제공하기 위해, 본 논문에서는 범주 기반 평가 기법을 제안한다. 범주 기반 평가 기법은 질의어를 의미관계로 확장하여 웹페이지와 유사성을 측정한다. 웹페이지 가중치 적용에 있어서, 범주 기반 평가 기법은 웹페이지 검색에 대한 사용자 반응과 질의어 범주를 가중치에 활용함으로써 웹페이지에 대한 변별력을 증가시킨다. 본 논문에서 제안한 기법은 사용자가 원하는 정보를 검색엔진을 통해 효과적으로 제공할 수 있는 장점이 있으며, 다양한 실험을 통해 범주 기반 평가 기법의 활용성을 확인하였다.

웹문서 재배치 에이전트 시스템 (A Web Page Reordering Agent System)

  • 조영임;강상길;김영국
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.91-94
    • /
    • 2007
  • 구글이나 야후와 같은 정보검색엔진은 사용자에게 편리성을 제공하나 사용자로 하여금 만족감을 제공하지는 못하고 있다. 이것은 사용자에 대한 검색목표가 사용자 프로파일마다 서로 다르기 때문이다. 따라서 검색엔진으로 검색된 결과를 사용자 프로파일에 따라서 재배치하는 것은 매우 필요하다. 이 논문에서는 키워드기반 검색엔진으로 검색된 결과를 사용자 프로파일에 따라 웹문서를 재배치하는 알고리즘을 제안한다. 각 키워드에 대한 가중치는 사용자가 웹문서에 대해서 수행한 행동 즉, 다운로드, 클릭, 아무행동 안함에 따라 차등 적용하여 업데이트하여 웹문서를 리스트하여 사용자에게 제공한다.

  • PDF

HCI를 위한 다중 디스플레이와 웹 정보검색 (MultiDisplay for HCI and Web Information Retrieval)

  • 양현택;박나연;김원중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.402-404
    • /
    • 2000
  • 현재 WWW(World Wide Web)는 가장 중요한 정보전달 및 획득 수단이 되었다. 대부분의 네트워크 사용자들은 웹에서 정보를 습득하기 위하여 대부분 검색엔진(Search Engine)을 사용한다. 그러나 웹에 등록되는 정보의 종류와 분량이 폭발적으로 증가함에 따라 검색엔진들이 제공하여 주는 인덱스화된 정보의 리스트들이 너무 많고, 또한 많은 문서들은 중복되어 나타나 사용자들이 효율적으로 정보를 검색하는데 문제점이 되고 있다. 본 연구에서는 다중디스플레이(MultiDisplay) 기법을 이용하여 사용자들에게 친숙하고, 웹의 정보검색에 필요한 시간과 노력을 대폭 줄이는 방안을 제시하였다.

  • PDF

전문가 검색 엔진에서 개념 그래프를 이용한 Web 정보 획득 (Information acquision of WEB using the conceptual graph in expert search engine)

  • 박사준;김상경;황수철;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.295-297
    • /
    • 2000
  • 전문가 검색 엔진은 전문가 시스템과 같은 목적에서 특정 전문 분야에 대한 특수한 정보를 수집 검색하기 위한 검색 엔진을 내용이다. 본 논문은 전문가 검색 엔진을 만드는 과정에서 초기 작업에 해당하는 웹 정보 수집에 대한 논문이다. 본 논문은 웹 페이지에서 하이퍼링크와 참조되는 웹 페이지에 대한 표면 지식을 이용하여, 홈페이지 그래프를 작성한다. 그리고 나서 홈페이지 그래프와 사전에 미리 준비된 개념 그래프를 이용하여, 웹 페이지 수집 중 특정 전문 분야에 해당하는 웹 페이지인지를 판별하여 사용자가 수집하고자 하는 분야에 대한 웹 페이지만을 수집한다. 본 논문은 이에 대한 개념, 설계 및 구현과 앞으로의 개선 상황을 제안한다.

  • PDF

자연어의 논리식으로의 변환을 이용한 고급검색 및 이를 활용한 히스토리 검색 (An Advanced Search that Converts Natural Language into the Logic Advanced Search and with Developed History Search Method)

  • 이대홍;유한석;박상원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권6호
    • /
    • pp.195-204
    • /
    • 2020
  • 현재 웹에서 존재하는 웹페이지는 16억개 이상이며 이중에서 원하는 검색결과를 얻기란 쉽지 않은 일이다. 대부분의 검색엔진에서는 정밀한 검색결과를 제공하기 위하여 논리식의 형태로 검색할 수 있게 하고 있다. 하지만 일반적인 경우 사람들은 원하는 정보를 논리식 형태로 검색하는데 익숙하지 않다. 때문에 복잡한 논리식 형태로 검색하기 보다는 자연어로 검색한다. 따라서 본 논문에서는 사용자가 입력하는 자연어 질의를 검색엔진의 고급검색을 사용할 수 있는 논리식으로 변환하여 검색결과의 품질을 향상시켜주는 검색방법을 제안한다. 또한 사용자들은 검색형태의 특징 중 하나인 단순성에 의해 길게 검색하기 보다는 여러 번의 짧은 검색을 이용하는 경우가 훨씬 많다. 이에 따라 사용자들에게 편리성을 제공하기 위하여 앞에서 제안한 검색방법을 활용한 히스토리 검색방법을 제안한다. 본 논문의 검색방법들을 사용한 결과 자연어 상태의 검색결과보다 논리식으로 변환한 검색결과의 정확도가 개선되었고 누락되는 키워드 없이 사용자가 검색하고자하는 모든 키워드를 반영할 수 있다. 이러한 검색방법이 검색엔진의 발전에 기여할 것으로 기대한다.

온톨로지기반 추론을 이용한 시맨틱 검색 시스템 (Semantic Search System using Ontology-based Inference)

  • 하상범;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권3호
    • /
    • pp.202-214
    • /
    • 2005
  • 시맨틱 웹은 단순한 문서들의 링크가 아닌 문서들의 의미와 관계를 표현하는 웹으로 소프트웨어 에이전트가 이해할 수 있도록 구성되어 있다 본 논문에서 제안하는 검색방식은 온톨로지기반의 추론을 통한 시맨틱 검색방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다. 둘째, 규칙기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치(exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다. 셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것 보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적으로 찾게 한다. 이러한 방식은 데이타베이스의 질의문을 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 검색 시스템보다 정화한 검색을 가능하게 한다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시맨틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다.

문서 특성에 대한 선호도 기반 웹 검색 개인화 (Web Search Personalization based on Preferences for Page Features)

  • 이수정
    • 정보교육학회논문지
    • /
    • 제15권2호
    • /
    • pp.219-226
    • /
    • 2011
  • 웹 상에서 사용자가 원하는 정보를 효율적으로 검색하는데 도움을 주기 위하여 웹 개인화는 사용자에게 흥미있는 웹 문서들을 추출해내는데 초점을 두고 있다. 이를 실현하기 위한 주요 방법들 중 하나는 문서에 포함된 질의어, 링크 및 사용자의 선호어를 이용하는 것이다. 본 연구에서는 이들 요소 외에 사용자들이 웹문서를 선택할 때 중요하게 생각하는 문서 특성들을 설문을 통하여 조사하였다. 설문 결과 문서의 내용이 가장 중요한 특성이었으나, 일부 사용자들에게는 문서에 포함된 이미지와 가독성도 내용과 마찬가지로 중요하게 간주되었다. 이를 바탕으로 각 사용자를 위한 문서의 주요 특성들의 상대적 가중치를 프로필에 유지 관리하고, 검색 결과의 개인화에 반영하는 방안을 제시한다. 제안한 개인화 방법의 성능을 분석한 결과, 일반 검색 엔진에 비해 최대 약 2.3배의 성능 향상을 보였고, 사용자 질의어와 선호어를 모두 이용하여 검색 결과를 산출하는 방법보다 약 1.5배의 성능 향상을 나타내어 그 우수성을 입증하였다.

  • PDF

대학도서관의 OPAC 2.0 서비스에 대한 이용자 인식 조사 (A Survey of User Perceptions of OPAC 2.0 Service in Academic Library)

  • 이혜영
    • 한국도서관정보학회지
    • /
    • 제43권2호
    • /
    • pp.179-201
    • /
    • 2012
  • 현재 대부분의 대학도서관에서는 Web 2.0을 기반으로 한 인터넷 검색엔진의 기능을 온라인목록에 적용시킨 OPAC 2.0 서비스를 제공하고 있다. 새로운 서비스 제공은 이용자들의 편의를 위해 필요한 것이며 그렇기 때문에 중요한 것은 각 서비스에 대한 이용자들의 의견을 고려하는 것이다. 이에 본 연구에서는 대학도서관 OPAC 2.0 이용자인 대학생들을 대상으로 OPAC 2.0 서비스(주요 기능)에 대한 중요도 인식과 이와 관련된 도서검색시 이용하게 되는 이용원 및 그 이유에 대하여 조사 및 분석하였다. 조사 및 분석결과 OPAC 2.0 서비스에 대하여 이용자들은 '정확하고 만족스러운 검색결과'를 원하고 있었으며 단순히 '화면이 익숙하고 열람 및 대출이 편리하다.'는 이유로 '소속 대학도서관 온라인목록'을 도서검색 정보원으로 이용하고 있었다. 이용자들의 의견이 고려된 OPAC 2.0 서비스의 개선이 필요하다.

시멘틱 웹/온톨로지 기술을 이용한 개인용 전자문서 검색 시스템 (Personal Electronic Document Retrieval System Using Semantic Web/Ontology Technologies)

  • 김학래;김홍기
    • 한국전자거래학회지
    • /
    • 제12권1호
    • /
    • pp.135-149
    • /
    • 2007
  • 개인 사용자가 전자문서를 쉽게 사용하려면 전자문서를 효과적으로 분류하고, 정확하게 검색할 수 있는 기능이 필요하다. 그러나 개인 사용자의 컴퓨터에 저장된 문서를 효율적으로 관리하기 위한 방법이나 도구에 대한 연구는 상대적으로 미흡한 상태이다. 본 연구는 개인 사용자가 전자 문서를 효과적으로 관리하고 검색하기 위한 방법을 제안한다. 연구 결과인 ONTALK은 모든 전자문서의 메타데이터를 온톨로지 기반으로 생성하고, 추론엔진(inference engine)을 이용하여 의미적(semantics) 정보 검색을 제공한다.

  • PDF

웹 사용자 누적 사용정보 기반의 키워드 검색 모델 (A Keyword Search Model based on the Collected Information of Web Users)

  • 윤성희
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.777-782
    • /
    • 2012
  • 본 논문은 웹 검색 시스템의 사용자 질의에 대한 키워드 색인 기반의 검색 과정에서 적합 문서를 선별하기 위해 검색 키워드의 의미정보와 사용자의 누적 사용정보를 사용하여 검색 성능을 향상시키는 방법을 소개한다. 검색 키워드 의미 정보를 이용하는 검색 방법은 검색 결과로서 의미적으로 무관한 많은 문서들을 배제할 수 있고, 사용자의 누적된 사용정보는 관심사에 중심을 둔 검색문서들을 상위에 제시할 수 있다. 검색 키워드의 의미정보 지식베이스를 구축하고, 검색 문서들을 색인어와 해당 의미범주로 분류하며, 사용자의 정답 문서 참조 행위에 대한 누적 정보를 순위 결정에 반영하여 검색 성능을 향상시킬 수 있다.