• 제목/요약/키워드: 메타검색엔진

검색결과 82건 처리시간 0.024초

DCAT 기반 메타데이터의 웹 출판을 위한 변환 기법 (Transformation Method for Publishing DCAT based Metadata in Data Repository on Web)

  • 박진효;김기훈;김성희;윤주상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.491-493
    • /
    • 2021
  • 최근 데이터 산업 발전과 함께 데이터를 저장, 공유, 거래가 가능한 다양한 데이터 저장소와 거래소가 증가하고 있다. 대부분의 데이터 저장소 및 거래소는 데이터 검색과 공유를 위해 DCAT 기반 메타데이터를 구성하고 있다. 하지만 DCAT 기반 메타데이터는 웹 검색 엔진에서 검색이 잘되지 않는 문제점을 가지고 있다. 이는 웹에서 자원을 출판하기 위한 데이터 모델 기법이 Schema.org 방법을 사용하고 있기 때문이다. 본 논문에서는 이런 문제점을 해결하기 위해 DCAT 기반 메타데이터를 Schema.org 방법으로 변환할 수 있는 새로운 기법을 제안한다. 제안하는 변환 기법은 데이터 저장소와 거래소 내 데이터셋이 웹에서 잘 검색될 수 있는 웹 출판 기능을 지원한다.

온톨로지 기반 개인 미디어 메타데이터 자동 생성 (Ontology-based Metadata Automated Generation for Personal Media)

  • 최정화;서희철;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.340-345
    • /
    • 2006
  • 개인 디지털 콘텐츠 증가에 따른 개인 미디어의 관리를 위해 대량의 메타데이터를 자동으로 생성하는 연구가 반드시 필요하다. 본 논문에서는 온톨로지 기반의 추론을 이용하여 개인 미디어 메타데이터를 자동으로 생성하는 방법을 제안한다. 제안한 방법은 부족한 정보로부터 적합한 의미를 추출하여 메타데이터를 자동 생성하므로 콘텐츠관리의 어려운 문제점을 해결한다. 본 논문에서 제안하는 방법을 사용자가 메모를 부착하기만 하면, 온톨로지 기반 추론을 통해 메타데이터를 자동 생성하는 방법으로 다음과 같은 세가지 기술과 특징을 갖는다. 첫째, 개인 미디어 온톨로지를 정의한다. 둘째, 미디어 메타데이터 표준을 정의한다. 미디어의 종류가 다르더라도 정의한 표준의 키워드만 추출할 수 있다면 미디어의 통합관리가 가능하다. 셋째, 메타데이터 자동 생성 기술을 연구한다. 단순히 온톨로지에 정의된 키워드의 의미만을 보지 않고, 온톨로지 기반의 추론엔진을 이용하여 사용자를 중심으로 관련 키워드의 관계를 고려한 메타데이터 생성의 정확성을 높인다. 이러한 기술을 기반으로 시맨틱 검색도 가능하며, 기존의 메타데이터 저작도구와 비교하여 보다 정확한 메타데이터 자동생성과 검색이 가능하다.

  • PDF

온톨로지 기반의 시맨틱 검색 시스템에 대한 연구 (A Study on Ontology-Based Semantic Search System)

  • 허선영;김은경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.463-466
    • /
    • 2007
  • 현재 웹 서비스에서 주로 사용하고 있는 키워드 기반 검색은 사용자의 의도와는 상관없는 정보까지 검색하는 경우가 많아서, 실제로 원하는 정보를 찾는데 많은 시간과 노력을 요구한다는 단점이 있다. 이러한 단점을 보완하기 위해서 최근 시맨틱 웹이라는 개념이 등장하였으며, 본 논문에서는 검색 결과의 신뢰성을 향상시키기 위해 온톨로지를 기반으로 시맨틱 검색시스템을 설계하였다. 본 논문에서 설계한 온톨로지 기반의 시맨틱 검색 시스템은 기능적으로 크게 두 부분으로 구성되어 있다. 즉, 자료 수집을 하는 로봇 에이전트와 온톨로지를 기반으로 자료를 검색하는 시맨틱 검색 엔진으로 구성된다. 로봇 에이전트는 자율적으로 웹을 순회하면서 자료를 수집하고 필터링하여 메타데이터 저장소로 가져오는 역할을 한다. 시맨틱 검색 엔진은 사용자의 검색 폼으로부터 전달된 정보 검색 요구사항을 기초로 시맨틱 질의어로 변환한 후, 온톨로지 저장소를 활용하여 검색한다. 시맨틱 검색 엔진은 사용자가 입력한 검색어를 시맨틱 질의어로 변환해 주는 질의처리 모듈과 사용자의 의도를 추론하여 보다 향상된 검색을 가능하게 해주는 추론(Inference) 모듈, 온톨로지를 보관해주는 온톨로지 저장소 등으로 구성된다. 본 논문에서 설계한 온톨로지 기반의 시맨틱 검색 시스템은 키워드 기반 검색에 비해 사용자가 원하는 정보를 찾는데 소요되는 시간과 노력을 줄여 주고, 사용자의 의도에 적합한 정보를 제공할 것으로 기대된다.

Open API 기반 메타 검색시스템의 사용성 평가에 관한 연구 (A Study on the Construction and Usability Test of Meta Search System Using Open API)

  • 구중억;이응봉
    • 정보관리학회지
    • /
    • 제26권1호
    • /
    • pp.185-214
    • /
    • 2009
  • 본 연구는 온라인목록의 Open API 기반 일반 검색시스템과 온라인목록의 Open API 기반 메타 검색시스템을 구축하고 두 실험시스템의 사용성을 비교 평가하여 온라인목록의 Open API 기반 메타 검색시스템의 유용성을 밝히고자 하였다. 사용성은 전체적으로 온라인목록의 Open API 기반 일반 검색시스템 보다온라인목록의 Open API 기반 메타 검색시스템이 더 높게 나타났고, 통계적으로유의한 차이가 있는 것으로 나타났다. 국내 도서관들이 인터넷서점, 검색엔진, 웹포털 등에서 공개한 도서검색용 Open API를 통해 제공되는 풍부한 콘텐트를 온라인목록에서 공유하고 활용하면 서지데이터의 확충, 주제접근과 주제검색 능력의 확대, 메타 검색서비스의 확장, 소장도서의 이용가능성 증대, 목록비용의 절감 등에 도움이 될 것으로 기대된다.

자연어 질의 문맥 구조 기반 개인형 메타 검색 에이전트 (A Personalizable Meta-Search Agent Based on Natural Query Context Structure)

  • 박기선;이덕남;김우주;이용석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.688-690
    • /
    • 2002
  • 인터넷과 웹의 팽창과 함께 가용 정보의 양이 폭발적으로 증가하고 있으나 이에 대응되는 효과적이고 효율적인 정보 검색능력의 지원이 없다면 이와 같은 방대한 정보들은 정보 이용자들에 있어 이용 가치가 없으며 이는 곧 정보 범람(information overflow)을 의미한다. 본 논문에서는 이에 대한 해결 방안으로써 사용자의 편이성과 정보검색 능력을 극대화할 수 있는 자연어 질의 문맥 구조 기반 개인형 메타 정보검색 엔진을 제안하고자 한다.본 방법론은 자연어 질의를 기본 입력 형태로 하여 자연어 질의의 문맥 구조(context structure) 및 기타 정보 평가 요소들을 이용하는 다척도(multi-criteria)의사 결정 기법 및 개인형 메타 정보 평가(information rating) 방법론으로 구성되어 있으며 이를 위한 시스템 설계를 제안한다.

  • PDF

메타데이터 기반 시맨틱 검색 (Semantic Search based on Metadata)

  • 최정화;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.694-696
    • /
    • 2005
  • 본 논문은 `시맨틱 검색`을 위해서 시맨틱 웹 기술을 사용하여 사용자가 원하는 콘텐츠 제공을 위한 시맨틱 검색 방법을 제안한다. 본 연구는 현재 웹의 단점인 사람 위주의 웹 구성, 단순 텍스트 매칭 기반의 검색, 사람의 필터링이 필요한 대량의 결과, 특정 지식 검색이 불가능한 구조의 웹을 시맨틱 검색이 가능하도록 하기 위해서 다음과 같은 단계로 연구한다. 첫째, 도메인에 따른 정확한 정보의 제공을 위해서 OWL 온톨로지를 이용하여 컨텍스트 모델링한다. 둘째, 도메인 관련 웹 문서를 수집하고 도메인 온톨로지를 기반으로 키워드의 의미를 분석하고 주석 처리(annotation)한다. 셋째, 사용자의 자연어 질의에 의미있는 컨텍스트를 추가하여 질의를 확장한다. 넷째, 확장된 질의를 규칙기반 추론엔진을 이용하여 결과를 추론한다. 마지막으로, 사용자 프로파일 분석을 이용하여 선호하는 문서를 우선으로 추천하는 방법을 연구한다. 따라서 본 연구는 질의어에 해당하는 결과문서가 존재하지 않더라도 사용자가 선호하는 문서의 추론이 가능하고, 특정 도메인의 전문가 지식을 추가한 메타 데이터 추론을 통해서 검색 패러다임을 변화시킨다.

  • PDF

메타데이터 정보를 이용한 분산 KRISTAL-2002 시스템의 통합 검색 시스템 개발 (Development of an Integrated Retrieval System on Distributed KRISTAL-2002 Systems with Metadata Information)

  • 최귀자;김재곤;서정현;조한형;이민호;정창후;박동인;남영광
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.135-150
    • /
    • 2005
  • 본 논문에서는 메타데이터fmf 이용하여 분산된 KRISTAL-2002 기반의 시스템을 통합 검색하는 정보검색시스템의 구현 방법을 제안한다. 이 시스템은 서로 다른 분야에서 사용되고 있는 기개발된 정보검색시스템을 통한 검색하거나, 같은 분야의 시스템이라도 스키마가 다를 경우에 이를 사용자가 마치 하나의 시스템에서 검색하는 것과 같은 통합검색을 수행할 수 있도록 해준다. 본 시스템은 통합메타데이터베이스와 원천서버간의 스키마 매핑을 지원하는 원천서버관리기, 메타데이터를 등록하고 원천서버의 정보와 통합 메타데이터간의 매핑을 관리하고 지원하는 통합메타데이터 관리기, 통합검색을 위한 사용자 신의를 각 원천서버에 적합한 질의로 생성하여 처리하는 분산질의 처리기, 검색된 결과를 통합하여 사용자 화면으로 출력하기 위해 HTML 문서로 변환하는 분산 데이터 셋 관리기, 그리고 통합검색을 위한 통합검색 엔진으로 구성되어 있다. 통합메타데이터는 본 시스템의 일부분인 메타데이터 등록기를 이용하여 ISO/IEC 11179에서 정의된 표준화된 절차고 등록되었다고 가정하여 사용하였다. 사용자는 하나의 통합시스템에서 검색하는 것과 같이 통합검색 화면에서 검색대상 시스템을 선정하고 기본검색과 상세검색을 수행하며, 분야별 혹은 기관별로 검색하고 결과를 볼 수 있도록 하였다. 본 시스템은 KRISTAL-2002 시스템을 기반으로 Visual C++와 C++ CGI를 이용하여 리눅스 상에서 개발되었으며 6개의 서로 다른 데이터베이스fmf 이용하여 실험, 검증하였다.

Invisible Web 탐색도구의 성능 비교 및 분석 (The Effectiveness of the Invisible Web Search Tools)

  • 노정순
    • 정보관리학회지
    • /
    • 제21권3호
    • /
    • pp.203-225
    • /
    • 2004
  • 본 연구는 표준 웹 탐색엔진에 색인되지 않는 Invisible Web에 대한 특성과 Invisible Web 탐색도구들을 파악하고, 이들 도구에서 Invisible Web 탐색의 성능을 비교 평가하기 위해 수행되었다. 표준 웹 탐색엔진이 Google과 Invisible Web 탐색엔진인 Incy Wincy, Invisible Web 메타탐색엔진인 Profusion과 Search. com 에서 11개의 탐색질문이 탐색되었다. Profusion과 Search. com, Incy Wincy에서의 Invisible Web(메타) 탐색 기능은 이 세 엔진에서 제공하는 웹 메타탐색기능과도 비교되었다. 탐색결과 Google이 Invisible Web 탐색에서 Invisible Web 탐색엔진보다 .15 -.35 높은 적합성순위정확률을 보였지만 통계적으로 유의한 차이는 아니었다. (${\alpha}$=.055). Invisible Web 탐색엔진에서 웹 메타탐색은 Invisible Web(메타)탐색보다 통계적으로 유의한 수준에서 더 우수한 것으로 나타났다. 성능평가에 사용된 적합성순위정확률은 검색된 문헌의 질 (적합성)과 적합문헌의 순위를 반영하는 정확률 척도로 사용될 수 있음을 보여주었다.

사용자 정의 타입에 기반한 메타데이터 레지스트리를 위한 일관성 있는 질의 언어 (User-defined types Based Consistent Query Language for Metadata Registry)

  • 김장원;정동원;백두권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.1-4
    • /
    • 2009
  • 이 논문에서는 메타데이터 레지스트리(ISO/IEC 11179: Metadata Registry)들이 가지고 있는 메타데이터 정보를 검색하고, 공유하기 위해 일관성 있는 질의 언어를 제안한다 메타데이터 레지스트리는 국제 표준으로서 메타데이터들을 정의하고 이들을 관리 및 공유를 하기 위해 만들어졌다. 이와 같은 국제 표준을 기반으로 한 메타데이터 레지스트리들이 서지, 환경, 의료 분야 등의 다양한 영역에서 사용되고 있다. 이와 함께 메타데이터 레지스트리를 기반으로 하여 기존에 저장된 메타데이터들을 검색하고, 공유하고, 관리하고자 하는 이슈에 대한 연구가 진행되고 있다. 하지만 현재까지 다양한 분야에 있는 메타데이터 레지스트리가 가지고 있는 정보를 가져오기 위한 표준 인터페이스가 제공되고 있지 않다. 이러한 문제를 해결하기 위한 연구로 SQL에 메타데이터 레지스트리를 위한 공통 연산자들을 추가하여 메타데이터 레지스트리에 존재하는 데이터들을 활용하는 연구가 있다. 하지만 이런 연산자들을 이용하기 위해서는 상용 DBMS 엔진에 추가되어야 하며, 연산자들이 없는 경우 일관된 질의어를 수행할 수 없다는 문제를 가지고 있다. 따라서 이 논문에서는 이와 같은 문제를 해결하기 위해서 국제 표준인 SQL(ISO/IEC 9075) 에서 정의하고 있는 사용자 정의 타입(User-defined types) 을 기반으로 한 일관성 질의 언어를 제안한다.

  • PDF