• 제목/요약/키워드: Directory Search Engine

검색결과 18건 처리시간 0.021초

BRS/Search 시스템을 이용한 XML 문서 검색시스템 설계 및 구현 (Design and Implementation of a XML Document Retrieval System Using the BRS/Search System)

  • 손충범;이병엽;유재수
    • 인터넷정보학회논문지
    • /
    • 제2권2호
    • /
    • pp.51-63
    • /
    • 2001
  • 본 논문에서는 상용 검색 엔진인 BRS/Search 시스템을 이용하여 XML문서에 대한 구조 기반 검색이 가능하도록 XML문서 검색시스템을 설계하고 구현한다. 본 논문에서 구현한 시스템은 XML문서의 논리적인 구조를 Unix 파일시스템의 디렉토리 구조로 표현한다. 이렇게 표현된 XML 문서를 BRS/Search 시스템의 데이터베이스에 정보의 손실 없이 저장하기 위해 데이터베이스 스키마를 정의하고 내용 검색뿐만 아니라, 구조 검색, 혼합 검색, 애트리뷰트 검색이 가능하도록 BRS/search 시스템에 부가적으로 필요한 ETID 추출기, 구조정보 추출기, 저장 관리기, 질의 처리기를 설계하고 구현한다.

  • PDF

유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구 (A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research)

  • 박동진;최기석;이명선;이상태
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.54-62
    • /
    • 2009
  • 국가적으로 그리고 각 연구기관에서는 투자의 효율성을 기하기 위하여 연구사업 선정과정에서 데이터베이스로부터 중복과제 혹은 유사과제를 검색하는 과정을 거친다. 최근 부얼리언 기반의 키워드 매칭 검색알고리즘의 발전 및 이를 채택한 검색엔진의 개발로 인하여 검색의 정확도가 많이 향상되었지만, 사용자가 입력하는 제한된 수의 키워드들에 의한 검색은 유사과제 파악과 우선순위의 결정에 어려움이 있다. 본 연구에서는 제안된 과제의 문서를 분석하여 다수의 색인어들을 추출하고, 이들에게 가중치를 부여한 후, 기존의 문서들과 비교하여 유사과제를 찾아내는 문서단위의 검색 알고리즘을 제안한다. 구체적으로 벡터공간검색(Vector-Space Retrieval)모델의 한 종류인 TFIDF(Term Frequency Inverse document Frequency)를 기본 구조로 채택한다. 또한 개발되는 알고리즘에는 연구과제 제안문서의 구조에 적합한 속성별 가중치(feature weighting)를 반영하고 검색속도의 향상을 위하여 K-최근접 문서(KNN: K-Nearest Neighbors) 기법도 반영한 알고리즘을 제시한다. 실험을 위하여 실제 연구제안 문서와 구조가 동일한 기존의 보고서를 사용하였는데, KISTI에서 운영하는 과학기술정보포털서비스인 NDSL에서 이미 분류해 놓은 4분야의 1,000 개 연구 보고서 문서를 발췌하여 실험을 하였다.

패싯 분석을 이용한 웹 자원의 조직 (A Study on Organizing the Web Using Facet Analysis)

  • 유영준
    • 한국비블리아학회지
    • /
    • 제15권1호
    • /
    • pp.23-41
    • /
    • 2004
  • 웹 자원을 색인 및 조직하는 데에는 키워드 추출에 기반한 자동색인에 의한 방법과 기존의 분류 체계나 주제별 디렉토리를 이용하는 방법이 있다. 그러나 두 방법은 각각 표준적인 방식이 없거나 분류 구조상의 불합리성으로 인하여 이용자의 정보 요구에 제대로 대처하지 못하고 있다. 따라서 이 논문에서는 기존 분류 체계의 구조상의 한계와 특정성과 망라성과 같은 웹 자원의 특성과 관련된 문제를 지적함과 더불어 패싯 분석에 의한 웹 자원 조직의 타당성과 그 장단점을 기술하였다. 그리고 패싯 분석을 이용 한 구체적인 방법론 세 가지를 제시하였다. 첫째, 패싯 분석을 기반으로 한 색인 시스템, 둘째, 열거형 분류 체계를 패싯 분류 체계로 구조를 수정한 대안, 셋째, 국내 검색 엔진의 주제별 디렉토리의 패싯 모형 등이다. 이러한 방법론들을 검토한 결과, 패싯 분석에 의한 통제어휘 구축이 웹 자원을 조직하는 수단으로 활용될 수 있는 가능성을 제시하였다.

  • PDF

사용자 중심의 홈페이지 분류체계가 분류 검색에 미치는 효과 (The Effect of User-Centered Categorization System of Homepages on Directory Search)

  • 박창호;염성숙;이정모
    • 인지과학
    • /
    • 제11권1호
    • /
    • pp.47-65
    • /
    • 2000
  • 정보검색 엔진이 제공하는 홈페이지의 분류체계는 사용자보다는 시스템을 고려하여 구성되기 쉽다. 본 연구는 대표적인 검색엔진들을 중심으로 분류체계에서 대분류 및 중분류에 대한 사용자들의 심성 모형을 조사하고, 이를 바탕으로 중복 분류체계와 단선 분류체계를 구성하였다. 중복 분류체계에서는 한 하위 분류 명이 여러 상위 분류에 소속될수 있으며, 단선 분류체계에서는 그렇지 않다. 심마니 분류체계를 포함시켜, 세 분류체계를 디자인한 다음 검색 문제를 제시하여 이에 대한 분류 검색 수행을 2차에 걸쳐 관찰하였다. 정답 빈도. 검색에 소요된 단계수 및 경과한 시간 등의 자료를 종합적으로 볼 때, 중복 분류체계에서의 수행이 다른 두 조건보다 좋았다. 이는 적절한 분류체계에서 분류 검색이 향상될 수 있음을 시사한다. 그러나, 분류체계에 대한 재인 검사 점수는 단선 분류체계에서 가장 좋았다. 이는 분류 검색 수행과 분류체계의 재인 기억이 분류체계의 학습에서 상이한 측면을 반영할 것임을 시사한다. 끝으로 분류의 조직화, 인터페이스 방식, 사전지식, 탐색학습 및 응용 영역에 대한 논의가 있었다.

  • PDF

여성학분야 인터넷 자원의 분류체계에 관한 연구 (A Study on the Classification Scheme of Internet Resource for Women's Studies)

  • 이란주;성기주;양정하
    • 한국도서관정보학회지
    • /
    • 제32권3호
    • /
    • pp.397-417
    • /
    • 2001
  • 인터넷에서 제공되고 있는 검색엔진들은 모든 분야의 정보를 수집하여 분류하기 때문에 전문적인 검색을 원하는 이용자에게 유용한 정보원의 역할을 수행하지 못하고 있다. 따라서 특정분야의 효율적인 정보검색을 위한 체계적인 디렉토리의 구성과 배열로 이용자 편이를 도모해야 할 필요성이 있다. 따라서 본 연구에서는 인터넷 검색엔진에서 사용하고 있는 여성학 분야 및 전문데이터베이스 분류체계의 특징 및 문제점을 분석하여 여성학분야의 효율적인 분류체계에 관한 지침을 제안하고자 한다. 이를 위하여 인터넷 검색엔진 5개와 여성학 전문데이터베이스 3개를 선정하여 항목상세비교방법과 포괄성과 논리성 측면으로 비교하였으며 여성학분야의 성격인 간학문적(interdisciplinary), 다학문적(multidisciplinary) 성격을 반영한 분류체계의 지침을 제시하였다.

  • PDF

인테리어 디자인 분야 인터넷 정보 자원 활용을 위한 분류체계 연구 (A Study on Classification System for using internet information resources on Interior Design)

  • 임경란
    • 디자인학연구
    • /
    • 제17권4호
    • /
    • pp.79-88
    • /
    • 2004
  • 본 연구는 인터넷 정보자원의 조직 문제를 파악하고 검색엔진의 특성을 유추하여 인터넷 정보자원의 분류 및 경가 기준으로 정립하였다. 이를 기반으로 인테리어 디자인 분야의 인터넷 정보 분류체계 개선안을 제시하였다. 또한 인터넷 기반 분류체계를 제공하는 주제별 디렉토리 사이트와 국외의 전문 정보사이트의 인테리어 디자인 분야 분류체계를 비교 분석하여 봄으로써 웹 주제별 디렉토리의 인테리어 디자인 정보 분류체계 모형의 구축을 시도하였다. 이들의 분류체계는 주제범위의 포괄성, 분류체계의 논리성, 주제용어의 정확성, 탐색의 효율성의 4가지 척도를 가지고 분석하였다. 그리고 인테리어 디자인 분야의 정보는 관련 분야의 정보와 혼재되어 정보의 검색이나 분류가 체계적으로 구성되어 있지 못하다. 이러한 문제점을 분석하여, 인테리어 디자인 분야 정보 분ㄹ를 위한 검색엔진의 분류체계 모형을 제시하였으며 이는 학술적인 면과 실용적인 면을 고려하였다.

  • PDF

사이버교과서박물관 데이터베이스 구축에 관한 사례 연구 (A Case Study on the Construction of Cyber Textbook Museum Database)

  • 김은주;이명희
    • 한국비블리아학회지
    • /
    • 제20권4호
    • /
    • pp.67-84
    • /
    • 2009
  • 이미 발행된 교과서를 대상으로 원문 데이터베이스를 구축하고 서비스를 제공하기까지 교과서 표현 메타데이터 정의, 원문 파일 포맷의 정의, 시스템의 개발과 이를 구체적으로 구축한 사례를 정부의 지식자원관리사업의 일환으로 구축된 한국교육개발원의 '사이버교과서박물관' 구축사례를 통해 알아보았다. 사이버교과서박물관에서는 1890년대 이후 국내에서 제작된 교과서를 데이터베이스화하여 온라인상에서 열람 및 이용이 가능하게 하였다. 시스템 구축은 주요 기능을 중심으로 홈페이지 구축, 검색시스템의 개발, 교과서 원문서비스의 저작권에 따른 원문관리시스템의 구축, 서비스하는 교과서의 저작권을 보호하기 위한 저작권 관리시스템(DRM)의 개발에 이르기까지 교과서 자료의 특수성에 따른 시스템 개발상에서의 차별적인 요소를 중심으로 소개하였다. 정책적, 기술적, 제도적, 활성화 안의 4가지 측면에서 방안을 제시하였다.

기독교 분야 웹문서 분류체계 설계를 위한 비교 분석적 고찰 (A Comparative Study on the Design of Classification System for Christian Information Resources on the Internet)

  • 김명옥
    • 한국문헌정보학회지
    • /
    • 제41권3호
    • /
    • pp.127-144
    • /
    • 2007
  • 이 연구는 기독교 분야 인터넷 정보자원을 효율적으로 조직. 활용하기 위하여 기독교 분야 웹문서 분류체계의 모형을 제시하기 위한 것이다. 이를 위하여 (1) 문헌분류표인 KDC 4판, DDC 22판, LCC 2000년판의 기독교 분야의 강목을 비교 분석하고. (2) 국내 종합포털사이트 중 기독교 분야의 웹사이트 수가 많은 다음, 엠파스, 네이버의 기독교 분류항목을 비교 분석하며, (3) 기독교 종합포털사이트 중 가장 많이 이용되는 갓피플, 기독정보탐색 갓피아의 분류항목을 비교 분석하고, (4) KDC, DDC와 갓피플의 강목을 비교 분석한다. (5) 분석 결과를 토대로 웹문서를 위한 기독교 분야 분류체계(안)을 제시한다. 본 연구 결과, 1차구분은 10개 항목을 배정하고, 그 하위항목으로 2차 구분하여 세분한 2단계 계층구조를 설계하였다.