• 제목/요약/키워드: 웹 색인작성

검색결과 10건 처리시간 0.02초

웹 색인작성에 관한 연구 (A Study on Web Indexing)

  • 윤구호
    • 한국도서관정보학회지
    • /
    • 제33권2호
    • /
    • pp.235-258
    • /
    • 2002
  • 최초의 웹 페이지가 인터넷 상에 올려진 1991년 이래, 인터넷 상의 무수한 웹 사이트 정보검색은 전통적 색인작성 방법과는 상이한 새로운 방법을 개발하고 있다. 본고는 새롭게 발전하는 웹 색인작성에 관한 기초연구로서, 그의 기초가 되는 삽입색인을 살펴보고, 웹 사이트의 정보제공을 위해 필수적인 메타 태그와 웹 색인을 위한 그들의 작성방법을 검토하고, 웹 색인작성에 관한 주요사항을 비교적 상세하게 연구검토하였다.

  • PDF

기독교 관련 웹 사이트 내 색인에 관한 연구 (A Study on Christian Website Indexing)

웹 정보자원의 색인과 초록 요소에 관한 연구 (A Study on the Elements of Indexing and Abstracting on the World Wide Web)

  • 최재황
    • 한국문헌정보학회지
    • /
    • 제33권1호
    • /
    • pp.113-128
    • /
    • 1999
  • 인쇄물의 색인과 초록은 통제어나 시소러스를 이용하여 합의된 방식으로 작성되지만, 웹 정보자원의 색인과 초록은 인간의 작업을 거치지 않고 자동으로 작성된다. 웹 환경에서의 색인과 초록은 인쇄물의 색인${\cdot}$초록과 비교하여 어떠한 과정을 거치며, 어떠한 요소들을 포함하는가에 대한 연구는 매우 의미 있는 일이라고 본다. 본 연구에서는 휑 정보자원의 수집, 색인 저장, 검색의 과정을 살펴보았고, 6개의 웹 검색 엔진을 통하여 색인과 초록작성에 영향을 미칠 수 있는 17개의 색인 요소와 11개의 초록 요소 그리고 2개의 메타 요소를 조사하였다. 전반적인 웹 정보자원의 색인과 초록에 대한 경향과 전망에 대해서도 살펴보았다.

  • PDF

XML 기반의 고문헌 검색 시스템 설계 (The Design for Ancient Literature Retrival System Using XML)

  • 이근우;이근무
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.390-394
    • /
    • 2001
  • 논문에서는 최근 인터넷 상에서 표준 공통 포맷으로 대두되는 XML을 이용하여 웹 기반의 역사자료의 데이터베이스 검색 시스템을 설계 및 구현하였다. 원격 교육 시스템의 참조문헌 지원 시스템을 설계하였다. 컴퓨터 상에서 고문헌 자료 주로 한자를 입력하고 검색할 수 있는 환경이 점차 나아지고 있다고는 하지만, 여전히 원전사료의 한자를 일반적인 환경에서 자유롭게 구현하는 일은 결코 용이하지 않다. 종래의 연구자들은 텍스트 별로 수작업으로 작성한 색인류를 이용하여 연구를 해왔다. 그러나 이러한 색인 이용방법에는 문제가 있다. 색인어로 삼고자 하는 단어를 텍스트에서 추출하는 과정에서 누락되는 경우가 있기 때문이다. 전산화된 데이터는 이른바 '발견적 이용'이라는 관점에서 활용될 수 있다.

  • PDF

XML 데이터베이스를 위한 다차원 중포 엘리먼트 색인구조의 운용과 할당 (Operations And Assignments Of Multidimensional Nested Element Indexs For XML Databases)

  • 이정아;이종학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.401-404
    • /
    • 2006
  • 최근 XML 데이터베이스는 웹의 발전과 더불어 광범위한 인터넷의 자원 공유에 크게 기여하고 있다. XML로 작성된 문서를 저장하고 검색하기 위해 XML 문서의 저장, 질의언어, 질의처리 등에 대한 분야가 활발히 연구되고 있다. 특히 그 중 질의처리의 처리비용을 줄이기 위한 데이터 질의 최적화 기법에 관한 연구가 중요한 과제이다. 증포된 엘리먼트에 대한 기존의 색인기법들은 일차원 색인구조를 이용함으로써 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원하지 못하는 문제점을 가지고 있다. 따라서 본 논문에서는 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원할 수 있는 다차원 증포 엘리먼트 색인구조와 다차원 경로 엘리먼트 색인구조의 운용법을 제시한다. 또한 효과적인 질의 처리를 하기 위한 XML 데이터베이스 색인구조의 유지비용을 줄이기 위하여 저장 공간 및 갱신 유지 비용을 최소화할 수 있는 효과적인 색인할당 방법을 제시한다.

  • PDF

시맨틱 웹 환경에서 적합한 문장을 제공하는 이야기 쓰기 도우미에 관한 연구 (A Study of Retrieval Model Providing Relevant Sentences in Storytelling on Semantic Web)

  • 이태영
    • 정보관리학회지
    • /
    • 제26권4호
    • /
    • pp.7-34
    • /
    • 2009
  • 이야기 쓰기를 돕는 본문 및 문장 검색시스템의 구축을 위해서 (1) 이야기와 단락 및 문장의 구조를 분석하고 (2) 색인작성과 탐색 질문에 적용되는 언어 추론을 연구하였다. 이야기 쓰기에 필요한 이야기, 단락, 그리고 문장으로 구성된 사항 데이터베이스와 필요한 추론규칙으로 이루어진 지식베이스와 온톨로 지가 고안되었다. 추론의 기초인 실례(實例) 파일들은 시맨틱 웹 환경에서 작동될 마크업 언어 형식으로 만들어졌다. 시맨틱 웹 환경에서 실용적인 시스템이 되려면 단락과 문장을 정확히 대변하는 색인 방법론과 이를 정밀하게 지식베이스화 할 수 있는 마크업 언어의 창조가 필수적이라 사료된다.

마크업 패턴을 이용한 웹 검색 (Web Information Retrieval Exploiting Markup Pattern)

  • 김민수;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권6호
    • /
    • pp.407-411
    • /
    • 2007
  • HTML은 웹 페이지의 시각적 표현을 목적으로 하고 있기 때문에, HTML로 작성된 웹 문서에 대한 색인과 질의는 쉬운 문제가 아니다. 그러나 웹 페이지를 표현하는 태그들이 가진 내재적 의미들은 검색 엔진의 성능을 향상시킬 수 있는 가능성을 가지고 있다. 본 논문은 이러한 HTML 태그의 내재적 의미를 이용하기 위해 마크업 패턴을 정의하고, 이를 웰 검색에 응용함으로서 검색 성능을 향상하고자 한다. 마크업 패턴은 웹 레이지 작성자의 표현 의도를 담고 있으며, 명시적으로 하나 이상의 HTML 태그의 연속으로 표현된다. 웹 페이지에서 마크업 패턴을 찾아내고, 이를 웹 검색에 응용하기 위해 본 논문에서는 웹 문서를 재색인하는 방법을 제안한다. 제안하는 방법을 적용한 웹 검색의 성능 향상을 증명하기 위해, BBC와 CNN 웹 사이트의 문서들을 대상으로 실험을 진행하였다. 대상 문서들은 제안한 방법을 통해 가중치를 갖게 되며, 특정 질의에 대한 정확도를 기존 검색 엔진과 비교하여, 본 논문에서 제안하는 마크업 패턴을 이용한 웹 검색의 성능 향상을 증명할 것이다.

비정형 문서의 정보추출을 통한 OWL 온톨로지 구축 시스템의 설계 및 구현 (The Design and Implementation of OWL Ontology Construction System through Information Extraction of Unstructured Documents)

  • 조대웅;최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.23-33
    • /
    • 2014
  • 정보검색 분야의 발전은 많은 양의 정보를 빠르게 찾아주는 것에서 사람이 원하는 정보를 정확하게 찾아주는 연구 분야로 넓혀가고 있다. 핵심 기술로는 개인화 및 시맨틱 웹 기술을 활용하고 있다. 웹 문서에 대한 자동색인 기술과 처리능력은 연구단계를 넘어 실용 서비스로 나타나고 있다. 하지만 웹 문서 이외의 첨부된 문서 형태에 대한 문서정보검색에 관한 연구는 미진한 상황이다. 본 논문에서는 텍스트, 워드, 한글과 같은 형식으로 작성된 비정형 문서의 본문 내용을 분석하여 OWL 온톨로지로 구축하는 방법에 대해 설명한다. 문서 온톨로지의 TBox를 구축하고, 문서로부터 얻을 수 있는 자원을 선정하여, 구축된 문서 온톨로지의 인스턴스로 활용할 수 있도록 시스템으로 구현한다. 이와 같은 비정형 문서의 온톨로지 자동 구축으로 해당 문서의 시맨틱 기술을 이용한 정보검색 및 문서관리 시스템에서 효과적으로 활용 가능하다.

근대 한국기독교 자료의 디지털 아카이브 시스템 구축에 관한 연구 (A Study on Constructing a Digital Archive System of the Modern Korean Christian Collections)

  • 양지안
    • 한국콘텐츠학회논문지
    • /
    • 제22권8호
    • /
    • pp.681-691
    • /
    • 2022
  • 본 연구는 우리나라 개화기 이후 해방될 때까지 근대 시기에 발행된 한국기독교 관련 자료를 다수 소장하고 있는 S대학교 한국기독교박물관의 자료목록을 분석하여 이를 대상으로 디지털 아카이브 시스템을 구축하는데 목적이 있다. 한국 근대 시기의 기독교자료에 관한 디지털 아카이브 시스템 구축을 위해 대상 자료에 대한 색인과 메타데이터를 형식에 맞게 작성하였다. 선별된 자료를 디지털화한 후, 메타데이터 정보를 이용하여 데이터베이스를 구축하였고, 실제 시스템은 웹 표준 기반의 관리시스템과 이용자서비스시스템으로 나누어 구축하였다. 디지털 아카이브의 원활한 이용을 위해 내용기반의 검색시스템을 구축하였으며, 한 글자 단위의 검색결과 매칭값을 제공하고 검색어 자동완성 기능을 구현함으로써 이용자의 편의성을 제고하였다. 이를 통해 원문접근이 어려운 박물관 자료를 손쉽게 이용할 수 있도록 디지털화하여 제공함으로써 인문학 콘텐츠의 장기적 발전의 토대를 마련하여 연구자 및 대중들의 자료 접근성 및 활용성을 제고할 수 있는 기반을 마련하였다.

지질용어 시소러스 시스템의 설계 및 구축 (Design and Implementation of Thesaurus System for Geological Terms)

  • 황재홍;지광훈;한종규;연영광;류근호
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.23-35
    • /
    • 2007
  • 최근 정보 검색 분야에서 시맨틱 웹 기술에 따른 인터넷 용어사전과 더불어 시소러스의 필요성이 더욱 중요시되고 있다. 시소러스는 분류와 사전의 결합으로 상위 및 하위개념 사이의 전후관계를 명확히 하기 위해서 공식적으로 조직, 통제된 색인어의 어휘로 인간의 학습, 탐구활동 등 제반 지식활동의 대상이 되는 개념(용어)간의 관계를 표현한 지식구조의 토픽 맵이다. 하지만 시소러스가 용어의 통제 및 표준화와 더불어 정보를 능률적으로 처리하고 검색하는데 필수적인 수단으로 평가되고 있음에도 불구하고 아직까지 지질분야에서 우리말 시소러스가 없는 실정이다. 시소러스를 구축하기 위해서는 표준화되고 잘 정의된 지침이 필요하다. 이러한 표준화된 지침은 보다 효율적인 정보 관리를 가능하게 할 것이며, 정보 이용자 또한 보다 정확한 정보를 쉽고 편리하게 이용할 수 있게 될 것이다. 본 연구는 지질정보 중 가장 기본이 되는 용어 시소러스 시스템 구축 연구이다. 이를 위해서 첫째, 국내외 지질용어 표준화 동향을 살펴보았다. 둘째, 15개 분야에 대한 지질학적 주제를 정하고 각 주제에 대한 분류체계(안)를 마련하였다. 셋째, 지질용어 시소러스 분류체계를 바탕으로 지질용어 시소러스 명세서를 작성하였다. 마지막으로 이 명세서를 이용하여 인터넷기반 지질용어 시소러스 시스템을 설계하고 구축하였다.

  • PDF