• Title/Summary/Keyword: 문서과

Search Result 2,266, Processing Time 0.026 seconds

Extension of a XML Query Language to Support Links (링크를 지원하기 위한 XML 질의어의 확장)

  • 문찬호;강현철;서상구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.6-8
    • /
    • 2000
  • XML 문서의 폭발적인 확산에 따라 Web상의 각 사이트는 XML 문서를 분산 저장하여 관리하고 있다. 그리고 XML 문서들 간에는 다양한 링크를 통해 관련된 정보를 참조할 수 있다. 그러나 현재까지 XML과 관련하여, 링크를 지원하는 질의어 개발이나 링크를 활용한 XML 검색 시스템 개발에 대한 연구는 미비하다. 본 논문에서는, 실제 Web상에 분산되어 저장된 전자 문서들 중 하이퍼링크로 연결된 XML 문서들을 대상으로, 링크를 지원하기 위해 기존 XML 질의어를 확장에 대해 연구하였다. 이를 위해 XML 링크를 지원하는 질의의 유형을 분류하고, 링크를 지원하기 위한 XML 질의어의 확장에 대해 기술한다. 그리고 링크를 활용한 XML 질의 처리 방안에 대해 기술한다.

  • PDF

Automatic Document Categorization Using K-Nearest Neighbor Algorithm and Object-Oriented Thesaurus (K-NN과 객체 지향 시소러스를 이용한 웹 문서 자동 분류)

  • 방선이;양재동
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.145-147
    • /
    • 2001
  • 문서 자동 분류에는 통계적인 기법과 machine learning 기법의 맡은 알고리즘들이 이용되고 있다. 통계적인 기법 알고리즘을 이용한 문서 분류는 높은 성능을 보이지만 분류할 카테고리가 둘 이상인 경우가 빈번할 경우에는 정확률이 급격히 저하되는 단점이 있다. 본 논문에서는 K-NN알고리즘을 이용하여 일차적인 문서 분류를 수행한 후 특정 카테고리로 분류하기에 애매모호한 경우가 생길 경우 시소러스의 일반화 관계와 연관화 관계를 이용하여 모호성을 줄임으로써 문서 자동 분류의 성능을 높이기 위한 새 기법을 제안한다.

  • PDF

Deciding The Relevance of Web Documents Using WordNet and BPN (WordNet과 BPN을 이용한 웹 문서 적합성 판단)

  • 김원우;변영태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.91-93
    • /
    • 2001
  • 본 논문은 웹 문서가 특정 주제와 관련된 정보를 담고 있는지를 특정 주제의 단어와 다른 주제의 단어들 사이의 관계를 이용해 평가할 수 있는 방법을 제시하고자 한다. 특정 주제와 관련된 웹 문서에 단어$_{A}$와 단어$_{B}$가 그렇지 않은 웹 문서보다 나온 수가 더 많다면, 단어$_{A}$와 단어$_{B}$의 연결 관계는 특정 주제에 대해 Positive하다고 볼 수 있다. 반대의 경우에는 Negative하다고 볼 수 있다. 이러한 단어와 단어의 연결 관계를 수치화하여 특정 주제와 관련된 웹 문서의 평가에 사용할 수 있도록 WordNet과 BFN을 이용해 보고자 한다.

  • PDF

Design and Implementation of Local Search System Based XML (XML에 기반한 Local 검색 시스템의 설계 및 구현)

  • 김병진;김두현;홍도석;김용성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.100-102
    • /
    • 2001
  • 본 논문에서는 방대한 양의 정보를 관리하고 검색하기 위한 데이터베이스와 검색엔진을 사용하지 않고 정보를 효율적으로 처리할 수 있는 XML 기반의 Local 검색 시스템을 설계하고 구현한다. CD-ROM이나 하드디스크와 같은 보조기억장치에 저장되어 있는 문서 파일을 효율적으로 관리하고 저장하기 위해서 인덱스를 XML 문서로 작성한다. 이러한 XML 문서의 태그를 이용해서 사용자가 원하는 문서 파일을 스크립트(Script) 언어를 사용해서 검색한다. 본 논문에서 제안한 시스템을 이용하면 빠른 검색시간과 효율적으로 문서들을 관리할 수 있다.

  • PDF

Text Extraction by Skew Normalization and Block Split & Merge (기울기 보정과 블록 분할 합병을 통한 문자 추출)

  • 김도현;차의영;강민경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.424-426
    • /
    • 2001
  • 신문, 잡지, 공문서, 영수증 등의 문서로부터 필요한 정보를 자동화하여 처리할 수 있는 문서영상 이해 시스템의 구현에 있어서 문서영상에 존재하는 문자를 추출하는 연구는 문자 인식의 전처리 단계로서 매우 중요한 의미를 지니고 있다. 하지만 현 시점에서 문서 자체가 가지는 다양한 형태 및 배경 등에 의하여 범용화되고 일반화된 방법을 찾기란 매우 어려운 실정이다. 본 논문에서는 특히 배경이 선이나 도표 등으로 이루어진 문서 영상에서 Hough Transform을 사용하여 기울어짐을 보정하고 문자들이 선에 겹친 부분을 효과적으로 보정하며 추출된 영역에 대한 분할 및 합병 과정을 거쳐 최종적으로 완전한 문자 영역을 추출하는 방법에 대하여 다룬다.

  • PDF

A Design and Implementation of General Help System (범용 도움말 시스템의 설계 및 구현)

  • 주예찬;김형국;권기항
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.641-643
    • /
    • 1998
  • 인터넷 환경의 대중화와 함께 HTML 문서의 사용 범위가 확대되면서, 많은 소프트웨어 벤더들이 HTML 문서 형식으로 도움말을 제공하고 있다. HTML 문서는 작성하기 쉽고, 문서 관계를 쉽게 나타낼 수 있다는 장점이 있지만 사용자가 원하는 정보를 찾기 어렵고 효과적으로 관리할 수 있는 방법이 부족하다. 본 논문에서는 이 문제를 해결하기 위해 웹이나 지역 머신에 위치한 HTML 문서들에서 정보를 추출하고 데이터 베이스화 시키는 도움말 시스템을 설계하고 구현한다.

A Study On Filtering of Newspaper Article by Using Bayesian Classifier (베이지안 분류기를 이용한 신문기사 필터링)

  • 손기준;노태길;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.490-492
    • /
    • 2002
  • 본 논문에서는 필터링 문제를 이진 문서 분류 문제로 보고 신문기사 필터링에 베이지안 분류자를 사용한다. 신문 기사 필터링 문제에서 베이지안 분류자를 사용할 경우 학습 문서가 고정되어 있지 않기 때문에 여러 가지 파라미터를 사용하여 실험을 하였다. 실험 결과 베이지안 이진 분류기는 제한된 학습 문서에서 더 나은 성능을 보였고 해당 문서 집합에서 10%이상 비율의 문서를 사용자가 선택해야 함을 알 수 있었다.

  • PDF

Schema Processor and Query Link Generator for supporting Structured Data in Virtual Documents (가상문서에서 정형 데이터 지원을 위한 스키마처리기와 질의링크 생성기)

  • 김철수;강지훈;강민구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.172-174
    • /
    • 2002
  • XML을 기반으로 하는 가상문서는 다양한 데이터의 공유를 가능하게 하여 새로운 지식을 생성할 수 있도록 한다. 가상 문서를 지원하는 디지털 도서관 시스템에서 질의 링크는 인터넷 상의 정형데이터 공유를 가능하게 한다. 본 연구에서는 질의링크를 포함하는 XML- 기반 가상문서를 효과적으로 생성하기 위해 질의링크 생성기와 스키마 처리기를 설계하고 구현하였으며 이를 지원하기 위해 디지털 도서관 시스템과 가상문서 저작시스템에서 서비스 관리기, 메타 검색기, 데이터베이스 관리기와 저작도구를 확장하였다.

  • PDF

An Indexing Scheme for Incremental Updating in Structured Document (구조화 문서에서 점진적 갱신을 위한 인텍싱 기법)

  • 김성완;김선경;이재호;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.190-192
    • /
    • 2002
  • 구조와 문서(structured document)에 대만 효율적인 처리를 위해서는 문서의 임의 엘리먼트에 빠르고 직접적인 접근을 지원하는 인덱싱 기법이 필요하다 이를 위한 기존의 연구들에서는 전통적인 정보 검색 분야에서 사용되는 역 리스트나 시그너쳐 파일을 응용한 기법들이 제안되었다. 그러나 기존의 연구들은 정적인 환경에 적합한 인덱스 구조로써, 문서에 대한 동적인 변경이 있을 경우 인덱스론 전체적으로 재구성해야 하는 부담이 있다. 본 논문에서는 역 리스트를 기반으로 문서에 대만 구조 변경과 내용 변경 등 동적인 변경에 대해 점진적 갱신을 지원하는 인덱스 구조를 설계하였다.

  • PDF

Design of XQuery Query Processor based on Relational Database System (관계 데이터베이스 시스템 기반의 XQuery 질의 처리기 설계)

  • 장형화;홍의경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.106-108
    • /
    • 2003
  • XML은 고유의 확장성과 문서 관계성의 우수성을 활용하여 새로운 정보 공유 환경의 표준으로 자리잡고있다. XML 문서의 사용이 많아지면서 대용량의 XML 문서를 효과적으로 저장, 관리 및 검색하기 위한 시스템이 필요하다. 본 연구는 관계 데이터베이스 시스템(RDBMS)을 기반으로 XML 문서를 저장하고 검색할 수 있게 하기 위해서 Numbering 기법에 의한 XML문서 저장 기법을 사용하였다. XQuery 질의를 SQL문장으로 변환시켜서 수행함으로써 XML 데이터에 대한 검색을 가능하게 하였다.

  • PDF