• Title/Summary/Keyword: 문서의 요소

Search Result 678, Processing Time 0.031 seconds

Building convert system on base of Web as XML documentation in relation type of database system (관계형 데이터베이스 시스템에서 XML문서로의 웹 기반의 변환 시스템 구축)

  • Lee, Jong-Ho;Sohn, Woo-Yong;Song, Jung-Gil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1681-1684
    • /
    • 2002
  • 최근 XML 이라는 웹 문서 표준이 대두되면서 여러 응용 분야에서 이를 활용하려는 노력이 진행 중이다. 특히 웹 상에서 XML은 기준의 데이터베이스를 대체하여 데이터를 관리하고 조직화하며 또한 자원의 게시를 위해 사용되고 있다. 따라서 데이터베이스에 있는 데이터들을 XML문서로 변환하는 것은 필수불가분의 관계이며 좀더 쉽게 이러한 작업들을 할 수 있는 프로그램이 개발 또는 연구 중이다. 그러나 현재 개발된 XML 문서 변환기는 속성과 요소이름이 데이터베니스의 필드 이름으로 밖에 변환되지 않거나, 보통 테이블 이름이 요소로 각 필드이름이 요소 안의 속성으로 밖에 변환할 수 없다. 또한 MSSQL, MySQL, ACCESS와 같은 관계형 데이터베이스 툴 마다 호환이 되지 않으며 변환기 사용 시 인터페이스가 복잡하여 쉽게 이용할 수 없는 것이 현실이다. 본 논문은 이러한 문제점들을 해결하기 위해 효율적으로 관계형 데이터베이스 시스템에서 XML문서로 자동 변환시켜주는 웹 기반의 변환시스템을 구축하였다. 본 논문에서 제시한 변환 시스템은 데이터베이스 시스템 내의 테이블에 데이터를 입력할 경우 사용자가 원하는 형태의 XML문서로 변환이 가능하기 때문에 XML문서를 작성시 효과적으로 이용될 수 있다.

  • PDF

A new segmentation method for non-manhattan layout document images using connected component (연결요소 특징을 이용한 복잡한 문서영상의 구조 분석)

  • 이상협;이경무
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1997.11a
    • /
    • pp.71-74
    • /
    • 1997
  • 본 논문은 일반적으로 제약 없는 형식 문서 즉, 논-맨하탄(non-manhattan) 형식의 이진문서영상을 분석하는 기법으로서, 연결요소기법에 기반한 특징추출과 이를 이용한 영역분리 및 분류에 관한 새로운 방법을 제안한다. 제안한 방식은 바텀-업(bottom-up)방식으로서 먼저 처리속도의 고속화와 축소시 특징 영역보존을 위해 임계치 축소기법을 사용하고, 축소된 이진 문서영상내의 각 연결된 검은 화소의 집합을 개체화하고 개체의 특성에 따라 텍스트, 신성분, 해프톤, 도형 그리고 표 등으로 분류한다. 영역분류는 두단계로 이루어지는데, 1차분류에서는 우선, B/W 비, 면적, 외각 테두리의 높이와 너비 비, 테두리선유무 등의 특징을 이용하여 해프톤, 수평 수직선, 테두리(표 및 도형)영역을 분리한다. 이후 2차 분류에서는 문자성분의 수평결합을 통한 텍스트행 성분을 추출한다. 마지막 후처리 과정으로 표분석 알고리듬을 통하여 테두리 영역중 표와 도형을 정확히 구분하고, 또한 도형에 관련한 문서성분을 해당 도형 개체에 연결하는 작업을 수행함으로써 완벽한 영역분류를 한다. 다양한 문서영상을 이용한 시뮬레이션을 통해 제안한 알고리듬의 성능을 입증한다.

  • PDF

An Efficient Fine-Grained Access Control System for XML Documents (XML문서를 위한 효율적인 미세 접근 제어 시스템)

  • 이승현;이헌길;강정모
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.826-828
    • /
    • 2003
  • 본 논문에서는 XML 문서의 보다 효율적인 접근 제어를 위하여 XML 문서 전체 단위의 접근이 아닌 문서 내 노드 등과 같이 세밀한 부분에 접근 제어를 할 수 있는 미세 접근 제어 기법을 사용하였다. 현재 제안되어 사용되고 있는 묵시적 권한 기법은 상위 구성요소에 한번의 권한 부여로 하위 노드에 권한을 부여하는 효과를 가지는 장점을 가지고 있지만 각각의 구성요소간의 권한을 체크하는 시간의 오버헤드를 가지는 단점이 있다. 이러한 권한을 체크하는 시간을 감소시키기 위하여 본 논문에서는 저장 공간의 오버헤드가 있지만, 권한체크의 시간을 감소시켜서 사용자에게 보다 빠른 view를 제공할 수 있는 XML 문서를 위한 명시적 트리 모델과 view 생성 알고리즘을 제안하였다.

  • PDF

A Study on Clustering Query-answer Documents with Structural Features (문서구조를 이용한 질의응답문서 클러스터링에 관한 연구)

  • Choi, Sang-Hee
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.39 no.4
    • /
    • pp.105-118
    • /
    • 2005
  • As the number of users who ask and give answers in the query-answer documents retrieval system is growing exponentially, the query-answer document become a crucial information resource, as a new type of information retrieval service. A query-answer document Consists of three structural parts : a query, explanation on query, and answers Chosen by users who asked the query. To identify the role of each structural part in representing the topics of documents, the three structural parts were clustered automatically and the results of several clustering tests were compared in this study.

Segmentation and Contents Classification of Document Images Using Local Entropy and Texture-based PCA Algorithm (지역적 엔트로피와 텍스처의 주성분 분석을 이용한 문서영상의 분할 및 구성요소 분류)

  • Kim, Bo-Ram;Oh, Jun-Taek;Kim, Wook-Hyun
    • The KIPS Transactions:PartB
    • /
    • v.16B no.5
    • /
    • pp.377-384
    • /
    • 2009
  • A new algorithm in order to classify various contents in the image documents, such as text, figure, graph, table, etc. is proposed in this paper by classifying contents using texture-based PCA, and by segmenting document images using local entropy-based histogram. Local entropy and histogram made the binarization of image document not only robust to various transformation and noise, but also easy and less time-consuming. And texture-based PCA algorithm for each segmented region was taken notice of each content in the image documents having different texture information. Through this, it was not necessary to establish any pre-defined structural information, and advantages were found from the fact of fast and efficient classification. The result demonstrated that the proposed method had shown better performances of segmentation and classification for various images, and is also found superior to previous methods by its efficiency.

Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering (k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법)

  • Ryu, Jewoong;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

Design and Development of Administrative System for Cyber University (Cyber대학을 위한 행정시스템 설계 및 구현)

  • 공범용;조세홍
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.733-736
    • /
    • 2004
  • Cyber 대학의 활성화에 따른 연구는 강의 교재의 개발 등 효과적인 학습법 개발에 치중되고 있다. 하지만 Cyber 대학의 성패를 좌우할 수 있는 또 다른 주요 요소는 행정적인 뒷받침이라 할 수 있다. 본 연구는 Cyber 대학의 행정시스템을 설계 구현하였다. 특히 Cyber대학에서 필요로 하는 멀티미디어 문서를 효율적으로 관리하고 프리젠테이션 할 수 있는 XML문서관리시스템을 계층구조로 구성하였다. 전체 구성도는 XML을 기반으로 한 문서생성, 저장, 검색시스템으로 구성하였으며, 사용자측 구성에서는 문서의 등록, 수정 삭제를 수행하는 문서작성과 검색을 주요 기능으로 하는 일반사용자로 구성하였다. 연구자가 제안한 본 논문의 행정시스템 구현 환경에서는 문서를 등록하고 결재 및 열람하는 사용자로 구현하였다.

  • PDF

A Conversion from HTML5 to OWL Ontology (HTML5 문서로부터 OWL 온톨로지 구축 기법)

  • Sun, Taimao;Yoon, Yiyeon;Kim, Wooju
    • The Journal of Society for e-Business Studies
    • /
    • v.18 no.3
    • /
    • pp.143-158
    • /
    • 2013
  • HTML5, new standard for web language, is being standardized corresponding to the development of web. Since several new semantic elements have been added into HTML5 standard, current Web Environment is becoming more and more semantic. In order to provide better user experience by using information extraction from HTML5 page, new HTML5 Elements should be mapped to a corresponding Ontology. In this research, we will focus on new semantic elements to build Ontology from HTML5 document. For this purpose, we will propose a methodology of Schema level mapping rule and instance mapping rule.

Implementation of A Browser for SGML-based Text Documents (SGML 기반의 텍스트 문서 브라우저의 구현)

  • Jang, Myung-Gil;Lee, He-Ran;Zhoo, Zong-Cheol;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.499-504
    • /
    • 1994
  • 기존의 문서 시스템은 문서의 논리적인 정보와 문서의 외양에 관련된 처리정보들이 확연히 구분되지 않음으로써 서로 다른 시스템간의 문서 교환시 정보의 손실을 가져올 뿐 아니라, 문서의 저장방식에서도 순차 화일 구조를 갖기 때문에 문서의 논리적 요소에 대한 대화식 검색이 불가능하다. 이러한 단점을 극복하고자 문서의 논리적 구조 및 내용을 중심으로 작성 가능한 표준 메타 언어인 SGML이 제정되었으며, 본 연구에서는 SGML 문서를 인식하고 해석하기 위한 SGML파서와 문서의 논리적 구조를 반영하는 저장구조 및 이를 이용한 브라우저를 구현하였다.

  • PDF

Searching XML Documents based on Xtree and Documents Similarity (Xtree와 문서 유사도에 기반한 XML 문서 검색)

  • 이은정;박우창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.578-580
    • /
    • 2003
  • 인터넷의 성장으로 인해 준구조적인 문서 표준의 하나인 XML 문서의 사용이 증가하고 있다. 본 연구는 인터넷이나 XML 데이터베이스에서 저장된 스키마 정보가 주어지지 않는 많은 양의 XML 문서를 대상으로 주어진 XML 문서에 가장 가까운 문서들을 찾는 방범을 제시한다. 먼저 XML 문서들의 스키마 정보를 얻기위하여 XML 문서에 해당하는 카디널리티 정보를 포함하는 xtree로 변환하고, 변환된 문서들에 대하여 XML 각 요소에 대한 유사도와 문서 구조에 대한 유사도를 계산하여 가장 유사도가 가까운 XML 문서를 결과로 제시한다. 본 논문의 방법은 스키마가 알려지지 않는 XML의 문서들에 대한 검색을 할 수 있고 유사도를 이용하여 문서의 근사 검색을 할 수 있는 장정이 인다.

  • PDF