• 제목/요약/키워드: 문서의 요소

검색결과 676건 처리시간 0.029초

회전된 문서영상에서의 구성요소 분석 및 분류 (Component Analysis and Classification for Rotated Document Image)

  • 모문정;김욱현
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.169-172
    • /
    • 2001
  • 본 논문에서는 회전된 문서에서의 회전각 검출과 문서에 포함된 그림, 글자, 표, 직선과 같은 구성요소를 자동으로 분석하고 분류하는 방법을 제안한다. 본 연구는 입력영상을 획득하는 과정에서 발생되는 회전각에 의해 발생되는 오류를 최소화하기 위한 회전각 검출단계, 각 구성요소 검출에 불필요한 배경제거 단계, 각 구성요소의 특성을 통한 구성요소 분류단계로 이루어진다. 제안한 문서 인식 시스템의 성능 평가를 위해서 다양 한 문서에 제안한 방법을 적용하고, 성공적인 결과를 보인다.

  • PDF

XML 구성요소의 릴레이션으로의 변환 (Transferring XML Documents to Relational Scheme)

  • 신병주;진민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.35-38
    • /
    • 2001
  • XML 문서의 사용이 급속도로 증가함에 따라 대용량의 XML 문서를 저장, 관리하는 기술이 요구되고 있다. XML 문서를 저장, 관리방법으로 RDBMS가 현실적으로 가장 효과적인 방법이다. 그러나, XML의 구성요소와 RDBMS의 구성요소간의 차이로 인해 XML 문서를 RDBMS에 저장하기 위해서는 특별한 저장방법이 제공되어야 한다. 따라서, 본 논문은 이와 같은 XML과 RDBMS 구성요소간의 불일치에서 오는 문제점들을 해결하고 효율적인 질의처리가 가능하도록 XML의 각 구성요소들에 대한 저장방법을 제시한다.

  • PDF

연결요소와 색상정보를 이용한 실제적 문서영상 분할 (Practical Page Segmentation using Connected Components and Color Information)

  • 김병기
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.273-285
    • /
    • 2000
  • 문서영상의 분할은 문서인식의 전 과정 중에서 인식률에 큰 영향을 미치는 단계이지만 국내에서는 양적${\cdot}$질적으로 이에 대한 실제적인 연구가 부족한 것이 사실이다. 그 결과, 구조가 복잡하거나 칼라로 인쇄된 문서의 분할은 여전히 개선할 점이 많다. 본 논문에서는 불규칙한 다단, 점선, 그래픽, 사진 등의 다양하고 복잡한 요소로 구성된 문서의 실제적인 분할문제들을 살펴보고, 연결요소와 색상정보를 이용하여 이들을 효율적으로 분할하는 실제적 문서영상 분할 기법을 제안한다. 윤곽선 추출을 이용하여 다양한 형태의 모든 연결요소를 추출하고, 추출된 연결요소별 유형판정 및 연결요소 병합기준을 이용함으로써 정확한 문서영상 분할이 가능하다. 또한 색상문서의 경우, 정확한 문서분할과 처리시간 개선을 위하여 먼저 이진화된 문서에 대해서 문자와 비문자 영역으로 분할한 후, 필요에 따라 비문자 영역에 대하여 별도의 칼라별 영역분할을 수행한다. 제안된 방법의 성능을 확인하기 위하여 다양한 구조와 내용을 갖는 180장의 문서영상을 대상으로 문서분할 실험을 수행하였다. 아울러, 6가지 국내외 상용 문서인식 소프트웨어의 문서영상 분할 결과와 비교함으로써 제안한 방법이 복잡한 문서영상의 실제적 분할에 우수한 성능을 보임을 확인하였다.

  • PDF

문서범주화 효율성 제고를 위한 정보원 평가에 관한 연구 (A Study on Information Resource Evaluation for Text Categorization)

  • 정은경
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.305-321
    • /
    • 2007
  • 이 연구는 색인가가 주제 색인하는 과정에서 참조하는 여러 문서구성요소를 문서 범주화의 정보원으로 인식하여 이들이 문서 범주화 성능에 미치는 영향을 살펴보는데 그 목적이 있다. 이는 기존의 문서 범주화 연구가 전문(full text)에 치중하는 것과는 달리 문서구성요소로서 정보원의 영향을 평가하여 문서 범주화에 효율적으로 사용될 수 있는지를 파악하고자 한다. 전형적인 과학기술분야의 저널 및 회의록 논문을 데이터 집합으로 하였을때 정보원은 본문정보 중심과 문서구성요소중심으로 나뉘어 질 수 있다. 본문정보중심은 본론자체와 서론과 결론으로 구성되며, 문서구성요소중심은 제목, 인용, 출처, 초록, 키워드로 파악된다. 실험결과를 살펴보면, 인용, 출처, 제목정보원은 본문정보원과 비교하여 유의한 차이를 보이지 않으며, 키워드정보원은 본문 정보원과 비교하여 유의한 차이를 보인다. 이러한 결과는 색인가가 참고하는 문서구성요소로서의 정보원이 문서 범주화에 본문을 대신하여 효율적으로 활용될 수 있음을 보여주고 있다.

XML 문서를 위한 효율적인 색인구조의 설계 (A Design of an Efficient Index Organization for XML Documents)

  • 안선하;박경환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.292-295
    • /
    • 2000
  • XML은 메타언어로써 구조적인 문서를 생성할 수있게 하며 이러한 구조적인 문서는 내용 기반검색,질의등의 처리가 가능하다는 것이다. XML문서의 논리적 구조를 표현하는 방법은 사용자 정의 문서타입(DTD)과 XML Schema 의 두가지 방식이 있으며, XML Schema 는 사용자 정의문서타입(DTD)에 비해 다양한 데이터 타입, namespace, Open-ended 데이터 모델등을 지원하여 문서의 구조 정의를 훨씬 더 유연하고 명시적이게 하게 하는 장점이있다. 본 논문에서는 XML 문서 검색을 위해 XML Schemadp 기반하여 내용 검색과 구조 검색을 효율적으로 지원하는 인덱스 구조를 제안한다. 요소들의 정의에 따르면 계층관계를 표현하기위한 구조정보와 XML 문서 인스턴스에서 나타나는 각 요소들의 순서정보를 요소의 ID로 사용함으로써 임의의 요소를 효율적으로 접근할 수 있게 한다.

  • PDF

XML 문서의 효율적인 미세 접근 제어 시스템을 위한 명시적 접근 권한 트리 생성 기법 (An Explicit Access Authorization Tree Generation Technique for the Efficient Fine-Grained Access Control System of XML Documents)

  • 이헌길;강정모
    • 산업기술연구
    • /
    • 제23권A호
    • /
    • pp.47-53
    • /
    • 2003
  • 차세대 웹 문서의 새로운 표준으로 자리 잡아 가고 있는 XML은 전자 상거래나 병원 관리 등과 같이 다양한 응용 분야에 적용되고 있다. 이러한 응용 분야는 XML 문서의 각 구성 요소 수준의 세밀한 액세스 제어를 요구한다. 따라서, 현재 XML 문서의 미세 접근 제어 기법에 대한 연구가 활발히 이루어지고 있다. 현재 제안된 XML 문서를 위한 미세 접근 제어 기법은 대부분 묵시적 권한 기법을 사용하여 상위 구성요소에 한번의 권한 부여로 하위노드에 권한을 부여하는 효과를 가지는 장점을 가지나, 각 구성 요소간의 권한을 체크하는 시간 오버헤드를 가지는 단점이 있다. 본 논문에서는 권한을 체크하는 시간을 감소시키기 위하여 XML 문서의 미세 접근 제어를 위한 명시적 권한 기법을 제안하고, 이를 이용하여 노드의 권한에 대한 모든 정보를 저장하고 있는 접근 권한 트리 모델을 제시하였다. 본 논문에서 제안한 접근 권한 트리 모델을 사용하면, 권한 정보를 저장하는 공간 오버헤드가 있지만, 권한 체크 시간을 감소시켜 사용자에게 보다 빠른 뷰를 제공할 수 있다.

  • PDF

교량 구조계산서 XML 문서변환 및 3차원 모델에서의 문서정보 검색 (XML Translation of Structural Calculation Document and Information Retrieval in 3-D View of Bridge Information Model)

  • 김봉근;박상일;김세진;엄인수;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2010년도 정기 학술대회
    • /
    • pp.375-378
    • /
    • 2010
  • 본 논문은 엔지니어링 문서정보를 준구조화된 XML 문서로 변환하고 이를 3차원 교량 모델과 연계하는 방법을 제시한다. 이를 위해 먼저 구조계산서의 세부 목차에 따른 문서구조를 추출하는 기법을 이용하여 3차원 교량모델을 구성하는 각 부재와 매핑되는 구조계산서 문서의 일부를 프로그램 상에서 자동으로 추출하기 위한 모듈을 개발하였다. 또한 3차원 교량모델의 정보를 운영하기 위해 IFC 기반의 교량정보모델을 개발하였다. 개발된 정보모델은 교량요소들의 논리적 구성체계를 공간적 요소, 물리적 요소 및 그룹 요소별로 표현할 수 있도록 지원한다. 이와 같이 개발된 기술을 이용하여 3차원 교량모델 뷰어에서 구조계산서의 정보를 검색하기 위한 시범 툴을 개발하였으며, 4개의 단위 교량으로 구성된 복합형식의 교량에 대한 3차원 모델을 구축하고 각 교량에 대한 구조계산서 또한 XML 문서로 변환하였다. 이와 같이 구축된 두 정보체계에서 사용자가 선택한 임의의 구성요소에 관한 세부 문서정보의 조회가 가능함을 보임으로써 제시된 방법의 적합성을 검증하였다.

  • PDF

XML 문서를 위한 묵시적 권한부여 기법 (An Implicit Authorization Technique for an XML Document)

  • 강정모;이헌길
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.700-702
    • /
    • 2001
  • XML은 인터넷 상에서 복잡한 문서의 원활한 처리와 신속한 탐색 및 항해가 가능한 차세대 웹 언어로 각광받고 있다. XML로 표현된 문서들은 세분화된 계층구조(granularity hierarchy)로 나타낼 수 있으므로 필요한 구성 요소에만 엑세스 제어가 가능하다는 장점이 있다. 묵시적 권한 부여 기법은 명시적으로 저장된 권한으로부터 유도되는 권한기법으로 모든 구성 요소들에 대해 규칙들을 명시적으로 저장해야 하는 비효율적인 명시적 권한부여 기법보다 상위 구성 요소에 대한 한번의 권한 부여로 하위 구성 요소들에 동일한 권한부여 효과를 얻을 수 있다. 본 논문은 XML 문서를 위한 묵시적 권한 부여 기법을 제시하여 XML 문서의 엑세스 제어 시 권한 부여 시간 및 메모리의 효율성을 높인다.

  • PDF

비밀문서관리시스템 요구사항 분석 (The Analysis of the classified document management system requirements)

  • 이지영;박진섭;신영선;강성기
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.56-59
    • /
    • 2003
  • 본 논문에서는 비밀문서를 전자화하여 유통 시킬 수 있도록 하기위해 현재일반문서관리시스템을 분석하여 문서의 기안단계, 송ㆍ수신단계, 결재단계, 문서의 보관/저장 단계, 열람단계, 심사단계, 발송단계, 파기단계 까지를 포함한 전 과정에 수반되는 위험요소가 무엇인지를 파악하고, 각각의 보안 위험요소가 도출되고 나면 그에 상응하는 적절한 보안대책을 마련하는 방식으로 접근하여 비밀문서관리체제의 안전한 구축을 위한 보안 가이드라인을 제시한다.

  • PDF

문서의 의미적 구조정보를 이용한 특허 문서 분류 (Patent Document Categorization based on Semantic Structural Information)

  • 김재호;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.28-34
    • /
    • 2005
  • 특허 검색은 수많은 특허 문서 중에서 특정 해당분야의 문서 집합 내에서 검색을 수행하기 때문에 정확한 특허 분류에 크게 의존하게 된다. 이러한 특허 분류의 중요성에 덧붙여, 특허 문서의 수가 빠르게 증가하게 되면서 특허를 자동으로 분류하려는 요구가 더욱 필요하게 되었다. 특허문서는 일반문서와는 달리 구조화되어 있기 때문에 특허분류를 하기 위해서는 이러한 점이 고려되어야 한다. 본 논문에서는 k-NN 방법을 이용하여 일본어 특허 문서를 자동으로 분류하는 방법을 제안한다. 훈련집합으로부터 유사문서를 검색할 때, 구조화되어 있는 특허 문서의 특징을 이용한다. 문서 전체가 아닌 (기존 기술), (응용 분야), (해결하고자 하는 문제), (문제를 해결하려는 방법) 등의 세분화된 요소끼리 비교하여 유사성을 계산한다. 특허 문서에는 사용자가 정의한 많은 의미 요소가 있기 때문에 먼저 이들을 군집화한 후에 이용한다. 실험 결과 제안한 방법이 특허문서를 그대로 이용하는 것보다는 74%, 특허문서에 나타난 <요약>, <청구항>, <상세한 설명>의 큰 구조 정보를 이용하는 것보다는 4%의 성능 향상을 가져왔다.

  • PDF