• 제목/요약/키워드: 문서중심 설계

검색결과 150건 처리시간 0.033초

규칙기반 문서 분류기를 이용한 XML 문서 의 자동생성 (Automatic Generation of XML Documents Using Rule-Based Document Classifier)

  • 김효정;민미경
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.125-128
    • /
    • 2000
  • 인터넷 중심의 정보화 사회가 되면서 기존의 문서는 대부분 전자 문서로 대치되어 가고 있다. 전자 문서간의 호환과 표준화를 위하여 XML(eXtensible Markup Language)이 웹 문서의 표준으로 지정되었으나, 현재까지 사용되고 있는 문서들이 XML 형태의 문서가 아니므로 이를 수동으로 변환해야 하는 어려움이 있다. 본 논문에서는 규칙기반 분서 분류기(Rule-Based Document Classifier)를 설계하여 다양한 형태의 문서를 자동으로 분류하고 그룹화한다. 그룹화된 문서를 이용하여 자동으로 DTD(Document Type Definition)를 생성하고, 자동 생성된 DTD를 이용하여 XML 형태의 문서로 자동 변환할 수 있는 자동 XML 변환기를 제시한다. 이러한 방법은 문서들을 자동으로 분류하고, 문서의 행태에 변화가 있을 때에도 유사한 문서로 분류할수 있을 뿐만 아니라 문서를 재분류할 때 DTD의 중복 생성을 줄일 수 있는 등의 장점을 갖는다.

  • PDF

능동문서: 서식설계자의 프로그램 (Active Documents: Programs by Form Designers)

  • 남철기;배재학;유해영
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.599-610
    • /
    • 2003
  • 웹은 정보 제공원으로서 중요한 역할을 하며 대부분의 웹 응용프로그램은 문서 중심이다. 문서는 문서설계자의 의도를 함축하고 있으며 이는 업무처리 과정의 자동화에 적극적으로 활용될 수 있다. 이러한 문서기능의 본질 파악을 통해 본 논문에서는 특별한 경우, 문서를 실행 가능한 컴퓨터 프로그램으로 보는 시각으로 접근하였다. 이를 위해 서식, 지식베이스, 규칙 그리고, 질의로 구성되는 능동문서 모델을 제안하였다. 이 모델의 각 요소는 문서의 재사용과 상호 운용성을 위해 XML로 일관되게 표현된다. 소개한 능동문서는 사용자 인터페이스를 제공하는 수동적인 역할뿐만 아니라 문서설계자가 의도하는 문서처리 절차와 업무규칙을 기계가 읽고 추론하여 처리할 수 있게 하는 문서이다. 이를 통해 문서와 기계가 상호작용을 할 수 있으며 다른 응용 프로그램과 협력할 수도 있다. 이러한 능동문서의 적용 가능함을 보이기 위해 기업 간 거래(B2B) 시스템에서 구매주문 처리의 예를 보였다. 서식문서를 컴퓨터 프로그램의 시각으로 바라보는 본 논문의 접근법을 통해 본 연구는 문서중심의 지능적인 응용프로그램 개발을 가속화하는 발판을 마련할 수 있을 것이다. 요컨대 본 논문에서 제시한 능동문서는 지식표현 및 처리기능이 내장되어 있는 바, 시맨틱 웹(Semantic Web)이 추구하는 문서의 역할을 담당할 수 있을 것으로 기대한다.

웹 문서 재구조화를 위한 XML 기반의 대화식 코드 변환 시스템 설계 (XML-based Interactive Transcoding System for Reconstructing Web Pages)

  • 송동리;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.385-387
    • /
    • 2001
  • 최근에 웹을 통한 기업 이미지의 부각과 기업 활동의 홍보는 기업 경영에 중요한 수단이 되고 있다. 이를 위해, 웹사이트는 사용자에게 다양한 정보와 사용의 편리함을 제공하여야 하지만 아직 많은 웹사이트들이 비규칙적으로 구성되어 있기 때문에 사용자에게 편리한 정보 전달을 제공하지 못하고 있다. 이러한 문제를 해결하기 위한 방법 중 하나는 웹 사이트 내의 문서들간의 공통적인 구성 요소를 알아내고 문서내의 정보를 중심으로 재구성하는 것이다. 본 논문에서는 XML을 이용한 문서의 재구성과 사이트를 구성하는 정보의 분류를 통하여 원하는 유형의 정보를 추출해 내는 대화식 코드 변환 시스템을 제안한다.

  • PDF

문서 단편화 기법을 이용한 XML 변환기의 설계 및 구현 (Development of an XML Converter using Document Fragmentation Method)

  • 정창후;최윤수;주원균;진두석;김광영;이민호;서정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.214-216
    • /
    • 2004
  • 최근 다양한 응용 분야에서 점차 증가하고 있는 XML 문서에 대한 효과적 검색을 위해서 많은 검색 시스템들이 제안되고 있다. 그러나 이러한 검색 시스템은 XML 문서의 구조적 특성을 명확하게 알지 못하거나 질의어 작성에 익숙하지 못한 사용자에게 XML 문서를 검색하는데 많은 어려움을 주고 있다. 이러한 문제를 해결하기 위해 본 논문은 복잡한 계층의 XML 문서를 의미 있는 엘리먼트를 중심으로 계층을 단순화시켜서 검색에 이용할 수 있도록 도와주는 XML 문서 변환기를 제안한다. XML 문서 변환기는 XML 문서의 부모-자식 관계, 형제 관계 등의 계층 정보를 유지하면서 문서를 단편화 시켜주는 도구이다. XML 문서 변환기와 더불어 이것을 이용하여 구현된 XML 문서 검색 시스템의 계층적 출력 인터페이스에 대하여 함께 설명하도록 한다.

  • PDF

의미의 상하위 정보를 이용한 웹문서 분류시스템 (A Web-Document Categorization System Using the Hierarchical Information of the Concept)

  • 강원석;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.36-39
    • /
    • 1999
  • 본 논문에서는 다양성을 가진 웹문서의 범주를 결정짓는 웹문서 분류 시스템을 설계, 구축한다. 웹문서는 일관된 형식과 내용이 없이 만들어지기 때문에 문서의 범주를 결정하는 시스템을 구축하기는 쉬운 일이 아니다. 제안한 웹문서 분류 시스템은 잡음 처리에 적합한 신경망 방식을 적용하여 다양한 내용의 웹문서의 범주를 결정짓는다. 본 시스템은 한국어 문장을 분석하는 한국어 형태소 해석기, 단어의 의미를 획득하는 개념 획득기, 단어의 사용된 의미를 고르는 애매성 해소기, 그리고 문서의 범주를 결정하는 신경망 범주 결정기로 구성된다. 본 시스템은 단어의 의미를 이용하여 문서를 표현하고 분석하는 개념 중심의 문서 분류 시스템이다.

  • PDF

ThruDoc:XForms를 이용한 액티브 문서 플랫폼 개발 (ThruDoc : Development of an Active Document System Based on XForms)

  • 서원일;김기식;안형진;이정훈;이은정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.184-186
    • /
    • 2002
  • 액티브 문서 시스템은 문서를 중심으로 사용자 상호작용이나 통신 등을 지원하는 분산 컴퓨팅 모델로서 내용과 행위 정의를 포함하는 행동 가능한 문서를 통해 분산 응용 시스템을 구현하고자 하는 접근방법이다. 본 논문에서는 이러한 액티브 문서 시스템을 구현하기 위한 coordination 미들웨어로서 XForms를 이용하여 사용자 상호작용과 행위를 정의하고 웹 클라이언트가 HTTP와 소켓 기반 통신을 통해 coordination을 담당하는 시스템의 설계와 구현을 소개한다. 개발된 플랫폼 ThruDoc은 웹 상에서 여러 사용자가 액티브 문서를 통해 동시에 데이터 접근을 가능하게 하며, 동시 접근 단위와 락킹 행동을 XForms 문서에서 유연하게 정의할 수 있어 기존의 액티브 문서지원 미들웨어와 비교하였을 때 웹 기반의 구조에 자연스럽게 통합되면서도 자유로운 행위 정의가 가능하고 문서 공유가 실시간으로 가능하다는 장점을 가진다.

  • PDF

WEB상의 멀티미디어 문서 관리를 위한 XML문서관리시스템 설계 및 구현 (Development of XML Document Management System for Multimedia Documents on the WEB)

  • 공범용;황병곤;조세홍
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 추계공동학술대회
    • /
    • pp.435-440
    • /
    • 2003
  • 컴퓨터 기술의 발달은 사회 여러 분야에서 획기적인 변화를 가지고 왔고, 이러한 변화를 주도하는 인터넷, 웹, 멀티미디어, 네트? 등은 특별한 주목을 받고 있다. 특히, 지식과 정보의 빠르고 정확한 전달은 변화의 핵심을 이루는 요소이다. 지식, 정보화 시대에서 네트웍을 통하여 전달되는 지식과 정보는 멀티미디어 데이터가 그 주종을 이루고 있고, 이러한 멀티미디어 데이터들은 기존의 문자위주의 데이터 정보에서와는 다른 성질들을 가지고 있기 때문에 새로운 문서 관리 시스템이 요구되어 진다. 따라서, 웹상에서는 사용자가 요구하는 멀티미디어 문서를 보다 효과적으로 생성하고 저장, 검색할 수 있는 기술이 요구된다 본 연구에서는 인터넷 중심의 정보교환 사회에서 생산적이며 효율적인 문서 공유 및 상호교환을 위해 차세대 인터넷문서의 표준인 XML을 기반으로 문서를 교환하며 이를 효과적으로 저장, 검색, 관리할 수 있는 시스템 모델을 제안하고자 한다.

  • PDF

비트맵 인덱싱 기반 유사한 XML 문서 검색 기법 (A Search Method of Similar XML Documents based on Bitmap Indexing)

  • 이재민;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.15-18
    • /
    • 2004
  • XML 검색을 위한 기존의 비트맵 인덱싱은 XML을 문서, 경로, 단어로 구성된 3차원 비트맵 인덱스에 매핑하고 이를 이용해 정보를 추출함으로써 뛰어난 성능을 입증하였다. 그러나 이것은 유사 문서를 수집하고 검색하기 위해 경로 전체를 인덱스 구성의 단위로 사용함으로써 유사 경로를 인식하지 못하는 문제를 초래하였으며 유사 경로를 인식하지 못함으로 인해 유사 문서 검색의 치명적인 성능 저하가 발생하게 되었다. 이에 따라 본 논문에서는 기존의 XML 검색을 위한 비트맵 인덱싱이 유사 경로를 인식하지 못하는 문제점을 해결하기 위해 유사 경로 탐색을 위한 새로운 비트맵 인덱스를 설계하고 이를 통해 효과적으로 유사 문서를 검색할 수 있는 기법을 제안한다. 제안된 기법은 노드들을 단위로 하는 새로운 비트맵 인덱스를 구성하고 구성된 인덱스의 중심을 통해 유사 경로 탐색을 위한 클러스터들을 선별적으로 검색한다. 그리고 유사 경로 탐색을 통해 추출된 경로들을 유사 문서 검색에 활용함으로써 비트맵 인덱싱의 빠른 성능을 그대로 유지하면서 기존의 XML 검색을 위한 비트맵 인덱싱이 유사 경로를 인식하지 못함으로써 발생하는 유사 문서 탐색의 성능 저하를 효과적으로 해결한다.

  • PDF

SGML 문서형 정의부 작성을 위한 대화형 편집 시스템 설계 및 구현 (Design and Implementation of Interactive Editing System for SGML DTD Composition)

  • 김창수;정회경
    • 정보학연구
    • /
    • 제2권2호
    • /
    • pp.35-49
    • /
    • 1999
  • 본 논문에서는 ISO 8879(Standard Generalized Markup Language)에 근거하여 문서의 논리 구조를 정의하고 있는 DTD(문서형 정의부 : Document Type Definition)를 자동 편집하기 위한 시스템을 설계 및 구현하였다. SGML DTD는 문서의 논리 구조 유형을 정의하는데 그 구조가 복잡하여 일반 텍스트 편집기로 작성하기가 쉽지않다. 그러므로 일반 사용자도 쉽게 사용할 수 있도록 그래픽적으로 윈도우 환경하에서 트리 형태로 표현하여 직접 조작함으로써 복잡한 DTD를 쉽게 작성할 수 있는 DTD 자동 생성 및 편집하는 시스템에 대해 연구하였다. 이를 위해 SGML을 중심으로한 문서 구조를 분석하고, SGML 문서처리 모델을 연구하였으며, SGML DTD를 구성하는 엘리먼트(element), 앤티티(entity), 속성(attribute), 표기법(notation), 주석(comment) 등의 논리 구조를 윈도우상에 트리 형태로 표현하였다.

  • PDF

프린터틀 위한 다이렉트 프린팅 S/W의 설계 및 구현에 관한 연구 (A Study of Architecture and Implementation of Direct Printing S/W for Printer)

  • 김성주
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.266-267
    • /
    • 2008
  • ERP(Enterprise Resource Planning) 및 그룹웨어 등의 전자적인 메일, 결재, 문서 관리 수단의 발달에도 불구하고 금융 및 산업계의 프린팅 수요는 매년 급증하고 있다[1]. 특히 근래의 프린터는 스캐닝, 복사, 프린팅 보안 시스템 등의 다양한 기능들이 융복합화 하면서 사무실에서의 문서 수요와 관리를 책임지는 시스템으로 진화하였다[2]. 다양한 문서 포맷에 대한 프린터의 직접 지원도 ubiquitous의 시나리오에 필수적인 아이템이 되어 가고 있다[2]. 이에 본 논문에서는 인터넷 공간에서 가장 널리 쓰이는 문서 포맷의 하나인 Adobe사 PDF(Portable Document Format) 문서 포맷을 중심으로 프린터에서 직접 문서 해독 및 이미지 처리와 렌더링을 수행하는 S/W 시스템에 대해 그 아키텍쳐와 구현 예를 보이고자 한다. 아울러 임베디드 시스템에서 direct printing S/W의 고려 사항에 대해 논하고자 한다.

  • PDF