• Title/Summary/Keyword: 문서처리시스템

Search Result 1,387, Processing Time 0.031 seconds

무선 마크업 언어 문서의 객체 모델링을 통한 자바 기반 브라우징 시스템의 설계 및 구현 (Design and Implementation of Java based Browsing System using Wireless Markup Language Document Object Modeling)

  • 최은정;한동원;김태주;임경식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.271-273
    • /
    • 2001
  • 본 논문에서는 무선 마크업 언어의 특성을 고려하여 무선 환경에 적합한 무선 인터넷 컨텐츠인 바이너리 무선 마크업 언어 문서를 브라우징하기 위한 시스템을 설계, 구현하였다. 카드 랜더링 및 사용자와의 상호작용 시 브라우징 처리를 단순화하기 위해 문서를 개체 모델링하였다. 무선 마크업 언어 문서 객체 모델은 무선 마크업 언어 특성을 고려하여 설계되었으며, 브라우징 처리 시에 문서의 검색 및 편집을 용이하게 하는 장점을 가진다. 또한 문서객체 모델은 컨텐츠의 파싱과 브라우징 처리를 분리하는 역할을 하기도 한다. 본 논문의 브라우징 시스템은 자바를 기반으로 설계 및 구현되었기 때문에 플랫폼 독립적이며, 메모리나 디스크가 제한되어 있어 한번에 여러 개의 프로그램을 상주시킬 수 없는 단말의 경우 네트워크를 통해 동적으로 프로그램을 실행시킬 수 있다는 장점이 있다.

능동문서에 대한 새로운 접근법과 그 응용 (A New Approach to Active Documents and its Application)

  • 남철기;배재학;장길상
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.347-357
    • /
    • 2003
  • 웹은 중요한 정보인천이며, 대부분의 웹 응용프로그램은 HTML 작성된 서식문서를 기반으로 한다. 이러한 HTML 기반의 서식문서는 사용자 인터페이스를 제공하는 역할을 할 뿐, 문서서식 설계자가 지향하는 업무처리 절차나 로직을 내포하지는 않는다 그러나 서식문서에는 그것에 대한 처리방법이 함축되어 있고. 이렇게 내재된 전차적 지신을 업무치리 과정의 자동화에 적극적으로 활용할 수 있다. 이에, 본 논문에서는 서신문서에 기반한 업무치리 전차를 자동화시키기 위해 인지과학적인 측면에서 문서의 능동성을 파악하였나. 이를 통해 능동문서(Active Documents)에 대한 새로운 개념과 그 적용 가능성을 제시하고자 한다. 이 능동문서는 문서에 함축되어 있는 업무규칙과 문서처리의 자동화를 지원하기 위한 선언적 지식을 문서 사제에 내포하고 있다. 또한, 본 논문에서는 제시된 능동문서를 처리하기 위한 프레임워크를 제안한다. 제안된 프레임워크는 크게 생성단계와 실행단계로 구성된다. 본 논문에서 제안한 프레임워크의 유용성을 보이기 위해, 인터넷 구매 시스템의 구매 요청서 처리에 능동문서를 적용한 ActiveForm이라는 원형시스템을 설계하고 구현하였다. 그 결과, 본 논문은 서식설계자의 지식이 Prolog로 명시적으로 표현되어 있는 능동문서를 추론엔진에서 처리함으로써 인터넷 응용프로그램의 지능화에 기여할 수 있음을 확인하였다.

능동문서: 서식설계자의 의도가 내장된 프로그램 (Active Documents: Another Kind of Program Implying Intention of Form Designers)

  • 남철기;배재학;유해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.353-356
    • /
    • 2003
  • 인터넷 기반의 많은 응용이 문서중심의 컴퓨팅 모델로 전환되고 있다. 문서는 문서설계자의 의도를 함축하고 있으며 이는 업무처리 과정의 자동화에 적극적으로 활용될 수 있다. 이러한 무서의 본질 파악을 통해 본 논문에서는 문서를 실행 가능한 컴퓨터 프로그램의 시각으로 접근한다. 이를 위해 서식, 데이터, 규칙 그리고, 질의로 구성되는 능동문서 모델을 제시한다. 모델의 각 요소는 문서의 재사용성과 상호 운영성을 위해 XML로 일관되게 표현된다. 능동문서는 사용자 인터페이스를 제공하는 수동적인 역할뿐만 아니라 문서설계자가 의도하는 문서처리 절차와 업무규칙을 기계가 읽고 추론하여 처리할 수 있는 문서이다. 이를 통해 문서와 기계가 상호작용을 할 수 있으며 다른 응용 프로그램과 협력할 수도 있다. 이러한 능동문서의 적용 가능함을 보이기 위해 기업가거래(B2B) 시스템에서 구매주문 처리의 예를 보였다. 요컨대 본 논문에서 제시한 능동문서는 지식표현 및 처리기능이 내장되어 있는 바, 문서중심의 지능적인 응용프로그램 개발을 가속화하는 토대를 마련할 수 있을 것으로 기대한다.

  • PDF

ORDBMS를 이용한 XML 저장 시스템 설계 (Design of XML Document Storage System Using ORDBMS)

  • 한상웅;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.3-5
    • /
    • 2000
  • XML은 최근 인터넷상에서 정보 교환의 표준으로 자리잡고 있다. 따라서, 그동안 semistructured date와 XML 데이터를 데이터베이스에 저장하고 검색하기 위한 많은 연구들이 진행되어 왔다. 본 논문에서는 기존에 개발된 RDBMS를 이용한 시스템과 OODBMS를 이용한 시스템의 장단점을 수용하여 ORDBMS상에서 XML 문서를 저장하고 검색할 수 있는 시스템을 설계하였다. 이 시스템은 DTD 독립적인 XML 문서를 저장하기 위해 스키마와 분할저장 방법을 이용하여 임의의 XML 문서를 저장하고 저장된 문서의 갱신을 용이하게 처리할 수 있도록 하였다. 전체적인 시스템은 웹상에서 문서를 저장, 검색할 수 있는 웹 기반 시스템과 XML을 이용하는 응용프로그램의 데이터베이스 연동을 지원하는 응용기반 시스템으로 구분하였다.

  • PDF

컬러코드를 이용한 스캔 문서 분류 자동화 (Automating Scanned Document Classification Using ColorCode)

  • 안상길;최병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.766-769
    • /
    • 2008
  • 디지털 형태의 문서가 널리 퍼지고 끊임없이 증가함에 따라 이를 자동으로 가공하고 처리하는 문서자동분류의 중요성이 널리 인식되고 있다. 본 논문에서는 복합기에서 컬러코드를 인식하는 모듈을 탑재하여 스캔된 문서를 자동으로 분류하는 시스템을 제안하고자 한다. 복합기에서 컬러코드가 부착된 종이문서를 스캔한 다음 그 컬로코드를 추출하여 인식하고 해당 컬러코드와 관련된 문서관리정보에 따라 스캔문서를 복합기 내부의 지정 폴더에 저장하거나 다른 곳으로 전달하는 시스템이다. 이렇게 함으로써 종이문서를 전자화하는 과정에서 수작업으로 분류하는 시간을 줄일 수 있고 또한 사람에 의한 오류를 줄일 수 있다는 장점이 있다.

웹 인덱싱을 위한 통합 전처리 시스템의 개발 (Integrated Sentence Preprocessing System for Web Indexing)

  • 심준혁;차정원;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.216-223
    • /
    • 2000
  • 웹 문서는 일반 문서들과 달리 자유로운 형식으로 기술되어 있고, 원문에 태그나 코드 등 불필요한 내용들을 많이 포함하고 있어 언어 처리에 바로 사용하기에 적합하지 못하다. 본 논문은 인덱싱 대상 문서로 사용되는 웹 문서를 자동으로 수집하여, 문장 단위로 정렬된 문서로 제작, 관리하는 통합 전처리 시스템인 Web Tagger의 구조와 전처리 방법을 소개한다. Web Tagger는 문서 정제, 문장 분할, 띄어쓰기의 과정을 거쳐 웹 문서에서 표준화된 정보를 추출하고, 형태소 분석기를 포함한 응용 시스템의 목적에 맞게 XML 형식의 원문 코퍼스를 자동으로 생성하고 관리한다. '정규문법(Regexp)', '휴리스틱', '품사 인덱스 참조', 'C4.5를 사용한 학습 규칙' 등의 다양한 전처리 기법은 형태소 분석 정확도 향상과 시스템 안정성 보장에 기여한다.

  • PDF

YOLOv8을 활용한 디지털 문서의 핵심 객체 추출 및 분류 시스템 설계 (System for Extraction and Classification of Critical Objects using YOLOv8)

  • 조영래;김홍준;박병훈;신수연;이치훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.596-599
    • /
    • 2024
  • 디지털 문서의 유통과정에서 발생할 수 있는 보안상의 문제를 해결하기 위해서는 파일 복사, 이동과정에 문서의 보안 등급을 자동 검출하고 특정 문서의 유출을 방지하는 보안 솔루션이 필요하다. 따라서 본 논문에서는 이러한 보안상의 문제를 해결하기 위하여 하나의 검출 분류 시스템을 제안하고자 한다. 제안한 시스템은 디지털 문서 내용을 이용하여 핵심 정보라고 판단되는 객체를 우선 추출한 후 그 핵심 유형을 분류하는 과정을 통해서 핵심 정보를 사전에 탐지하도록 하였다. 이를 위해서 SOTA를 달성한 YOLOv8를 이용하여 디지털 문서의 핵심 객체 감지하고 또한 파인튜닝을실시한 모델을 이용하여 그 유형을 분류하도록 설계하였다. 해당 시스템 검증을 위해서 기업에서 사용하고 있는 실제 사내 문서를 데이터셋을 이용하고 그 성능평가를 실시하였다.

DSSSL에 기반한 SGML 표현 시스템 설계 및 구현 (The Design and Implementation of SGML Presentation System Based on DSSSL)

  • 전형진;현득창;정회경
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.29-41
    • /
    • 1998
  • 본 논문은 SGML(Standard Generalized Markup Language) 문서를 DSSSL(Document Style Semantics and Specification Language)에 기반하여 포맷팅 처리하기 위한 SGML 문서 표현 시스템의 설계 및 구현에 관한 것이다. ISO(International Standard Organization)에서는 SGML 문서의 변환 및 포맷팅 처리의 기술을 위한 표준으로 DSSSL을 제안하였다. 이에 본 논문에서는 DSSSL 표준에서 정의한 모델에 따라 시스템을 설계하였고, SGML 문서를 온라인으로 포맷팅 처리하는 시스템을 개발하였다. 본 시스템은 한글 처리를 지원하면서 임의의 DTD(Document Type Definition), SGML 문서, DSSSL 스타일 시트에 대한 파싱 기능을 가지며, 텍스트뿐만 아니라 표, 목록, 그림 등 다양한 명세 표현을 처리할 수 있는 포맷터를 포함한다.

  • PDF

콘도르 정보 검색 시스템 (Information Retrieval System : Condor)

  • 박순철;안동언
    • 한국산업정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.31-37
    • /
    • 2003
  • 본 연구는 다중어 질의어를 제공하는 대용량 정보검색 시스템, 콘도르에 대한 고찰이다. 이 시스템은 전북대학교, (주)서치라인, 그리고 카네기멜론 대학교가 컨소시엄 형태로 개발하였다. 이 시스템의 질의처리는 확률 모델을 기반하고 있으며 최근 정보검색 시스템에서 제공하는 문서 클러스터링 기능을 제공하고 있다. 특히 시스템의 특징은 다중어 질의어를 처리하고 질의를 중심으로 온라인으로 문서를 클러스터링하고 요약하는 것이다. 본 시스템은 이미 국내의 3,000만개 웹페이지에 대한 테스트를 마쳤으며 그 안정성을 확보하고 있다.

  • PDF

요약 문서 기반 문서 클러스터링 (Document clustering based on summarized document using K-means algorithm)

  • 오형진;고지현;안동언;정성종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.589-592
    • /
    • 2002
  • 정보검색 시스템에서 문서 클러스터링 기법은 사용자 질의에 대하여 검색된 문서를 문서간의 관련도에 따라 클러스터로 구성하고 사용자에게 검색 결과로 보여주는 것이다. 본 논문에서는 사용자의 질의에 대하여 검색된 문서를 자동 문서 요약기를 통해 얻은 요약 문서와 문서 전문을 문서들간의 유사도를 기반으로 동적으로 클러스터링 한다. 구현한 시스템의 클러스터링 효과를 검증한 결과 검색된 문서 전문을 클러스터링 한 방식에 비해 요약 문서를 클러스터링 한 방식이 정확률 측면에서 더 나은 성능을 보였다.

  • PDF