• 제목/요약/키워드: 문서양식

검색결과 83건 처리시간 0.03초

TabQA : 표 양식의 데이터에 대한 질의응답 모델 (TabQA : Question Answering Model for Table Data)

  • 박소윤;임승영;김명지;이주열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.263-269
    • /
    • 2018
  • 본 논문에서는 실생활에서 쓰이는 다양한 구조를 갖는 문서에 대해서도 자연어 질의응답이 가능한 모델을 만들고자, 그 첫걸음으로 표에 대해 자연어 질의응답이 가능한 End-to-End 인공신경망 모델 TabQA를 제안한다. TabQA는 기존 연구들과는 달리 표의 형식에 구애받지 않고 여러 가지 형태의 표를 처리할 수 있으며, 다양한 정보의 인코딩으로 풍부해진 셀의 feature를 통해, 표의 row와 column 객체를 직관적이고도 효과적으로 추상화한다. 우리는 본 연구의 결과를 검증하기 위해 다채로운 어휘를 가지는 표 데이터에 대한 질의응답 쌍을 자체적으로 생성하였으며, 이에 대해 단일 모델 EM 스코어 96.0%에 이르는 결과를 얻었다. 이로써 우리는 추후 더 넓은 범위의 양식이 있는 데이터에 대해서도 자연어로 질의응답 할 수 있는 가능성을 확인하였다.

  • PDF

다중 언어에서 다중 활자체 및 다중 크기의 문자 인식을 위한 2계층 분류기 (A Two-Layer Classifier for Recognition of Multi-font and Multi-size Characters in Multi-lingual Documents)

  • 지수영;문경애;오원근;김태윤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.93-97
    • /
    • 1996
  • 본 논문에서는 2 계층 분류기를 이용하여 일반적인 문서(보고서, 책, 잡지, 워드프로세서에서 출력 된 양식) 내의 다중 크기 및 다중 활자체의 인식을 위한 효과적인 방법을 제안하고 구현하였다. 다중언어 문자를 효과적으로 인식하기 위한 2 계층 분류기를 제안하였는데 이는 폰트 독립적 분류기와 폰트 의존적 분류기로 구성되어 있다. 제안된 방법의 성능 평가를 위하여 사무실에서 많이 사용하는 59 종류의 폰트와 각 폰트 당 3가지 크기의 글꼴과, 스캐너에서 지원되는 3가지 농도의 총 489개의 서로 다른 부류를 갖는 3,593,172 자를 대상으로 학습시킨 뒤에 일반 문서를 가지고 펜티엄 PC 상에서 인식 실험을 수행하였다. 실험 결과, 2계층 분류기를 갖는 시스템에서 96-98%의 인식률과 초당40자 이상의 인식 속도를 보여줌으로써 일반적인 문서에서 다중 크기 및 다중 활자체의 문자 인식에 매우 실용적인 가치가 있음을 확인했다.

  • PDF

기술정보관리를 위한 통합솔루션의 효율적 구조 (An Efficient Structure of The Integrated Solution to the Management of Technical Information)

  • 추상완;이혜경;김보형;신영길
    • 산업공학
    • /
    • 제8권3호
    • /
    • pp.197-202
    • /
    • 1995
  • 생산성 제고를 위하여 생산 현장에서 사용되는 여러 가지의 자료 즉, 다양한 형식의 화상(Image), CAD 자료, 도면, 표, 수식, 각종 문서 양식 및 문안들을 관리해주는 시스템이 필수적이다[1]. 그러나 다양한 종류의 자료들이 격리되어 관리되고 있는 상황에서는 원하는 정보를 찾거나, 자료간의 관련성을 알아내는데 많은 어려움을 겪지 않을 수 없다. 따라서 생산과정에서 필요한 여러 가지 자료들을 생성, 편집할 수 있는 도구와 각 자료들간의 관련성을 생성, 편집하는데 도움이 될 수 있는 방안, 마지막으로 생성된 여러 자료를 쉽게 찾도록 도와 주는 기능이 요구된다. 이와 같은 기술정보관리를 효율적이고 통합된 형태로 수행하기 위하여, 본연구에서는 기술정보관리시스템(TIMS : Technical Information Management System)을 구축하였다. 기술정보관리시스템은 개별 자료의 생성, 편집 및 개별 자료의 공유를 통한 복합문서 작성 부분, 개별 자료들 간의 관련성을 자동관리해 주는 부분 그리고 개별 자료들 간의 관련성을 통한 자료검색 부분으로 구성되어 있다. 본 논문에서는 기술정보의 효율적인 작성, 사용 및 관리를 지원하기 위한 통합 시스템의 각 구성부분에 요구되는 기능들과 전체 시스템의 효율성을 증대시키기 위한 방안을 논하였다. 격리되고 인력에 의존에 온 기술정보의 효율적인 작성, 사용 및 관리를 방대한 양의 자료들 속에서 통합적이며, 적합한 형태로 자동관리해줌으로써 생산성 제고에 기여할 수 있는 시스템으로 사용될 수 있을 것으로 기대된다.

  • PDF

Agent 기반의 M2M Commerce

  • 박태민
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2002년도 e-Biz World Conference
    • /
    • pp.269-271
    • /
    • 2002
  • M2M M2M의 정의 서로 다른 Marketplace의 시스템을 상호 접속할 수 있는 시점 M2M의 장점 M2M은 자사 e마켓에서 지원되지 않는 서비스나 정보를 다른 e마켓을 통해 제공할 수 있어 신규 고객확보는 물론 새로운 서비스나 신규 콘텐츠 생산에 대한 부담을 덜 수 있음 정보공유를 통한 수평적 Marketplace의 활성화 각종 문서/양식/트랜잭션들의 생성/교환/처리 비용 절감 마케팅 및 영업 채널의 확대에 따른 이윤의 증대(중략)

  • PDF

네트워크를 보안평가를 위한 해커 및 해킹기법 수준 분류

  • 최양서;서동일;손승원
    • 정보보호학회지
    • /
    • 제11권5호
    • /
    • pp.63-77
    • /
    • 2001
  • 최근 인테넷을 이용한 각종 해킹 및 사이버 범죄가 크게 증가하고 있으나, 아직까지 공격의 주범인 해커들의 수준을 파악하지 못한 상황이다. 과거에 해커 분류를 시도한 경우가 있었지만 적용한 분류 기준은 대부분 해커들의 행동 양식이었다. 이에 본 문서에서는 해킹 수행 코드(exploit code)를 작성할 수 있는 가의 여부를 바탕으로 해커의 능력을 분류하고 그들이 사용할 수 있는 해킹 기법과 그 수준을 확인해 보도록 한다. 이러한 해커의 수준에 따른 해킹 기법 분류를 기반으로 내부망의 보안성 평가에 활용할 수 있을 것이다.

효율적인 전자도서관 체제 구축을 위한 연구 (A study on the Implementation for the effective Digital Library System)

  • 류범종;강무영;조영화
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 1998년도 춘계정기학술대회
    • /
    • pp.3-3
    • /
    • 1998
  • 전자도서관체제는 일종의 전자정보생산시스템으로서 기존의 도서관 체제와는 차별화 된다. 즉, 기존의 도서관이 수요자와 직접 관계에 있는 서비스업에 가까웠다고 보면 전자도서관 체제에서의 기존 도서관은 새로운 정보(지식)를 생산 가공하는 지식 생산업체로 변모할 것이며, 외부의 지식을 끊임없이 받아들이고 재생산할 수 있는 조직체인 것이다. 이에 따라 전자도서관은 데이터 표현양식도 SGML과 같이 개방성 있는 문서 표준화 양식으로 통일해야 하며 각 사이트 전자도서관시스템이 연계되어 정보공유가 가능하도록 하여야 한다. 이를 위하여 현재 추진되고 있는 국가주요전자도서관연계사업을 통하여 효율적인 전자도서관체제 구축을 위한 기술적 방안을 제시하고자 한다.

  • PDF

웹 기반의 교수 지원 시스템에서 XML형식의 학습지도안 설계 (Design of Study Guidance Plan with XML in Teacher Support System based on Web)

  • 최문경;김지영;정란;김행곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.1037-1040
    • /
    • 2001
  • 최근 웹을 교육 훈련 분야와 교수 업무 지원 분야에서 활용함으로써, 업무의 효율화를 기하고 학생들에게 필요한 정보와 질 높은 서비스를 제공하는 수단으로 이용하고 있다. 이러한 요구에 따라 웹 상에서 복잡한 학교 업무의 효과적인 관리와 학습 자료 및 업무 자료를 제공할 수 있는 교수 지원 시스템이 필요하다. 본 논문에서는 교수 지원 도메인 분석을 통해 개발 시스템 모델을 제시하고, 효율적인 XML 문서를 지원하는 방법을 제시하고 교수자의 다양한 요구사항을 융통성 있게 수용하고자 한다. 교수 지원 시스템중 학습지도안 작성을 위한 시스템의 표준화된 양식을 제공하기 위해 지도안의 항목들을 분석, 식별하고 프로토타이핑 시스템을 설계하고 이 시스템에 적용할 표준화된 DTD를 작성하고 XML 문서로 표현, 수정함으로써 웹 상에서 쉽게 지도안을 작성 할 수 있도록 한다. 본 논문에서 제안하는 교수 지원 시스템은 교수들이 교수 학습활동에 전념할 수 있도록 교육여건을 개선하고 나아가 교육정보 자료의 효과적인 관리 및 활용을 목적으로 한다.

  • PDF

ebXML 적용을 위한 항만물류산업 비즈니스 프로세스 설계 (Business Process Design to Apply ebXML Framework to the Port and Logistics Distribution Industry)

  • 최형림;박남규;임호섭;이현철;이창섭
    • 경영정보학연구
    • /
    • 제4권2호
    • /
    • pp.209-222
    • /
    • 2002
  • EDI(Electronic Data Interchange)는 빠른 정보 제공, 문서 작업 감소, 원활한 정보교환, 고객 서비스 향상 등의 장점을 지니고 있어 수년간 기업 활동을 지원하는 수단으로 널리 활용되어 왔다. 하지만 최근 인터넷을 통해 e-비즈니스 환경이 구현됨에 따라 EDI는 e-비즈니스를 수행하는 문서양식과 서식, 문서내용, 비즈니스 프로세스, 문서 처리방법 및 표현방법 등을 포함하는 정보활동의 총체적 개념인 ebXML(electronic business eXtensibleMarkup Language) 프레임워크(Framework)로 변화해 가고 있다. 이러한 ebXML 프레임워크를 산업에 적용하기 위해서는 비즈니스 프로세스(BP)나 핵심 컴포넌트(CC), 협력규약 프로필(CPP), 협력규약 합의(CPA)를 등록하는 등록저장소, 메세징 시스템 등이 필요하다. 본 연구에서는 타 산업에 비해 상대적으로 EDI를 많이 사용하고 있는 항만물류산업을 대상으로 EDI 시스템의 현황 및 문제점과 업무 프로세스를 분석하였다. 업무 프로세스 분석을 통해 ebXML프레임워크의 핵심요소인 등록저장소에 등록될 비즈니스 프로세스를 UN/CEFACT 모델링 방법론(UN/CEFACT Modeling Methodology)을 사용하여 정의하고 모델링 하였다. 본 연구에서는 ebXML 프레임워크를 항만물류산업에 적용하기 위해 UN/CEFACT 모델링 방법론에 따라 협업(Business Collaborations), 트랜잭션(Business Transactions), 문서흐름(Business Document Flows), 구성법(Choreography), 패턴(Pattem) 등을 UML(Unified Modeling Lanfuage)로 표현하였으며, 본 연구결과를 통하여 ebXML 프레임워크를 타 산업에 적용할 수 있는 메타방안을 제시하고 있으며, 항만물류산업에 속한 개별기업에서 실제 시스템을 구현할 수 있는 비즈니스 프로세스 설계를 목적으로 하고 있다.

스마트 클라이언트 응용을 이용한 문서 시스템의 설계 및 구현 (Design and Implementation of a Document System based On Smart Client Application)

  • 박종현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.593-596
    • /
    • 2006
  • 최근 스마트 클라이언트 기술에 대한 관심이 비약적으로 증가하고 있다. 인터넷 상에서 이뤄지는 입력, 출력 정보는 인터넷을 통해 서버에 저장되며, 이와 같은 정보 전달을 위해 웹 브라우저를 이용한다. 그러나 웹 브라우저는 단지 페이지를 사용자에게 전송하고, 이를 받아본 사용자는 브라우저 자체의 기능 미비로 인해 페이지의 내용 또는 하이퍼링크를 탐색하거나 입력, 수정, 삭제된 데이터를 전송하는 용도에 머물고 있으며, 특히 브라우저를 이용해서 양식을 표현하고자 할 경우 사용자 친화적인 화면으로 구현하기 위해서는 개발자의 많은 노력이 필요했다. 따라서, 본 논문에서는 브라우저 보다 기능과 인터페이스 구성이 뛰어난 스마트 클라이언트 어플리케이션을 이용한 비이민비자 신청서 시스템을 구현하였다. 이러한 결과 사용자 친화적인 화면을 구성하는데 비용이 적게 들었고 스마트 클라이언트 어플리케이션을 이용하기 때문에 배포 문제가 해결되었으며, 보안성이 증가하게 되었다.

  • PDF

분할 특징 추출에 의한 양식 문서의 분류 (Classification of Form-based Documents by Partitioned Feature Extraction)

  • 정현철;이종현;최영우;김재희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.520-523
    • /
    • 1999
  • Specially, form-based documents are easily understood, quickly processed and thus used more than the general documents. In this paper, a method to classify the documents with minimum features is proposed, not like former methods which use all possible features. To apply this characteristics. a document was first partitioned to areas of certain shape and size, then features were extracted from the partitioned area. It is also possible to sort the partitioned area by using the fact that each partitioned area has the different significance in the point of feature. In conclusion, by using proposed method of extracting features from partitioned document, the processing time decreases due to search area reduction.

  • PDF