• 제목/요약/키워드: Document Image

검색결과 300건 처리시간 0.029초

웹 통합문서의 효율적 생성과 검색을 위한 자동링크지원 시스템의 설계 및 구축 (Design and Implementation of Automatic Linking Support System for Efficient Generating and Retrieving Integrated Documents Based on Web)

  • 이원중;정은재;주수종;이승용
    • 정보처리학회논문지A
    • /
    • 제10A권2호
    • /
    • pp.93-100
    • /
    • 2003
  • 분산 컴퓨팅과 웹 서비스 기술의 발달과 함께, 급증하는 인터넷 사용자는 웹 기반의 맞춤형 정보를 편리하게 작성하고 제공받을 수 있는 서비스들을 요구하고 있다. 이를 위해, 본 논문에서는 맞춤형 정보로서 웹 기반의 통합문서를 생성하고, 사용자 요구에 따라 다양한 검색을 지원할 수 있는 자동링크지원 시스템(ALSS : Automatic Linking Support System)을 구축하고자 한다. 본 시스템의 구성은 클라이언트/서버 환경을 기반으로, 서버는 어휘분석, 질의처리 및 통합문서생성 기능들을 제공하는 자동링크엔진과 사전, 이미지 컨텐츠 및 URLs로 이루어진 데이터베이스를 지원하도록 구축하였다. 클라이언트 측은 서버 측의 자동링크엔진과 데이터베이스를 접근하여 웹 기반의 통합문서를 생성하는 웹 에디터와 검색 서비스를 지원하는 웹 도우미로 구축하였다. 웹 에디터나 웹 도우미 프로그램은 클라이언트 측에 별도의 설치 없이 서버로부터 다운로딩하여 실행할 수 있으며, 서버의 실행기능들의 일부를 글라이언트 측에 분산시키므로써 서버의 부하를 감소시켰다. 본 시스템의 구현으로서, 사용자 인터페이스는 JDK 1.3 기반의 SWING을 이용하고, 클라이언트와 서버간의 연동을 위한 자바 RMI 기법을 적용하였으며, SQL Server 7.0을 사용하여 데이터베이스를 구축하였다. 마지막으로 웹 에디터와 웹 도우미에 의해 자동링크엔진과 데이터베이스를 접근하는 과정과 그들의 실행결과를 보였다.

18세기 전반 물선진상 관련 자료 분석 - 『진상별단등록』을 중심으로 - (Mulseon-Jinsang Related Document Analysis in First Half of the 18th Century)

  • 전상욱
    • 헤리티지:역사와 과학
    • /
    • 제47권4호
    • /
    • pp.178-191
    • /
    • 2014
  • 진상제는 지방의 특산물을 왕실에 봉진하는 제도이다. 진상물은 물품의 성격, 봉진시기, 용도에 따라 제향진상, 방물진상, 물선진상, 약재진상으로 구분된다. 이 중에서 물선진상은 전국의 산해진미를 봉진하는 것으로, 주로 식재료로 구성되었다. 그리고 물선진상은 다른 진상물과 달리 물품의 수량 경감 내지 일시적인 봉진 중지가 빈번하였다. 이는 물선진상의 경감을 통해 백성에게 물질적인 혜택을 줌으로써 자애로운 군주상을 확보하기 위한 국왕의 의도였다. 숙종 역시 재위기간 동안 빈번히 물선진상을 경감하거나 폐지하였다. 그러나 이 같은 물선진상 변경내역의 문서 보완이 미비하면서, 영조 즉위 직후 물선진상의 물종 및 수량이 불분명한 상태였다. 이에 영조는 "진상별단등록" 간행을 통해 물선진상의 물종 및 수량, 경감내역을 분명히 하였다. "진상별단등록"은 진상지역, 봉진시기, 봉진대상, 물종 및 수량, 경감내역이 기재되어 있다. 이 중에서 물선진상의 물종 및 수량은 다른 내용에 비해 중요하다. "진상별단등록"에 수록된 물선진상은 총 176종에 이르는데, 이 중에서 어류, 패류, 건어류 등 수산물이 117종으로 약 67%를 차지하고 있었다. 그리고 대부분의 물선진상이 원재료로 구성되어 있었고, 생물 이외에 말리거나 절이는 등 다양한 형태로 가공되었다. 물선진상의 지역별 분정특징을 살펴보면, 경상도, 함경도, 강원도 순으로 물선진상이 많이 수록되어 있다. 그리고 이들 지역은 동해안과 접해 있다보니, 수산물의 비중이 상대적으로 높은 편이다. 경상도와 전라도는 석류, 유자 등 양남지역의 대표적인 과실류가 분정되어 있었고, 제주도는 감귤류, 각종 전복가공품 등 전국에서 유일하게 분정된 물종이 대부분을 차지하고 있었다. 그리고 서울과 지리적으로 먼 곳에 위치한 도에는 건어류, 염어류 등을 집중적으로 분정하였다.

완판본(完板本) 심청전 복각 목판을 이용한 한지상의 인출특성에 관한 실험적 연구 (An Experimental Study on the Printing Characteristics of Traditional Korean Paper (Hanji) Using a Replicated Woodblock of Wanpanbon Edition Shimcheongjeon)

  • 유우식;김정곤;안은주
    • 보존과학회지
    • /
    • 제37권3호
    • /
    • pp.289-301
    • /
    • 2021
  • 고문헌 조사에서 목판 인쇄된 것인지 금속활자로 인쇄된 것인지를 판별해야 하는 경우가 있다. 우리나라는 물론이고 세계적으로 금속활자의 발명과 활용시기가 어떻게 판정되느냐에 따라 인쇄의 역사가 바뀔 수 있기 때문이다. 목판본과 금속활자본의 판정에는 다양한 정보가 활용되고 있으나 간기(刊記)를 비롯한 인쇄 배경에 관한 정보가 없는 경우에는 인쇄된 문서의 글자, 광곽, 먹의 종류, 먹의 제작시대, 한지의 제작시기 정보를 분석하여 고문서의 제작시기와 인출(印出)방법에 관한 판정을 하게 된다. 이러한 정보가 체계적으로 자료화되어 있지 않아 연구자의 경험과 감각에 의한 판단에 의지할 수밖에 없는 상황이다. 본 연구에서는 완판본(完板本) 심청전 복각 목판을 이용하여 목판본의 인출 특성을 실험적으로 조사하였다. 목판본 인출 시에 나타나는 다양한 현상과 특징을 자료화하여 고문헌의 인출방법을 판정하는 데 참고할 수 있도록 하였다. 간기가 없는 목판 고소설의 경우 목판의 마모정도에 따라서 인출시기의 전후관계 추정에도 참고자료로 활용할 수 있을 것이다.

무선 인터넷을 위한 프레임 지원 HTML 변환기의 설계 및 구현 (Design and Implementation of an HTML Converter Supporting Frame for the Wireless Internet)

  • 한진섭;박병준
    • 전자공학회논문지CI
    • /
    • 제42권6호
    • /
    • pp.1-10
    • /
    • 2005
  • 본 논문은 무선 응용 프로토콜 환경에서 무선 인터넷 액세스를 위한 HTML 변환기의 설계 및 구현에 대해 기술한다. 구현된 HTML 변환기는 콘텐츠 변환, 변환 규칙 집합, WML 파일 생성, 프레임 콘텐츠 재구성 모듈로 구성된다. 일반 텍스트 콘텐츠의 경우, 변한 규칙 집합을 참조하여 콘텐츠 변환 모듈에서 일대일 태그 매핑을 통해 WML 콘텐츠로 변환이 되며, 프레임으로 구성된 콘텐츠는 프레임 콘텐츠 재구성 모듈에서 최초에 받은 프레임 셋 소스를 파싱하여, 포함되어 있는 모든 파일 이름들을 가지고 요구 메시지를 구성하여, 파일 개수만큼 다시 서버에 연결해서 각각의 문서들을 받아 처음에 받은 HTML 문서에 연결시키고, 일련의 재구성 과정을 거친 후, 테이블 형태의 WML 콘텐츠로 변환이 된다. 이미지 맵이 포함된 콘텐츠는 이미지 맵 관련 태그를 파싱한 후, 링크되어 있는 HTML 문서의 이름을 추출해서 WML 콘텐츠 데이터로 대체하고, 해당 콘텐츠로 링크시킴으로써 변환이 가능하게 한다. 제안한 프레임 콘텐츠 변환 방법은 기존 상용 변환기와는 달리 사용자의 편의와 상호 운용성이 고려된 변환 방법이며, 이미지 맵의 경우 상용 변환기에서는 지원되지 않는 부분이다.

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.

Morphologic Analysis of Water-Cooled Bipolar Radiofrequency lesions on Egg White in Vitro

  • Kang, Sang-Soo;Park, Jung-Chan;Yoon, Young-Jun;Shin, Keun-Man
    • The Korean Journal of Pain
    • /
    • 제25권3호
    • /
    • pp.151-154
    • /
    • 2012
  • Background: The aim of this study was to document the optimal spacing of two cannulae to form continuous strip lesions and maximal surface area by using water-cooled bipolar radiofrequency technology. Methods: Two water-cooled needle probes (15 cm length, 18-gauge probe with 6 mm electrode tip) were placed in a parallel position 10, 20, 24, 26, and 28 mm apart and submerged in egg white. Temperatures of the probes were raised from $35^{\circ}C$ to $90^{\circ}C$ and the progress of lesion formation was photographed every 1 minute with the increase of the tip temperature. Approximately 30 photographs were taken. The resultant surface areas of the lesions were measured with the digital image program. Results: Continuous strip lesions were formed when the cannulae were spaced 24 mm or less apart; monopolar lesions around each cannula resulted if they were spaced more than 26 mm apart. Maximal surface areas through the formation of continuous strip lesion were 221 $mm^2$, 375 $mm^2$, and 476 $mm^2$ in 10, 20, and 24 mm, respectively. Summations of maximal surface area of each monopolar lesions were 394 $mm^2$ and 103 $mm^2$ in 26 and 28 mm, respectively. Conclusions: Water-cooled bipolar Radiofrequency technology creates continuous "strip" lesions proportional in size to the distance between the probes till the distance between cannulae is 24 mm or less. Spacing the cannulae 24 mm apart and treating about $80^{\circ}C$ for 24 minutes maximizes the surface area of the lesion.

디올 패션 하우스 디자인의 아이덴티티 연구 - 폰 갈리아노 디자인을 중심으로 - (The Study on the Design Identity of Dior Fashion House - Concentrating on John Galliano -)

  • 정정희;고현진
    • 복식
    • /
    • 제59권6호
    • /
    • pp.126-139
    • /
    • 2009
  • The following study from the perspective that the identity of a brand is determined by the creative work of the designer, will review the design identity of fashion house, which have maintained a basic concept of couture house until recently. For this purpose, first, the concepts of fashion house and identity could be examined, and then the design identity of both the past couture designer and the present house designer could be comparatively analyzed. This study focused on John Galliano of Dior, and was carried out under the method of document study and case study. Based on this, the analytic results of the design identity of fashion houses are as follows. The design identity of fashion house, which has its origins in the past couture house, appears from the house characteristics, design characteristics and the design image. The original design identity of Dior House seems to be feminism and elegant extravagance, which naturally models the body line of women into diverse lines. The new design identity of Dior House by Galliano, while reflecting wit and fantasy, at the same time is expressed as sexy and romantic elegance which attempts to express the beauty of modern women. The pursue of chic elegance, which is the characteristic of early Dior design, have changed into avant garde and unique designs with tendencies of multi-culturalism due to the most recent house designers. Finally, Dior house design has successfully maintained the master of handcrafted quality based on craftsmanship, the history from the house archive, and the modern trends appropriately added by the creativity of Galliano.

TISS system 및 DELTA system에 의한 섬유식별 (Fiber Identification via the TISS and DELTA Systems)

  • 전수경
    • 한국가구학회지
    • /
    • 제10권1호
    • /
    • pp.1-12
    • /
    • 1999
  • Of the vast number of plant taxa in the world, the wood is one of the most useful resources. It is important to identify the fibers of wood and pulp for the plant taxonomy and for the uses, but we do not have enough information on them, on them, especially for the computerizd data. The fiber identification is one of the difficult tasks. In addition to the plant taxonomy and the fiber-using industries, such identification is also important in many other fields, including education. document examiners, etc. For these purpose, the fibers should be exactly distinguished. The TISS system I have programed to identify various woods would also be useful in the identification of fibers by the genus and species in the features of unknown samples and in searching the features of a species based on its scientific name. Such searching programs are being developed in many other countries with a view to searching for the species name by using the features of the cells of the woody materials. With the survey of all the available literature, the features of the fibers of 124 species both of softwood and hardwood were examined under the electron and optical microscopies. Each species were coded and carded by the feature, and the databases were built. The microscopic were inputted into a personal computer program called and by a slide film scanner. The new computer program called TISS 2 was developed using C computer language. Korean language fonts were added to the TISS 2. The TISS 2 can be in adding and searching a image of fiber features both of a known fiber and an unknown fiber. The databases were corded for the DELTA system with was developed by Dallwitz and Paine in Australia, 1986.

  • PDF

3차원 형상 모델의 디지털 워터마킹 구현 (The Implementation of the Digital watermarking for 3D Polygonal Model)

  • 김선형;이순흠;김기석;안덕상
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.925-930
    • /
    • 2002
  • 워터마킹은 DRM(digital rights management)의 요소 기술로서 많은 연구가 진행되어 왔다. 하지만, 3D 신속 조형 기술(RP : rapid proto-typing)에 적용된 연구는 찾아보기 어렵다. 대부분의 연구가 텍스트 문서, 2D 이미지, 동영상, 음악 등의 컨텐츠에 한정되어 있다. RP 시스템은 다품종 소량 생산에 적합하고, 시제품을 제작하여 제품개발 초기 단계에서 설계상의 오류나 부적합한 요인을 조기에 발견하는 것이 가능한 까닭에 산업 현장에 많이 사용되고 있다. 본 논문은 3D 형상 모델을 가지고 있는 STL(stereolithography) 파일에 워터마크를 삽입하는 방법에 관한 연구이다. 제안된 알고리즘은 3D 형상 데이터의 법선 영역과 패싯 뒷면 영역에 워터마크를 삽입한다. 이런 까닭에 3D 형상에는 어떠한 왜곡도 발생하지 않으며 워터마크의 비가시성(invisibility)을 충족한다. 제안된 알고리즘으로 3D 형상 데이터의 법선 영역과 패싯 뒷면 영역에 워터마크 데이터의 삽입과 추출이 가능함을 보여주었으며, 본 연구의 실험 결과는 fragile 워터마킹과 robust 워터마킹과의 이용가능성을 제시하였다.

Optical Character Recognition for Hindi Language Using a Neural-network Approach

  • Yadav, Divakar;Sanchez-Cuadrado, Sonia;Morato, Jorge
    • Journal of Information Processing Systems
    • /
    • 제9권1호
    • /
    • pp.117-140
    • /
    • 2013
  • Hindi is the most widely spoken language in India, with more than 300 million speakers. As there is no separation between the characters of texts written in Hindi as there is in English, the Optical Character Recognition (OCR) systems developed for the Hindi language carry a very poor recognition rate. In this paper we propose an OCR for printed Hindi text in Devanagari script, using Artificial Neural Network (ANN), which improves its efficiency. One of the major reasons for the poor recognition rate is error in character segmentation. The presence of touching characters in the scanned documents further complicates the segmentation process, creating a major problem when designing an effective character segmentation technique. Preprocessing, character segmentation, feature extraction, and finally, classification and recognition are the major steps which are followed by a general OCR. The preprocessing tasks considered in the paper are conversion of gray scaled images to binary images, image rectification, and segmentation of the document's textual contents into paragraphs, lines, words, and then at the level of basic symbols. The basic symbols, obtained as the fundamental unit from the segmentation process, are recognized by the neural classifier. In this work, three feature extraction techniques-: histogram of projection based on mean distance, histogram of projection based on pixel value, and vertical zero crossing, have been used to improve the rate of recognition. These feature extraction techniques are powerful enough to extract features of even distorted characters/symbols. For development of the neural classifier, a back-propagation neural network with two hidden layers is used. The classifier is trained and tested for printed Hindi texts. A performance of approximately 90% correct recognition rate is achieved.