• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.03 seconds

Automatic gasometer reading system using selective optical character recognition (관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템)

  • Lee, Kyohyuk;Kim, Taeyeon;Kim, Wooju
    • Journal of Intelligence and Information Systems
    • /
    • v.26 no.2
    • /
    • pp.1-25
    • /
    • 2020
  • In this paper, we suggest an application system architecture which provides accurate, fast and efficient automatic gasometer reading function. The system captures gasometer image using mobile device camera, transmits the image to a cloud server on top of private LTE network, and analyzes the image to extract character information of device ID and gas usage amount by selective optical character recognition based on deep learning technology. In general, there are many types of character in an image and optical character recognition technology extracts all character information in an image. But some applications need to ignore non-of-interest types of character and only have to focus on some specific types of characters. For an example of the application, automatic gasometer reading system only need to extract device ID and gas usage amount character information from gasometer images to send bill to users. Non-of-interest character strings, such as device type, manufacturer, manufacturing date, specification and etc., are not valuable information to the application. Thus, the application have to analyze point of interest region and specific types of characters to extract valuable information only. We adopted CNN (Convolutional Neural Network) based object detection and CRNN (Convolutional Recurrent Neural Network) technology for selective optical character recognition which only analyze point of interest region for selective character information extraction. We build up 3 neural networks for the application system. The first is a convolutional neural network which detects point of interest region of gas usage amount and device ID information character strings, the second is another convolutional neural network which transforms spatial information of point of interest region to spatial sequential feature vectors, and the third is bi-directional long short term memory network which converts spatial sequential information to character strings using time-series analysis mapping from feature vectors to character strings. In this research, point of interest character strings are device ID and gas usage amount. Device ID consists of 12 arabic character strings and gas usage amount consists of 4 ~ 5 arabic character strings. All system components are implemented in Amazon Web Service Cloud with Intel Zeon E5-2686 v4 CPU and NVidia TESLA V100 GPU. The system architecture adopts master-lave processing structure for efficient and fast parallel processing coping with about 700,000 requests per day. Mobile device captures gasometer image and transmits to master process in AWS cloud. Master process runs on Intel Zeon CPU and pushes reading request from mobile device to an input queue with FIFO (First In First Out) structure. Slave process consists of 3 types of deep neural networks which conduct character recognition process and runs on NVidia GPU module. Slave process is always polling the input queue to get recognition request. If there are some requests from master process in the input queue, slave process converts the image in the input queue to device ID character string, gas usage amount character string and position information of the strings, returns the information to output queue, and switch to idle mode to poll the input queue. Master process gets final information form the output queue and delivers the information to the mobile device. We used total 27,120 gasometer images for training, validation and testing of 3 types of deep neural network. 22,985 images were used for training and validation, 4,135 images were used for testing. We randomly splitted 22,985 images with 8:2 ratio for training and validation respectively for each training epoch. 4,135 test image were categorized into 5 types (Normal, noise, reflex, scale and slant). Normal data is clean image data, noise means image with noise signal, relfex means image with light reflection in gasometer region, scale means images with small object size due to long-distance capturing and slant means images which is not horizontally flat. Final character string recognition accuracies for device ID and gas usage amount of normal data are 0.960 and 0.864 respectively.

Generation of Finite Automata for Intrusion Detection (침입탐지를 위한 유한상태기계의 생성 기법)

  • Lim, Young-Hwan;Wee, Kyu-Bum
    • The KIPS Transactions:PartC
    • /
    • v.10C no.2
    • /
    • pp.119-124
    • /
    • 2003
  • Although there have been many studies on using finite automata for intrusion detection, it has been a difficult problem to generate compact finite automata automatically. In a previous research an approach to profile normal behaviors using finite automata was proposed. They divided the system call sequence of each process into three parts prefix, main portion, and suffix, and then substituted macros for frequently occurring substrings. However, the procedure was not automatic. In this paper we present algorithms to automatically generate intrusion detection automata from the sequence of system calls resulting from the normal runs of the programs. We also show the effectiveness of the proposed method through experiments.

Scheduling Scheme for Compound Nodes of Hierarchical Task Graph using Thread (스레드를 이용한 계층적 태스크 그래프(HTG)의 복합 노드 스케쥴링 기법)

  • Kim, Hyun-Chul;Kim, Hyo-Cheol
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.29 no.8
    • /
    • pp.445-455
    • /
    • 2002
  • In this paper, we present a new task scheduling scheme ior the efficient execution of the tasks of compound nodes of hierarchical task graph(HTG) on shared memory system. The proposed scheme for exploitation functional parallelism is autoscheduling that performs the role of scheduling by processor itself without any dedicated global scheduler. To adapt the proposed scheduling scheme for various platforms, Including a uni-processor systems, Java threads were used for implementation, and the performance is analyzed in comparison with a conventional bit vector method. The experimental results showed that the proposed method was found to be more efficient in its execution time and exhibited good load-balancing when using the experimental parameter values. Furthermore, the memory size could be reduced when using the proposed algorithm compared with a conventional scheme.

Automatic Topic Identification Based on the Ontology for Web Documents (온톨로지 기반의 웹 문서 자동 주제 식별)

  • Choi In-Dae;Nam In-Gil;Bu Ki-Dong
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.9 no.3
    • /
    • pp.38-45
    • /
    • 2004
  • The goal of this research is to develop a method of identifying a topic of a given text by looking at relationship of keywords defined in an ontology hierarchy. The keywords which are extracted from important sentences of the given text are mapped onto their correspond concepts which exist in the hierarchy. After all the words are mapped, the correspond concepts will be generalized into one single concept. The single concept will most likely be the topic of text. Our research have an approach that promotes both satisfaction in term of robustness and accuracy using ontologies and word frequency. So, this attempts are done in what they call as a hybrid approach. We try to take the challenge by using knowledge-statistical base approach. Experimental results show that proposed method outperforms the existing method using knowledge-base only.

  • PDF

An Automated Procedure for Word Balloon Placement in Cinema Comics ("영화 만화" 생성을 위한 말풍선 자동 배치 기법)

  • Hwang, Won-Il;Chun, Bong-Kyung;Ryu, Dong-Sung;Cho, Hwan-Gue
    • Journal of the Korea Computer Graphics Society
    • /
    • v.12 no.1
    • /
    • pp.27-36
    • /
    • 2006
  • 영화와 같은 사실적인 영상은 너무 많은 정보를 포함하고 있어서 때로는 사용자에게 제작자의 의도를 쉽게 전달하기 어려울 수 있다. 이와 달리 만화와 같은 비사실적인 영상은 중요하지 않은 부분을 아주 간단하게 표현하거나 혹은 중요한 부분만을 강조해서, 작가의 의도를 직관적으로 훨씬 잘 전달해 준다. 만화는 스피드라인, 말풍선, 배경 텍스쳐 등과 같은 만화 고유의 표현 기법들을 통하여 일반 정지영상들보다 많은 부가적인 정보를 전달해 준다. 특히, 말풍선은 장면 내의 인물들의 대사를 전달하는 매체로, 올바른 내용 전달을 위해 읽기순서(reading order)에 따른 말풍선간의 관계 및 말풍선과 인물간의 관계를 고려하여 적절한 위치에 배치 되어야 한다. 본 논문에서는 비디오 영상에서 추출된 장면의 만화적 변환을 위한 기법들 중에서 말풍선 자동 배치 방법을 제안한다. 제안한 방법은 지도에서 지명을 배치할 때 흔히 사용하는 특징점 라벨 배치(Point-Feature Label Placement) 방법에 기반하였다. 또한, 본 논문에서는 말풍선 배치가 얼마나 잘 되었는가를 평가하기 위한 객관적인 평가 함수를 제안하였다. "Love Actually", "살인의 추억"등의 다양한 영화 장면들을 이용하여 실험한 결과, 제안한 방법의 말풍선 배치 결과가 사람이 수작업으로 배치한 것과 비교해 크게 부족함이 없는 것을 알 수 있었다.

  • PDF

Material Auto-Transformation Plan using Steal House Method (스틸하우스 공법을 이용한 자재 자동 변환 방안)

  • Han, Jung-Soo;Kim, Gui-Jung
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.5
    • /
    • pp.25-31
    • /
    • 2011
  • In this paper, we propose virtual building construction plans. For this, we compose the construction materials with components and assemble components in pattern. When we change assembled constructions, we can design the building efficiently with patterns if the parts are selected. Also through information analysis of material components or patterns, we can provide information which is necessary to a reconstruction to the designer. Using steal house method, the assembly functions were comprised of a wall, a room, a window, a door, roof etc. Also We explained the materials automatic extraction method which applies steal house.

Automatic Identification of Fiducial Marks Existing on Aerial Photographs (항공사진에 포함된 사진 지표의 자동 인식)

  • Cho, Seong-Ik;Bang, Ki-In;Kim, Kyung-Ok
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.10 no.3 s.21
    • /
    • pp.79-87
    • /
    • 2002
  • This paper proposes an approach of automatically identifying the center of fiducial marks using radiometric and geometric characteristics of those marks existing on aerial photographs. Candidate region surrounding a mark, based on radiometric strategy, is determined by producing a bi-level image and by applying morphological operations. Based on geometric strategy, the central location of a mark is determined by applying ${\bigtriangledown}^G$ filtering and symmetry-enhancement filtering, and by finding peak location of symmetry. Evaluation with respect to 66 cases of sub-images containing a fiducial mark showed that the central location of the mark is determined up to around one pixel difference whit it is compared to a manual inspection.

  • PDF

Extraction of the shape feature according to the risk area of the segmented tumor region based on the small-animal PET (소동물 PET기반 종양분할영역 위험구간변화에 따른 형태특성추출)

  • Lee Joung-Min;Kim Hyeong-Min;Kim Myoung-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.376-378
    • /
    • 2006
  • 본 논문에서는 소동물 양전자방출단층촬영 영상(Positron Emission Tomography, PET) 내 종양영역을 자동분할하고 분할된 윤곽선주변의 기하학적 위험구간에 따른 종양의 형태특성을 분석하기 위한 방법을 제시한다. PET 영상내 검출된 종양영역의 신뢰성을 위해 위음성(False negative, FN) 및 위양성(False positive, FP)의 위험구간을 같이 제공하는 것이 필요하다. 따라서, 방사선 특이적 특성이 반영된 명암값을 기반으로 Fuzzy C-Means(FCM) 클러스터링을 수행하여 종양영역을 자동 분할한다. 분활된 종양영역의 위험구간은 클러스터 간 공유되는 영역의 소속값을 이용하여 위음성, 위양성을 계산한다. 또한, 임의의 소속값 임계치 변화를 통해 위험구간의 변화에 따른 종양의 형태적 특성변화를 관측한다. 이러한 지역적 변화의 관측을 통해 위험구간의 형태학적 위치를 판단할 수 있어 위험구간에 따른 추가적인 잔여 암의 위치 및 형태 파악을 용이하게 한다.

  • PDF

Management System for Experimental Data In Remote Measurement Device Using TCP/IP Socket (TCP/IP 소켓을 이용한 원격 측정 장치의 실험 데이터 통합 관리 시스템 개발)

  • Kim, Seon-Yeong;Cho, Hwan-Gue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06b
    • /
    • pp.397-400
    • /
    • 2010
  • 최근의 과학 실험은 그 규모나 내용에 있어서 점차 대형화되는 동시에 복잡해지고 있다. 이로 인하여 다양한 측정 장비로부터 도출된 실험 결과를 효율적으로 분석, 관리, 종합하는 도구의 필요성이 커지고 있다. 본 논문에서는 원격 측정 장치로부터 서로 다른 포맷의 실험 데이터를 자동 수집한 후 이중 정제한 데이터들만 추출하여 웹에서 시각화하는 실험 데이터 통합 관리 시스템을 제안한다. 먼저 원격 측정 장치의 데이터를 자동으로 수집하기 위해 폴링 서버를 설계하여 장치마다 폴링 에이전트를 도입하였다. 이를 통해 관리자가 각 측정 장치에 직접 접근하지 않고도 데이터를 수집할 수 있다. 폴링으로 확보한 데이터는 파싱을 통해 정제하고, 이들 데이터로 데이터베이스를 구축한다. 정제한 데이터는 시각화하여 사용자가 웹에서 쉽게 파악할 수 있다. 데이터 폴링은 TCP/IP Socket을 통해 수행하므로 보편적으로 사용하는 FTP 방식에 비해 데이터 확보 시 신뢰성을 높일 수 있으며, 폴링 여부 판단 시에는 동기식, 실제 폴링 시에는 비동기식 통신 방법을 사용하여 폴링의 효율을 높였다. 본 시스템을 활용하여 사용자의 임의적인 데이터 접근을 최소화하였고 데이터의 전송, 저장, 관리를 자동화함으로써 편의성을 높였다. 본 시스템을 활용하여 원격 실험 장치로부터 데이터를 확보할 때의 정확성과 폴링 및 파싱 속도를 실험을 통해 측정하였고, 그 결과 폴링 시 100%의 정확도와 정상 포맷의 데이터에 대해서 100%의 파싱 결과를 보임으로써 본 시스템이 원격 장치의 실험 데이터를 통합 관리할 때 적합함을 알 수 있었다. 추후 데이터의 속성에 따라 클러스터링 할 예정이며 클러스터링에 따른 시각화 서비스를 제공할 계획이다.

  • PDF

An Integrated Expert System for Automated Data Reduction in High-speed Holographic Interferometry (고속 홀로그래픽 간섭 계측기를 이용한 자동데이터 처리 통합전문가 시스템)

  • 주원종
    • Journal of the Korean Society for Precision Engineering
    • /
    • v.11 no.2
    • /
    • pp.120-133
    • /
    • 1994
  • 홀로그래픽 간섭계측기로터 나오는 영상 데이터를 해석하는 전문가시스템에 대하여 기술하였다. 그동안 간섭 띠무늬(fringe)를 해석하는 방법들이 어느 정도의 자동화를 이룩하며 개발되어왔다. 그러나, 복잡한 간섭 띠무늬 패턴(fringe pattern)및 심한 잡음이 생기게 되는 고속도 항공공학 분야 또는 실험기계공학 분야에서는 신뢰할 만한 자동화를 이룩하기가 매우 힘들었다. 현재 사용가능한 방법중에는 간섭띠무늬 추적, 위상전이, 푸리에 변환, 회귀분석 등이 있는데, 이들은 소음제거나 데이터 수정을 하는데 있어서 극히 국부적인 정보에만 의존하였다. 결과적으로, 특별히 심한 소음이 있는 경우, 부정확한 위상중첩이나 간섭띠무늬 순차배열문제에 부딪히게 되고 따라서 작업자의 수작업이 심각하게 필요하게 된다. 본 논문에서는 간섭띠무늬 추적방법의 자동화 를 위한 새롭고 포괄적인, 규칙기반 전문가시스템에 대하여 기술하였다. 새로 개발된 전문가 시스템은 간섭띠무늬 패턴에 대한 전체적인 또는 지연적인 정보를 추출해 내고 또 전문가가 가지고 있는 지식을 이용한다. 이 전문가 시스템은 저수준 및 고수준 처리를 동시에 할 수 있도록 상호연결기구를 채택하여 간섭띠무늬를 해석하는 적절한 해결책을 마련하였다. 또한 위상전이나 푸리에 변환 방법에서 문제가 되는 자동위상 중첩에 대해 개발된 전문가 시스템의 응용의 가능성에 대해서도 기술하였다.

  • PDF