• Title/Summary/Keyword: Automatic Information Extraction

Search Result 592, Processing Time 0.033 seconds

Automatic Stroke Extraction Based on TrueTypeFont (트루타입폰트 기반 자동 획 분할)

  • Jang, Hyun-Gyu;Koo, Sang-Ok;Jung, Soon-Ki
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.703-705
    • /
    • 2005
  • 이 논문에서는 트루타입 폰트(TrueTypeFont: TTF)로부터 한자의 외곽선 정보를 얻어 자동으로 획을 분리해 내는 방법을 제안한다. 트루타입 폰트는 각 글자에 대한 외곽선 정보를 벡터 형식으로 저장하고 있다. 저장된 벡터의 방향과 위치 정보를 사용하여 한자의 획을 하나씩 분리해 낸 후, 그것을 조합하면 효율적으로 한자 학습 컨텐츠를 완성 할 수 있다. 제안한 방법으로 완성된 컨텐츠는 트루타입 폰트가 갖고 있는 벡터 이미지로서의 특성을 그대로 취할 수 있다는 장점이 있다. 제안한 방법으로 획을 분리하고 분리된 획을 순서대로 조합하여 보다 양질의 학습 컨텐츠를 제작할 수 있을 것으로 기대한다.

  • PDF

Automatic Generation of Reusable Components Supporting Extraction of Subcomponents (서브컴포넌트 추출을 지원하는 재사용 컴포넌트의 자동 생성)

  • 최현숙;이기호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.520-522
    • /
    • 1998
  • 기존의 소프트웨어에서 함수나 클래스와 같은 부분을 추출해 재사용하는 방법은 비용면에서 상당히 효율적이다. 그러나 이러한 방법을 사용한 기존의 연구들은 추출해 낸 부분이 표준 컴포넌트의 형태를 갖추지 못해서 일반적인 개발환경에서 활용되지 못하고 있다. 본 연구에서는 기존의 객체지향 소프트웨어에서 재사용성 높은 부분을 추출하여 이를 표준 컴포넌트로 변환하는 재사용 컴포넌트 생성 시스템을 설계 및 구현하였다. 구현환경 Solaris에서 자바를 이용하였고 대상 컴포넌트 모델은 자바빈즈이다. 본 연구에서는 추출되는 컴포넌트의 높은 재사용성을 보장하기 위하여 객체지향 재사용 메트릭스 WMC, LCOM과 독립성을 적용한다. 특히, 생성된 컴포넌트는 자신의 서브컴포넌트 추출을 지원함으로써 높은 재사용성과 유사성을 보장하고, 개발환경에서 적절히 활용될 수 있다.

Automatic Extraction of Semantic Relationships from Images Using Ontologies and SVM Classifiers (SVM과 온톨로지를 이용한 이미지 의미 관계 자동 추출 기법)

  • Jeong, Jin-Woo;Joo, Young-Do;Lee, Dong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.13-18
    • /
    • 2007
  • 효과적인 이미지 검색을 위하여, 이미지의 저수준 시각 정보로부터 고수준 의미 정보를 추출하는 기술에 관한 많은 연구가 이루어지고 있다. 특히 최근에는 Support Vector Machine과 같은 기계 학습 기법을 이용한 이미지 어노테이션 시스템의 개발이 활발히 진행중이이다. 그러나 기존의 연구들은 단편적인 이미지 정보만을 추출함에도 불구하고, 그 성능이 여전히 만족스럽지 못하다. 본 논문에서는 Support Vector Machine과 온톨로지를 이용하여 이미지의 다양한 정보를 효과적으로 추출 및 기술할 수 있는 시스템을 제안한다. 특히 온톨로지는 특정 도메인의 상세한 지식 표현과 추론을 위한 지식베이스로서, 본 논문에서는 Support Vector Machine을 이용하여 이미지 안에 존재하는 객체들의 컨셉을 판별하고 이미지 어노테이션 온톨로지와 생태계 온톨로지를 이용하여 공간 관계, 천적 관계와 같은 객체간 의미 관계를 자동적 자동적으로 추출하는 방법을 제안한다.

  • PDF

Automatic Stroke Extraction of TrueType Font and Handwriting of Hangul (한글 트루타입폰트 및 손글씨의 자동 획 분할 알고리즘)

  • Kwak, Yoon-Seok;Koo, Sang-Ok;Jung, Soon-Ki
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.275-280
    • /
    • 2008
  • 본 논문에서는 한글 글립(glyph)의 형태학적 분석을 통해 자동으로 획을 분할하는 방법을 제안한다. 제안된 방법은 thinning된 한글 글립의 골격(skeleton) 이미지를 기반으로, 획 분리, 획 병합, 그리고 획 볼륨 복원의 세가지 단계를 거쳐 한글의 기본 획들을 추출해 낸다. 실험 결과, 트루타입폰트(TrueType Font)에 대해서는 80%, 손글씨(Handwriting) 글립에 대해서는 72%의 획 분할 정확도를 보였다. 본 논문에서 제안한 방법으로 획득된 획 정보를 이용하여, 향후 한글 손글씨 생성을 위한 연구를 하고자 한다.

  • PDF

Automatic Text Extraction in Video Images using Morphology (모폴로지을 이용한 비디오 영상에서의 자동 문자 추출)

  • 장인영;고병철;김길천;변혜란
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.418-420
    • /
    • 2001
  • 본 논문에서는 뉴스 비디오의 정지 영상에서 뉴스 자막과 배경 문자를 추출하기 위한 새로운 방법을 제안한다. 본 논문에서는 일차적으로 입력 컬러 영상을 그레이 영상으로 변환한 후 입력 영상의 명암 대비를 강화시키기 위해 명암 대비 스트레칭을 적용한다. 이후 명암 대비 스트레칭된 영상의 분할을 위해 적응적 임계값을 적용하고 다음 단계에서 문자와 유사한 영역들을 적당한 크기 의 structuring element를 이용하여 제거하는 1차 하부 단계와 모폴로지 녹임(erosion)을 적용한 영상과 모폴로지(열림닫힘[OpenClose]+닫힘열림[CloseOpen])/2가 적용된 영상 사이의 차이 영상을 구하는 2차 하부 단계를 적용시킨다. 마지막 단계에서 각 후보 영역들 중 실제 자막 영역을 추출해내기 위해, 후보 문자 영역의 화소수 비율과 외곽선의 화소수의 비율, 그리고 장축과 단축간의 비율 등에 대해 필터링을 적용한다. 본 논문에서는 임의의 300개의 뉴스영상을 입력 값으로 실험한 결과 93.6%의 우수한 인식률을 얻을 수 있었다. 또한 본 논문에서 제안한 방법은 structuring element의 크기 조절을 통해 크기가 다른 다양한 이미지에서도 좋은 성능을 거둘 수 있다.

  • PDF

Recognition of Identifiers from Shipping Container Image by Using Fuzzy Binarization and ART2-based RBF Network

  • Kim, Kwang-Baek
    • Journal of Intelligence and Information Systems
    • /
    • v.9 no.2
    • /
    • pp.1-18
    • /
    • 2003
  • The automatic recognition of transport containers using image processing is very hard because of the irregular size and position of identifiers, diverse colors of background and identifiers, and the impaired shapes of identifiers caused by container damages and the bent surface of container, etc. We proposed and evaluated the novel recognition algorithm of container identifiers that overcomes effectively the hardness and recognizes identifiers from container images captured in the various environments. The proposed algorithm, first, extracts the area including only all identifiers from container images by using CANNY masking and bi-directional histogram method. The extracted identifier area is binarized by the fuzzy binarization method newly proposed in this paper and by applying contour tracking method to the binarized area, container identifiers which are targets of recognition are extracted. We proposed and applied the ART2-based RBF network for recognition of container identifiers. The results of experiment for performance evaluation on the real container images showed that the proposed algorithm has more improved performance in the extraction and recognition of container identifiers than the previous algorithms.

  • PDF

A Study on the Pattern Segmentation and Classification in Specially Documentated Imaged (제한된 문서 영상에서 패턴 분절과 구분 처리에 관한 연구)

  • 옥철호;허도근;진용옥
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.14 no.6
    • /
    • pp.663-674
    • /
    • 1989
  • In order to design the automatic processing system of image document, the pattern segmentation of image document and classification methods are presented. The contour extraction using first order differential operator of Gauassian distribution fucntions, the image segmentation using the chain code, and the pattern classication using the second order moments and two=dimensional Rf distance(in transform domain) are implemented. The resuts applied in specially documantated image shows to classify the characters, fingerprints, seals etc well. And the utility of the used algorithms is verified.

  • PDF

Automatic Extraction and Clustering of Concepts for Domain Ontology Construction (도메인 온톨로지 구축을 위한 개념 자동 추출 및 클러스터링)

  • Jung, Hyun-Ki;Kim, Yu-Seop
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.305-309
    • /
    • 2008
  • 기존의 온톨로지 구축에 관한 연구들을 살펴보면 개념의 상 하위 관계와 관련한 연구 또는 기구축된 도메인에 특화된 지식베이스에 기반한 도메인 온톨로지 구축 연구가 주를 이룬다. 그러나 개념과 개념간의 관계는 상 하위 구조와 같은 단순한 계층적 구조로는 그 다양한 특성을 표현할 수 없으며, 도메인 온톨로지를 구축하는 경우에 기구축된 데이터베이스와 같은 개념간 관계가 잘 정의된 데이터는 반드시 필요하였다. 예를 들면, 다양한 지식이 구축되어 있는 데이터베이스나 특정 도메인에 관한 전문 사이트(예 : 의학정보, 약학정보 사이트) 등이 있어야 개념간의 다양한 관계가 표현되어 있는 온톨로지를 구축할 수 있었다. 본 연구에서는 도메인 온톨로지를 구축함에 있어서 이러한 제약을 극복하기 위하여 도메인에 특화된 문서들을 웹 검색을 통하여 수집하였고, 수집된 문서 데이터를 이용하여 자동으로 도메인에 특화된 개념들을 추출하고 이들 개념들을 클러스터링함으로써 개념들간의 다양한 관계를 표현할 수 있는 도메인 온톨로지의 자동 구축 가능성을 제시한다.

  • PDF

Improved Bimodal Speech Recognition Study Based on Product Hidden Markov Model

  • Xi, Su Mei;Cho, Young Im
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • v.13 no.3
    • /
    • pp.164-170
    • /
    • 2013
  • Recent years have been higher demands for automatic speech recognition (ASR) systems that are able to operate robustly in an acoustically noisy environment. This paper proposes an improved product hidden markov model (HMM) used for bimodal speech recognition. A two-dimensional training model is built based on dependently trained audio-HMM and visual-HMM, reflecting the asynchronous characteristics of the audio and video streams. A weight coefficient is introduced to adjust the weight of the video and audio streams automatically according to differences in the noise environment. Experimental results show that compared with other bimodal speech recognition approaches, this approach obtains better speech recognition performance.

Automatic Extraction of Alternative Words for Product Review Summarization (상품리뷰요약을 위한 대체어 자동추출)

  • An, Mi-Hee;Baik, Jong-Bum;Lee, Su-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.501-503
    • /
    • 2012
  • 오피니언 마이닝에서 특징기반으로 상품평을 요약할 때, 동일한 상품의 같은 특징에 대한 사용자의 표현이 일치하지 않아 같은 특징을 다른 것으로 인식하는 오류가 발생되어 효과적인 분석을 하는데 어려움이 있다. 본 연구에서는 이러한 문제점을 해결하기 위하여 온라인쇼핑몰의 상품평에서 명사와 형용사쌍 말뭉치를 이용하여 연관단어뭉치를 추출하고, 상관성이 높은 형용사를 각 명사의 특징으로 이용하여 대체어 목록을 자동으로 추출하는 방법을 제안한다.