• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.026 seconds

Extraction and Elimination of Red-Eye Area using Color Information of Skin (피부 색상 정보를 이용한 적목 영역 추출 및 제거)

  • Jang, Ho-Joong;Cho, Jae-Hyun;Kim, Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.10a
    • /
    • pp.440-443
    • /
    • 2008
  • 적목 현상은 야간에 플래시를 이용하여 촬영 시 나타나는 현상으로, 대부분 미숙한 사진 촬영 방법으로 인해 많이 발생한다. 이러한 적목 현상은 수정 시에 이미지 틀을 이용하여 제거해야 되며, 이러한 방법은 많은 시간과 기술이 요구된다. 따라서 본 논문에서는 적목 현상이 일어난 영역을 자동으로 추출하여 제거하는 방법을 제안한다. 적목 영역은 RGB 레벨의 영상을, 각각 YCbCr과 HSI 컬러 공간으로 변환 후에 사람의 피부색 정보를 이용하여 얼굴 영역을 검출한다. 검출된 얼굴 영역에서 적목이 존재하는 눈 영역은 색상 정보와 8 방향 윤곽선 추적 방법을 적용하여 적목 영역을 검출한 후에 적목 현상을 제거한다. 제안된 적목 영역 추출 및 제친 방법을 적목 현상이 나타나는 30장의 영상을 대상으로 실험한 결과, 제안된 방법이 적목 영역 제거에 효과적임을 확인하였다.

  • PDF

English-to-Korean Transliteration using Multiple Unbounded Overlapping Phonemes (복수 음운 정보를 이용한 영.한 음차 표기)

  • Kang, In-Ho;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.50-54
    • /
    • 1999
  • 본 연구에서는 기존의 한정된 길이의 영어 또는 한글의 발음 단위를 이용하던 자동 음차 표기 방식과 달리, 학습 데이터에서 추출한 임의 길이의 음운 패턴을 사용하는 방법을 제안한다. 통계적 정보에 기반하여 추출한 음차 표기 패턴과 외래어 표기 규칙에 기반하여 기술한 음차 표기 패턴을 위치와 길이에 관계없이 사용하여 주어진 영어 단어의 한글 음차 표기를 얻어낸다. 제안하는 방법은 먼저 주어진 영어 단어의 가능한 모든 발음 단위를 기준으로 한글 표기 네트워크를 만든 후, 학습 데이터에서 추출한 음운 패턴을 교차 적용시켜 네트워크 각 노드의 가중치를 결정한다. 가중치가 결정된 네트워크에서 가중치의 합이 가장 좋은 경로를 찾아냄으로 해서 음차 표기를 수행한다. 본 연구에서 제안하는 방법으로 실험을 한 결과 자소 단위 86.5%, 단어 단위 55.3%의 정확률을 얻을 수 있었다.

  • PDF

COSMIC : Design and Implementation of a Content-Based Multimedia Retrieval System using Domain Knowledge and Visual Information (COSMIC : 영역지식과 시각정보를 이용한 내용기반 멀티미디어 검색 시스템의 설계 및 구현)

  • Kim, Deok-Hwan;Kim, Si-U;Park, Gwang-Sun;Lee, Byeong-Gu;Cha, Gwang-Ho;Jeong, Jin-Wan
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.5 no.1
    • /
    • pp.14-28
    • /
    • 1999
  • 최근 멀티미디어 데이터로부터 내용에 대한 정보를 추출하여 데이터베이스에 저장하고 내용에 기반한 질의를 수행하도록 하는 내용 기반 검색 시스템이 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용 기반 멀티미디어 검색 시스템인 COSMIC(Content Based Multimedia Information Processor)의 설계 및 구현에 관하여 기술한다. COSMIC은 대용량 이미지 데이터로부터 자동으로 추출된 시각적 특징 데이터들을 다차원 점접근 방법(Point Access Method)인 HG-트리를 이용하여 색인하고 예제 이미지와 사용자가 그린 스케치에 의한 시각적 질의를 제공한다. 또한 COSMIC은 비디오 데이터로부터 추출된 다양한 의미 정보를 이용하여 의미 질의를 제공한다. COSMIC의 유효성을 입증하기 위해서 다양한 시각적 질의와 이미 질의를 이용한 실험을 수행하였다.

Iris Recognition using the Effective Preprocessing technique (효율적 전처리 기법을 이용한 홍채인식)

  • Park, Su-Young;Choi, Kwang-Mi;Jung, Choi-Yeoung
    • Annual Conference of KIPS
    • /
    • 2002.11a
    • /
    • pp.759-762
    • /
    • 2002
  • 생체 특징에 기초한 개인적인 및 인증 방법의 하나인 홍채의 패턴 인식에 있어서 전처리 기술은 사용자의 홍채 정보 손실로 인한 오인식을 최소로 하여야한다. 본 논문에서 전처리 기술 중 프리위트(Prewitt) 필터와 sobel 필터를 이용한 홍채의 인식률을 비교하고 전처리된 영상으로부터 추출된 특징값에 대해 저용량을 유지하면서 손실된 정보가 없고 실시간 처리가 요구되는 정보 보호를 위한 특징추출 방법 중 고차 국소 자동상관함수를 이용한 특징추출 방법을 제시하여 인식률을 향상시키는 방법을 제시하고자 한다.

  • PDF

Standard Industrial Classification in Short Sentence Based on Machine Learning Approach (기계학습 기반 단문에서의 문장 분류 방법을 이용한 한국표준산업분류)

  • Oh, Kyo-Joong;Choi, Ho-Jin;An, Hweongak
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.394-398
    • /
    • 2020
  • 산업/직업분류 자동코딩시스템은 고용조사 등을 함에 있어 사업체 정보, 업무, 직급, 부서명 등 사용자의 다양한 입력을 표준 산업/직업분류에 맞춰 코드 정보를 제공해주는 시스템이다. 입력 데이터로부터 비지도학습 기반의 색인어 추출 모델을 학습하고, 부분단어 임베딩이 적용된 색인어 임베딩 모델을 통해 입력 벡터를 추출 후, 출력 분류 코드를 인코딩하여 지도학습 모델에서 학습하는 방법을 적용하였다. 기존 시스템의 분류 결과 데이터를 통해 대, 중, 소, 세분류에서 높은 정확도의 모델을 구축할 수 있으며, 기계학습 기술의 적용이 가능한 시스템임을 알 수 있다.

  • PDF

An Automatic Extraction of English-Korean Bilingual Terms by Using Word-level Presumptive Alignment (단어 단위의 추정 정렬을 통한 영-한 대역어의 자동 추출)

  • Lee, Kong Joo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.2 no.6
    • /
    • pp.433-442
    • /
    • 2013
  • A set of bilingual terms is one of the most important factors in building language-related applications such as a machine translation system and a cross-lingual information system. In this paper, we introduce a new approach that automatically extracts candidates of English-Korean bilingual terms by using a bilingual parallel corpus and a basic English-Korean lexicon. This approach can be useful even though the size of the parallel corpus is small. A sentence alignment is achieved first for the document-level parallel corpus. We can align words between a pair of aligned sentences by referencing a basic bilingual lexicon. For unaligned words between a pair of aligned sentences, several assumptions are applied in order to align bilingual term candidates of two languages. A location of a sentence, a relation between words, and linguistic information between two languages are examples of the assumptions. An experimental result shows approximately 71.7% accuracy for the English-Korean bilingual term candidates which are automatically extracted from 1,000 bilingual parallel corpus.

Automatic Construction of Syntactic Relation in Lexical Network(U-WIN) (어휘망(U-WIN)의 구문관계 자동구축)

  • Im, Ji-Hui;Choe, Ho-Seop;Ock, Cheol-Young
    • Journal of KIISE:Software and Applications
    • /
    • v.35 no.10
    • /
    • pp.627-635
    • /
    • 2008
  • An extended form of lexical network is explored by presenting U-WIN, which applies lexical relations that include not only semantic relations but also conceptual relations, morphological relations and syntactic relations, in a way different with existing lexical networks that have been centered around linking structures with semantic relations. So, This study introduces the new methodology for constructing a syntactic relation automatically. First of all, we extract probable nouns which related to verb based on verb's sentence type. However we should decided the extracted noun's meaning because extracted noun has many meanings. So in this study, we propose that noun's meaning is decided by the example matching rule/syntactic pattern/semantic similarity, frequency information. In addition, syntactic pattern is expanded using nouns which have high frequency in corpora.

Image Mosaic using Multiresolution Wavelet Analysis (다해상도 웨이블렛 분석 기법을 이용한 영상 모자이크)

  • Yang, In-Tae;Oh, Myung-Jin;Lee, In-Yeub
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.12 no.2 s.29
    • /
    • pp.61-66
    • /
    • 2004
  • By the advent of the high-resolution Satellite imagery, there are increasing needs in image mosaicking technology which can be applied to various application fields such as GIS(Geographic Information system). To mosaic images, various methods such as image matching and histogram modification are needed. In this study, automated image mosaicking is performed using image matching method based on the multi-resolution wavelet analysis(MWA). Specifically, both area based and feature based matching method are embedded in the multi-resolution wavelet analysis to construct seam line.; seam points are extracted then polygon clipping method are applied to define overlapped area of two adjoining images. Before mosaicking, radiometric correction is proceeded by using histogram matching method. As a result, mosaicking area is automatically extracted by using polygon clipping method. Also, seamless image is acquired using multi-resolution wavelet analysis.

  • PDF

Automatic Construction of Syntactic Relation in U-WIN (U-WIN의 구문관계 자동구축 방법)

  • Im, Jihui;Kim, Dongmyoung;Choe, Hoseop;Yoon, Hwa-Mook;Ock, Cheolyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.84-90
    • /
    • 2007
  • 일반적인 어휘망이 의미 관계에 의한 연결 구조를 중심으로 연구 개발된 것과는 달리, U-WIN은 의미관계를 비롯하여 개념 관계, 형태 관계, 구문 관계 등과 같이 의미 관계의 범위를 확장한 어휘 관계를 적용하여 구축하고 있다. 본 연구에서는 U-WIN의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 용언의 용례에서 문형정보를 기준으로 구문관계를 형성할 수 있는 후보명사를 추출하였으며, 추출한 후보명사는 용언의 세분화된 의미별로 정확하고 다양하게 추출할 수 있었다. 그러나 U-WIN은 다의어의 뜻풀이 하나하나를 개별적인 어휘로 구분하여 구축하였으므로, 어휘 간의 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 하나의 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문패턴, 의미 유사도 등을 차례로 적용하여 후보명사의 의미를 분별하였으며, 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미 분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.

  • PDF

The Real-Time Height Measurement through a Geometry Information and 0bject Extraction (기하학 정보와 객체 추출을 통한 실시간 높이 측정)

  • Kim Jong Su;Kim Tae Yong;Choi Jong Soo
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.29 no.12C
    • /
    • pp.1652-1659
    • /
    • 2004
  • In this paper, we propose the algorithm that automatically measures the height of the object to move on the base plane by using the geometric information. To extract a moving object from real-time images creates the background image and each pixel is modeled by the three values. The extracted region is represented by cardboard model and calculates the coordinate center in the each part. The top and bottom point of an object are extracted by the calculated coordinate center and an iterative computation. The two points, top and bottom, are used for measuring the height. Given the vanishing line of the ground plane, the vertical vanishing point, and at least one reference height in the scene; then the height of any point from the ground may be computed by specifying the image of the point and the image of the vertical intersection with the ground plane at that point. Through a confidence valuation of the height to be measured, we confirmed similar actual height and result in the simulation experiment.