• Title/Summary/Keyword: 영역인식

Search Result 4,302, Processing Time 0.031 seconds

A Study on Character Recognition of Container Image using Brightness Variation and Canny Edge (명암도 변화와 Canny 에지를 이용한 컨테이너 영상의 문자인식에 관한 연구)

  • 남미영;임은경;허남숙;김광백
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.111-115
    • /
    • 2001
  • 컨테이너 영상의 문자를 인식하는데 있어 정규화 되어 있지 않은 컨테이너 영상의 문자영역을 추출한다는 것은 어렵다. 색깔. 위치, 글자 크기 등이 정해져 있지 않기 때문에 일정한 규칙으로 찾기는 힘들다. 따라서 본 논문에서는 이러한 특성을 고려하여 형태학적인 특성이 아니라 명암도를 조사하여 문자가 분포할 가능성이 있는 후보 영역을 찾고 Canny 에지 추출 기법과 에지 추적 기법으로서 문자가 있는 영역을 추출한다. 추출된 컨테이너의 문자 영역에서 히스토그램 방법을 이용하여 개별 문자를 추출하고 ART 알고리즘을 이용하여 인식한다. 실험 결과에서는 여러 영상에 대해 인식율이 우수한 것을 보인다.

  • PDF

Inlier selection and Database Redundancy Reducing Method in Urban Environment (도시 영상에서의 Inlier 선택과 Database Redundancy 감소 기법)

  • Ahn, Ha-eun;Yoo, Jisang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.29-32
    • /
    • 2016
  • 특징점 기반 건물인식 시스템에서는 강건한 특징점을 추출하는 것이 인식률 향상에 바로 직결되는 중요한 요소이다. 영상에서 특징점들이 너무 많이 추출되는 경우 인식이나 학습단계에서의 알고리즘 수행 시간을 증가시키는 원인이 된다. 또환 중요하지 않은 특징점(배경이나 가려짐 영역, 기타 객체에서 추출된 특징점)이나 조명 변화에 민감한 영역에서 임의로(arbitrarily) 추출된 특징점은 인식률을 저하시키는 문제를 발생시킨다. 특히 도시환경에서 촬영된 영상의 특징점을 추출할 때 이러한 문제 현상들이 빈번하게 발생한다. 본 논문에서는 이러한 문제를 해결하고자 multi-view 영상에서 건물의 homography를 기반으로 정확히 정합된 특징점인 inlier만을 선택하는 알고리즘을 제안한다. Inlier로 분류된 특징점들은 건물 인식 시스템을 구성하기 위해 사용되고 조명 변화에 민감한 영역에서 임의로 추출된 특징점들은 영역 기반 특징을 추출하여 건물 인식 시스템의 인식률을 높인다. 또한 이를 이용하여 인식하고자 하는 건물과의 상관관계가 적은 잉여 영상들을 DB에서 제거하는 방법도 제안한다. 실험을 통하여 제안하는 기법의 우수성을 보였다.

  • PDF

Region of Interest Extraction and Bilinear Interpolation Application for Preprocessing of Lipreading Systems (입 모양 인식 시스템 전처리를 위한 관심 영역 추출과 이중 선형 보간법 적용)

  • Jae Hyeok Han;Yong Ki Kim;Mi Hye Kim
    • The Transactions of the Korea Information Processing Society
    • /
    • v.13 no.4
    • /
    • pp.189-198
    • /
    • 2024
  • Lipreading is one of the important parts of speech recognition, and several studies have been conducted to improve the performance of lipreading in lipreading systems for speech recognition. Recent studies have used method to modify the model architecture of lipreading system to improve recognition performance. Unlike previous research that improve recognition performance by modifying model architecture, we aim to improve recognition performance without any change in model architecture. In order to improve the recognition performance without modifying the model architecture, we refer to the cues used in human lipreading and set other regions such as chin and cheeks as regions of interest along with the lip region, which is the existing region of interest of lipreading systems, and compare the recognition rate of each region of interest to propose the highest performing region of interest In addition, assuming that the difference in normalization results caused by the difference in interpolation method during the process of normalizing the size of the region of interest affects the recognition performance, we interpolate the same region of interest using nearest neighbor interpolation, bilinear interpolation, and bicubic interpolation, and compare the recognition rate of each interpolation method to propose the best performing interpolation method. Each region of interest was detected by training an object detection neural network, and dynamic time warping templates were generated by normalizing each region of interest, extracting and combining features, and mapping the dimensionality reduction of the combined features into a low-dimensional space. The recognition rate was evaluated by comparing the distance between the generated dynamic time warping templates and the data mapped to the low-dimensional space. In the comparison of regions of interest, the result of the region of interest containing only the lip region showed an average recognition rate of 97.36%, which is 3.44% higher than the average recognition rate of 93.92% in the previous study, and in the comparison of interpolation methods, the bilinear interpolation method performed 97.36%, which is 14.65% higher than the nearest neighbor interpolation method and 5.55% higher than the bicubic interpolation method. The code used in this study can be found a https://github.com/haraisi2/Lipreading-Systems.

Recognition of a New Car License Plates using (HSI 정보와 신경망을 이용한 신 차량 번호판의 인식)

  • Lee, Dong-Min;Han, Ah-Reum;Yoon, Kyeong-Ho;Park, Choong-Shik;Kim, Kwang-Beak
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.2
    • /
    • pp.370-376
    • /
    • 2005
  • 본 논문에서는 HSI 정보와 신경망의 비지도 학습 방법인 ART2 알고리즘을 이용하여 신 차량 번호판을 인식하는 방법을 제안한다. 제안된 방법은 차량의 영상에서 번호판 영역을 추출하는 부분과 추출된 번호판 영역의 문자를 인식하는 부분으로 구성된다. 본 논문에서는 차량 번호판 영역을 추출하기 위해 HSI 컬러 모형의 Hue 정보를 이용하여 차량 번호판 영역을 추출하고 개선된 퍼지 이진화 방법을 적용하여 추출된 차량 번호판 영역으로부터 문자를 포함한 특징 영역을 이치화 한 후에 4방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한다. 추출된 개별 코드를 인식하기 위해 잡음과 훼손에 비교적 강한 ART2 알고리즘을 적용한다. 제안된 방법의 차량 번호판 추출 및 인식 성능을 평가하기 위하여 실제 비영업용 차량 번호판에 적용한 결과, 기존의 차량 번호판의 추출 방법보다 번호판 영역의 추출률이 개선되었다. 또한 ART2 알고리즘을 적용하여 신 차량 번호판을 인식하는 것이 효율적임을 확인하였다.

  • PDF

Design & Implementation of Real-Time Lipreading System using PC Camera (PC카메라를 이용한 실시간 립리딩 시스템 설계 및 구현)

  • 이은숙;이지근;이상설;정성태
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11a
    • /
    • pp.310-313
    • /
    • 2003
  • 최근 들어 립리딩은 멀티모달 인터페이스 기술의 응용분야에서 많은 관심을 모으고 있다. 동적영상을 이용한 립리딩 시스템에서 해결해야 할 주된 문제점은 상황 변화에 독립적으로 얼굴 영역과 입술 영역을 추출하고 오프라인이 아닌 실시간으로 입력된 입술 영상의 인식을 처리하여 립리딩의 사용도를 높이는 것이다. 본 논문에서는 사용자가 쉽게 사용할 수 있는 PC카메라를 사용하여 영상을 입력받아 학습과 인식을 실시간으로 처리하는 립리딩 시스템을 구현하였다. 본 논문에서는 움직임이 있는 화자의 얼굴영역과 입술영역을 컬러, 조명등의 변화에 독립적으로 추출하기 위해 HSI모델을 이용하였다. 입력 영상에서 일정한 크기의 영역에 대한 색도 히스토그램 모델을 만들어 색도 영상에 적용함으로써 얼굴영역의 확률 분포를 구하였고, Mean-Shift Algorithm을 이용하여 얼굴영역의 검출과 추적을 하였다. 특징 점 추출에는 이미지 기반 방법인 PCA 기법을 이용하였고, HMM 기반 패턴 인식을 사용하여 실시간으로 실험영상데이터에 대한 학습과 인식을 수행할 수 있었다.

  • PDF

Face Tracking and Recognition Algorithm Based On Object Segmentation and PCA (객체 분할 및 주성분 분석 기반의 얼굴 추적 인식 알고리즘)

  • 성민영;김대현;이응주
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.435-440
    • /
    • 2003
  • 본 논문에서는 실시간 출입통제시스템에 적용이 가긍한 복잡한 배경에서의 다중 얼굴 영역 검출과 추적을 통한 얼굴 인식 알고리즘을 제안하였다. 제안된 알고리즘에서는 배경영상과 입력된 연속적인 프레임간의 차영상을 적용함으로써 물체의 움직임을 감지한 후. IISI컬러 좌표모델을 이용하여 얼굴의 1차 후보 영역을 검출하고, 잡음제거를 위해 모폴로지 연산을 수행하였다 또한 Line Projection을 이용한 객체 분할법(Object Segmentation)으로 객체를 분할함으로써 다중 얼굴 영역을 추출하였다. 또한 추출된 얼굴영역에서 눈 영역 검출을 통해 각각의 얼굴 영역들을 검증하였으며 검증된 얼굴들의 최외각 4개의 좌표를 이용하여 얼굴 추적율을 높였다. 마지막으로 얼굴 인식은 추출된 얼굴 영역으로부터 주성분 분석(PCA : Principle Component Analysis)방법을 이용함으로써 97~98%의 높은 인식율을 보였다.

  • PDF

Pictogram Sign Recognition in Subway using HOG and SVM (HOG와 SVM을 사용한 지하철 실내 픽토그램 인식)

  • Kim, Sul-Ho;Choi, Hyung-Il;Kim, Gye-Young
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.01a
    • /
    • pp.205-208
    • /
    • 2012
  • 지하철 실내의 표지판은 다양한 정보들을 포함하고 있다. 그 중에서 시설물의 형상을 단순화하여 나타낸 픽토그램 사인은 국제적으로 표준화 되어 있어 검출이 용이하다고 볼 수 있다. 일반적으로 객체를 인식하는 방법은 후보영역을 설정하는 검출단계와 후보영역을 인식하는 단계로 나뉘어 진다. 본 논문에서는 후보영역 검출단계에서 단일 값을 가지는 이진화로 픽토그램 영역이 분리가 잘 안되는 문제점을 해결하기 위하여 적응적 이진화를 사용하였고 인식을 위한 특징추출로 HOG서술자를 사용하고 학습과 인식에는 SVM을 사용하였다. 실험 결과를 통하여 HOG서술자로 픽토그램 사인을 인식하는 것이 적합한 것인지 확인한다.

  • PDF

Face Recognition base on Image Normalization by Template Matching (형판정합을 이용한 영상 정규화에 기반한 얼굴 인식 알고리즘)

  • 신현금;최영규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.331-333
    • /
    • 2003
  • 본 논문에서는 새로운 얼굴 인식 방법을 제안한다. 제안된 방법은 입력 영상에서 눈이라고 생각되는 영역을 형판 정합방법을 이용하여 먼저 추출하고. 양 눈의 위치 정보를 사용하여 얼굴 영역의 크기와 회전정도를 보정하여 정규화된 얼굴영상을 만들며, 결국 PCA 방법을 사용하여 인식하게 된다. 이렇게 함으로써 PCA가 안정된 영상이 입력되면 좋은 인식률을 보이지만 전반적인 조명의 변화에 잘 대응하지 못하고, 복잡한 배경인 경우 얼굴영역의 위치 변화에 민감하며, 많이 기울어진 영상에 취약하다는 단점을 형판 정합을 통한 전 처리 과정을 통해 보완할 수 있게 된다. 실험 결과 제안된 방법이 PCA의 인식 성능을 크게 향상시킬 수 있음을 알 수 있었다.

  • PDF

Handprinted Korean Characters Recognition System bu Using New jaso Decompostion Method (새로은 자소분리 기법을 이용한 필기체 한글인식 시스템)

  • 박희주;김진호;오광식
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.5 no.3
    • /
    • pp.101-110
    • /
    • 1995
  • 본 논문에서는 새로은 자소분리 기법을 이용한 필기체 한글인식 시스템을 제안하였다. 새로운 자소분리 기법에는 국소영역 투영기법과 국소영역 Blob Coloring 기법이 포함되어 있다. 한극 각 자소의 특징들을 이용하여 Backpropagaton 알고리듬으로 학습시켰고 인식과정에서 관심영역 탐색기법이 이용되었다. 4명의 필기자가 작성한 1600자의 한글을 학습시키고 학습되지 않은 밝기 영상의 문서에 대한 인식을 시도한 결과 95%의 인식률을 얻었다.

  • PDF

Human Friendly Documentation System of the Printed Hangul Images (인간에게 친밀한 인쇄체 한글 영상의 문서화 시스템)

  • 곽주원;강순대;백승복;박상욱;박정현;박홍선;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.12a
    • /
    • pp.361-364
    • /
    • 2002
  • 본 논문에서는 일반적인 문서를 CCD 카메라로 입력 받은 후, 사용자가 원하는 영역을 손가락으로 선택하면, 손 인식 알고리즘을 적용하여 사용자의 손가락 움직임을 검출하고, 손가락으로 선택되어진 영역을 인식한 후, 선택되어진 영역으로 카메라를 이동시켜 획득된 영상을 문자 인식 가능한 크기로 확대/축소하며, 확대된 영상에 문자인식 알고리즘을 적용하여 문서로 변환하는 시스템을 구현하였다 최종적으로 사용자가 이 시스템의 존재를 인지하지 못할 만큼 자연스럽게 사용할 수 있는 시스템을 구현하고자 하였다.