• Title/Summary/Keyword: 블록 이진화

Search Result 83, Processing Time 0.024 seconds

Head Orientation-based Gaze Tracking (얼굴의 움직임을 이용한 응시점 추적)

  • ;R.S. Ramakrishna
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.401-403
    • /
    • 1999
  • 본 논문에서 우리는 제약이 없는 배경화면에서 얼굴의 움직임을 이용한 응시점 추적을 위해 얼굴의 특징점(눈, 코, 그리고 입)들을 찾고 head orientation을 구하는 효?거이고 빠른 방법을 제안한다. 얼굴을 찾는 방법이 많이 연구 되어 오고 있으나 많은 부분이 효과적이지 못하거나 제한적인 사항을 필요로 한다. 본 논문에서 제안한 방법은 이진화된 이미지에 기초하고 완전 그래프 매칭을 이용한 유사성을 구하는 방법이다. 즉, 임의의 임계치 값에 의해 이진화된 이미지를 레이블링 한 후 각 쌍의 블록에 대한 유사성을 구한다. 이때 두 눈과 가장 유사성을 갖는 두 블록을 눈으로 선택한다. 눈을 찾은 후 입과 코를 찾아간다. 360$\times$240 이미지의 평균 처리 속도는 0.2초 이내이고 다음 탐색영역을 예상하여 탐색 영역을 줄일 경우 평균 처리속도는 0.15초 이내였다. 그리고 본 논문에서는 얼굴의 움직임을 구하기 위해 각 특징점들이 이루는 각을 기준으로 한 템플릿 매칭을 이용했다. 실험은 다양한 조명환경과 여러 사용자를 대상으로 이루어졌고 속도와 정확성면에서 좋은 결과를 보였다. 도한, 명안정보만을 사용하므로 흑백가메라에서도 사용가능하여 경제적 효과도 기대할 수 있다.

  • PDF

퍼지 추론과 개선된 퍼지 RBF 네트워크를 이용한 컨테이너 식별자 인식

  • 주이환;김재용;김광백
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2004.11a
    • /
    • pp.195-202
    • /
    • 2004
  • 일반적으로 운송 컨테이너의 식별자들은 크기나 위치가 정형화되어 있지 않고 외부 잡음으로 인하여 식별자의 형태가 변형될 수 있기 때문에 일정한 규칙으로 찾기는 힘들다. 본 논문에서는 이러한 특성을 고려하여 컨테이너 영상에 대해 Canny 마스크를 이용하여 에지를 검출하고, 검출된 에지 정보에서 영상획득 시 외부 광원에 의해 수직으로 길게 발생하는 잡음들을 퍼지추론 방법을 적용하여 제거한 후에 수직 블록과 수평 블록을 검출하여 컨테이너의 식별자 영역을 추출하고 이진화 한다. 이진화된 식별자 영역에 대해 검정색의 빈도수를 이용하여 흰바탕과 민바탕을 구분하고 윤곽선 추적 알고리즘을 적용하여 개별 식별자를 추출한다. 추출된 개별 식별자의 인식은 개선된 퍼지 RBF 네트워크를 제안하여 적용한다. 제안된 퍼지 RBF 네트워크는 퍼지 C-Means 알고리즘을 중간층으로 적용하고 중간층과 출력층 간의 학습에는 일반화된 델타 학습 방법과 Delta-bar-Delta 알고리즘을 적용하여 학습 성능을 개선한다. 실제 컨테이너 영상을 대상으로 실험한 결과, 기존의 식별자 추출 방법보다 제안된 식별자 추출 방법이 개선되었고 기존의 퍼지 RBF 네트워크 보다 제안된 퍼지 RBF 네트워크가 컨테이너 식별자의 학습 및 인식에 우수함을 확인하였다.

  • PDF

Skin detection method based on local luminance and illumination revision in adult images (지역적인 밝기 정보와 조명 보정에 기반한 유해 영상에서의 피부색 검출 방법)

  • Park, Min Su;Park, Ki Tae;Moon, Young Shik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.446-448
    • /
    • 2011
  • 본 논문에서는 조명 보정과 지역적인 밝기 정보를 이용한 유해 영상에서의 피부색 검출 방법을 제안한다. 첫번째, 조명의 영향을 줄이기 위하여 입력 영상을 히스토그램 평활화하여 명암 값의 분포가 한쪽으로 치우치거나 균일하지 못한 영상의 명암 값 분포를 균일화 시켜 영상을 향상될 수 있도록 한다. 그 다음, 평활화 시킨 영상을 25 개의 블록으로 분할한 후, 각 블록에서의 밝기 값에 대한 통해 평균과 왜도를 구한다. 구해진 값들을 영상의 임계값으로 설정하여 이진화 시킨다. 그리고, 평활화시킨 영상의 RGB 값을 Lab 컬러 공간으로 변환한다. 변환된 컬러 공간내의 조명 성분 값인 L(Luminance)값을 추출하여 이를 역변환 한다. 역변환한 L 값은 비정규 조명을 갖는 유해 영상의 조명에 민감한 영향을 제거하기 위하여 평활화 영상에 합한다. 마지막으로, 밝기 임계값을 통해서 얻어진 이진영상내의 객체 영역과 RGB 피부색 임계값을 통한 조명 보정된 평활화 영상내의 피부색 영역의 공통된 영역을 결과값으로 추출한다.

  • PDF

A Car License Plate Recognition Using Morphological Characteristic, Difference Operator and ART2 Algorithm (형태학적 특징 및 차 연산과 ART2 알고리즘을 이용한 차량 번호판 인식)

  • Kang, Moo-Jin;Kim, Jae-Kun;Kim, Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.10a
    • /
    • pp.431-435
    • /
    • 2008
  • 2006년 11월 이후 신 차량 번호판 등장 후, 신 차량 번호판과 구 차량 번호판이 혼합되어 있다. 이에 따라 속도위반, 신호위반 단속, 무인 주차관리 시스템, 범죄 및 도주 차량 검거, 고속도로 톨게이트에서 통행료 지불로 인한 교통 체증현상을 해소하기 위한 자동 요금 징수와 같은 다양한 경우에서 자동차 번호판의 특징에 맞는 인식 시스템이 요구되고 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 형태학적 특징 및 차 연산과 ART2 알고리즘을 이용한 차량 번호판 인식 방법을 제안한다. 무인 카메라에서 획득된 차량 번호판 영상에서 차 연산을 이용하여 에지를 추출한 후에 블록 이진화를 한다. 이진화 된 차량 영상에서 신 구 차량 번호판의 형태학적 특성을 8방향 윤곽선 추적 알고리즘에 적용하여 잡음 영역을 제거하고, 차량의 번호판 영역을 추출한다 추출된 번호판 영역에 대하여 평균 이진화와 최대 최소 이진화를 적용하여 번호판의 개별 영역에 대한 형태학적 특성을 고려하여 잡음을 제거하고, Labeling 알고리즘을 적용하여 개별 문자를 추출한 후에 결합한다. 이렇게 분류된 개별 문자 및 숫자 코드를 ART2 알고리즘에 적용하여 학습 및 인식을 한다. 제안된 차량 번호판 추출 및 인식 방법의 성능을 평가하기 위해 녹색 번호판과 흰색 번호판 이미지 각각 100장을 대상으로 실험한 결과, 제시 된 차량 번호판 추출 및 인식 방법이 실험을 통해서 효율적인 것을 확인하였다.

  • PDF

Intra Mode Coding using Candidate Mode Table in HEVC (HEVC에서 후보 모드 표를 이용한 화면내 모드 부호화)

  • Choi, Jung-Ah;Ho, Yo-Sung
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.37 no.3A
    • /
    • pp.157-162
    • /
    • 2012
  • In this paper, we propose a new intra mode coding method using the candidate mode table. In the conventional HEVC, if the predicted most probable mode (MPM) is not same with the current prediction mode, the current prediction mode is encoded using the fixed length code (FLC). However, since a large number of modes are used in HEVC, the codeword length of FLC gets longer. In this paper, we generate the candidate mode table from neighboring blocks and encode the obtained intra mode index using Golomb-Rice code instead of FLC, when the predicted MPM is not identical to the current mode. From the experiment, we verified that the proposed method reduces the BD-rate by 0.5% on average, compared to the HEVC intra mode coding method.

A New Car License Plate Recognition Using Morphological Characteristic and Fuzzy ART Algorithm (형태학적 특징과 퍼지 ART 알고리즘을 이용한 신 차량 번호판 인식)

  • Kang, Hyo-Joo;Kim, Mi-Jeong;Kang, Hye-Min;Park, Choong-Shik;Lee, Jong-Hee;Kim, Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.10a
    • /
    • pp.413-417
    • /
    • 2007
  • 2006년 11월 이후 신 차량 번호판 등장 후, 신 차량 번호판 차량이 꾸준히 증가하고 있다. 이에 따라 속도위반, 신호위반 단속, 무인 주차 관리 시스템, 범죄 및 도주 차량 검거, 고속도로 톨게이트에서 통행료 지불로 인한 교통 체증현상을 해소하기 위한 자동 요금 징수와 같은 다양한 경우에서 신 자동차 번호판의 특징에 맞는 인식 시스템이 요구되고 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 지능형 신 자동차 번호판 인식 방법을 제안한다. 무인 카메라에서 획득된 신 차량 영상을 그레이 레벨로 변환한 후에 블록 이진화한다. 블록 이진화된 차량 영상을 대상으로 차량의 형태학적 특징을 적용하여 잡음을 제거한 후, 번호판 영역을 추출한다. 추출된 번호판 영역에 대해 Grassfire 알고리즘을 적용하여 개별 코드를 추출한다. 차량 번호판을 인식하기 위하여 추출된 개별 코드를 퍼지 ART 알고리즘을 적용하여 학습 및 인식한다. 제안된 차량 번호판 추출 및 인식 방법의 성능을 평가하기 위해 100장의 차량 영상을 대상으로 실험한 결과, 제안된 차량 번호판 추출 및 인식 방법이 실험을 통해서 효율적인 것을 확인하였다.

  • PDF

Binarization of number plate Image with a shadow (그림자가 있는 차량 번호판의 이진화)

  • Seo, Byung-Hoon;Kim, Byeong-Man;Moon, Chang-Bae;Shin, Yoon-Sik
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.13 no.4
    • /
    • pp.1-13
    • /
    • 2008
  • In this paper, we propose a method to solve a problem in binarizing the rear number plate image captured by a camera on a moving vehicle. An image may be shadowed by the cavernous structure of the rear side of a moving vehicle and it makes us hard to get a high quality of binary image. Therefore, we first detect a shadow edge and then divide an image into the shadow part and non-shadow part by the edge. Finally, the binary image is obtained by binarizing each part and merging them In this paper, we do comparative work on a group of binarization methods including our method, the method suggested by Zheng, the method using block binarization, and the method using labeling. The result shows that our method achieves better performance than others in most cases.

  • PDF

Block Classification of Document Images by Block Attributes and Texture Features (블록의 속성과 질감특징을 이용한 문서영상의 블록분류)

  • Jang, Young-Nae;Kim, Joong-Soo;Lee, Cheol-Hee
    • Journal of Korea Multimedia Society
    • /
    • v.10 no.7
    • /
    • pp.856-868
    • /
    • 2007
  • We propose an effective method for block classification in a document image. The gray level document image is converted to the binary image for a block segmentation. This binary image would be smoothed to find the locations and sizes of each block. And especially during this smoothing, the inner block heights of each block are obtained. The gray level image is divided to several blocks by these location informations. The SGLDM(spatial gray level dependence matrices) are made using the each gray-level document block and the seven second-order statistical texture features are extracted from the (0,1) direction's SGLDM which include the document attributes. Document image blocks are classified to two groups, text and non-text group, by the inner block height of the block at the nearest neighbor rule. The seven texture features(that were extracted from the SGLDM) are used for the five detail categories of small font, large font, table, graphic and photo blocks. These document blocks are available not only for structure analysis of document recognition but also the various applied area.

  • PDF

Block-based rate control method in the bit-plane coding of the depth-map coding (깊이정보 맵의 비트평면 부호화에서 블록 단위 비트율 조절 방법)

  • Kim, Kyung-Yong;Park, Gwang-Hoon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2009.11a
    • /
    • pp.213-215
    • /
    • 2009
  • 본 논문에서는 비트평면 부호화를 이용한 적응적 깊이정보 맵 부호화에서 블록 단위 비트율 조절 방법을 제안한다. 기존 방법에서는 깊이정보 맵에 대한 비트율 조절을 위해 양자화 변수를 이용하여 분리된 비트평면의 이진 영상들 중 특정 비트평면의 이진 영상만 부호화하는 방법을 통해 비트율을 조절할 수 있었다. 본 논문에서는 비트율-왜곡 최적화 방법을 이용하여 블록 단위로 부호화할 비트평면의 이진영상을 결정하는 방법을 제안한다. 실험 결과 제안하는 방법이 기존 방법보다 BD-PSNR이 0.2 dB 향상되었고 BD-rate가 2.97% 감소되어 제안하는 방법의 우수함을 확인할 수 있었다.

  • PDF

Block Classification of Document Images Using the Spatial Gray Level Dependence Matrix (SGLDM을 이용한 문서영상의 블록 분류)

  • Kim Joong-Soo
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.10
    • /
    • pp.1347-1359
    • /
    • 2005
  • We propose an efficient block classification of the document images using the second-order statistical texture features computed from spatial gray level dependence matrix (SGLDM). We studied on the techniques that will improve the block speed of the segmentation and feature extraction speed and the accuracy of the detailed classification. In order to speedup the block segmentation, we binarize the gray level image and then segmented by applying smoothing method instead of using texture features of gray level images. We extracted seven texture features from the SGLDM of the gray image blocks and we applied these normalized features to the BP (backpropagation) neural network, and classified the segmented blocks into the six detailed block categories of small font, medium font, large font, graphic, table, and photo blocks. Unlike the conventional texture classification of the gray level image in aerial terrain photos, we improve the classification speed by a single application of the texture discrimination mask, the size of which Is the same as that of each block already segmented in obtaining the SGLDM.

  • PDF