• 제목/요약/키워드: feature descriptor

검색결과 206건 처리시간 0.025초

컬러 정보를 포함하는 보완적 특징점 기반 기술자를 활용한 객체인식 (Object Recognition utilizing Complementary Feature-point-based descriptor containing color information)

  • 장영균;김주환;문승건;남택진;권동수;우운택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.341-343
    • /
    • 2012
  • 본 논문에서는 기존의 특징점 기반 객체 인식 방법의 확장으로 보완적 특징점 기반의 컬러 정보를 포함하는 기술자를 활용하는 객체 인식 방법을 제안한다. 제안하는 방법은 무늬가 적은 객체에서도 에지의 위치를 샘플링함으로써 보완적 특징점을 생성해 낸다. 그리고 검출된 보완적 특징점으로부터 얻어지는 그레이 값 변화도방향 정보와 컬러 정보를 가지고 있는 기술자를 생성한다. 그리고 생성된 기술자를 객체 단위로 묶어 낼 수 있도록 하는 코드북(Codebook)을 학습함으로써 각 객체를 구분해 낼 수 있는 강건한 히스토그램를 생성한다. 생성된 코드북을 활용함으로써 제안하는 방법은 객체의 크기 및 환경 변화, 3차원 회전의 경우에도 기존의 방법보다 강건하게 인식한다. 실험 결과 제안하는 방법은 75.8% 인식률을 보이는 것을 확인하였다. 이 방법은 증강현실 응용에 정보 제시를 위해 가장 먼저 이루어지는 핵심 기술로써 활용될 수 있다.

Person-Independent Facial Expression Recognition with Histograms of Prominent Edge Directions

  • Makhmudkhujaev, Farkhod;Iqbal, Md Tauhid Bin;Arefin, Md Rifat;Ryu, Byungyong;Chae, Oksam
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권12호
    • /
    • pp.6000-6017
    • /
    • 2018
  • This paper presents a new descriptor, named Histograms of Prominent Edge Directions (HPED), for the recognition of facial expressions in a person-independent environment. In this paper, we raise the issue of sampling error in generating the code-histogram from spatial regions of the face image, as observed in the existing descriptors. HPED describes facial appearance changes based on the statistical distribution of the top two prominent edge directions (i.e., primary and secondary direction) captured over small spatial regions of the face. Compared to existing descriptors, HPED uses a smaller number of code-bins to describe the spatial regions, which helps avoid sampling error despite having fewer samples while preserving the valuable spatial information. In contrast to the existing Histogram of Oriented Gradients (HOG) that uses the histogram of the primary edge direction (i.e., gradient orientation) only, we additionally consider the histogram of the secondary edge direction, which provides more meaningful shape information related to the local texture. Experiments on popular facial expression datasets demonstrate the superior performance of the proposed HPED against existing descriptors in a person-independent environment.

내용 기반 영상 검색을 위한 에지 기반의 공간 기술자 (Edge-based spatial descriptor for content-based Image retrieval)

  • 김낙우;김태용;최종수
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.1-10
    • /
    • 2005
  • 오늘날 급격한 멀티미디어 정보의 증가에 따라 영상에서의 시각적 특성을 이용하여 멀티미디어 데이터를 검색하는 내용 기반 영상 검색 기법에 대한 관심이 크게 늘어나고 있다. 본 논문에서는 효과적인 영상 검색을 위한 새로운 접근으로서 edge correlogram과 color coherence vector를 이용한 에지 기반의 공간 기술자를 제안한다. 우선 color vector angle기법을 이용하여 주어진 영상을 고주파 성분과 저주파 성분의 영상으로 나눈다. 저주파 성분의 영상에서는 color coherence vector를 이용하여 평탄 화소의 공간적인 색상 분포를 추출함으로써 이를 평탄 영역에서의 특징 정보로서 활용한다. 반면, 고주파 성분의 영상에서는 edge correlogram으로부터 에지 화소들 간의 분포를 추출하여 이를 에지 영역에서의 특징 정보로 이용한다. 제안된 방법은 색상 간의 지엽적인 특성과 전체적인 특성을 모두 가지고 있기 때문에, 영상 간의 비교에 있어서 영상의 모양과 크기의 급격한 변화로 인한 오검출 등에 매우 강건하다. 또한, 영상에서의 구조적인 특징을 이용함으로써 복잡한 영상에 대해서도 간단하고 유연한 특징을 제공한다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 알고리즘이 최근의 여러 히스토그램 정밀화 기법에 비하여 더 효과적임을 보여준다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용하였다.

형태와 텍스쳐 특징을 조합한 나뭇잎 분류 시스템의 성능 평가 (Performance Evaluations for Leaf Classification Using Combined Features of Shape and Texture)

  • 김선종;김동필
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.1-12
    • /
    • 2012
  • 길 옆이나 공원 또는 조경시설에는 많은 나무들을 포함하고 있다. 비록 많은 나무들이 쉽게 우리 주변에서 보이지만, 일반인들이 그 나무의 이름, 종류 및 정보들을 얻기가 힘든 경우도 있다. 나무의 이름이나 정보를 얻기 위하여 인터넷이나 서적을 이용하여 찾아 분류하여야 한다. 나무의 구성 요소는 잎, 꽃, 수피 등이 있는데, 일반적으로 나무의 잎을 이용하여 분류할 수 있다. 이는 잎이 형태, 잎맥 등의 정보를 포함하고 있기 때문이다. 잎의 형태는 나무의 종류를 결정하는데 중요한 역할을 하며, 또한 잎맥을 포함한 텍스쳐도 나무의 종류를 분류하는데 유용하게 사용된다. 본 논문에서는 형태와 텍스쳐를 조합한 특징들을 이용한 잎 분류 시스템에 대한 성능을 평가하였다. 형태 특징으로는 푸리에 기술자를 이용하였고, 텍스쳐 특징으로는 GLCM 또는 웨이브릿 기술자, 그리고 그들의 조합을 사용하였다. 그리고 사용된 데이터는 인터넷에서 용이하게 구할 수 있고, 분류 성능평가에 사용되는 Flavia 잎 데이터 셋을 사용하였다. 형태와 텍스쳐를 기반으로 하는 다양한 조합을 가진 분류 시스템의 성능을 인식률과 PR(precision-recall) 지수로 평가하고, 성능을 비교하였다. 성능평가 결과, 형태와 텍스쳐를 조합한 특징들을 갖는 시스템의 성능이 조합하지 않은 시스템의 성능보다 나아짐을 알 수 있었다.

Local Prominent Directional Pattern을 이용한 얼굴 사진과 스케치 영상 성별인식 방법 (Local Prominent Directional Pattern for Gender Recognition of Facial Photographs and Sketches)

  • ;채옥삼
    • 융합보안논문지
    • /
    • 제19권2호
    • /
    • pp.91-104
    • /
    • 2019
  • 본 논문에서는 성별 인식을 위해 얼굴 영상을 효과적으로 기술하는 새로운 지역 패턴 방법 Local Prominent Directional Pattern (LPDP)를 제안한다. 제안된 LPDP 방법은 성별 인식에 중요한 얼굴 모양을 명확하게 구분하기 위해 주변 패턴이 누적된 히스토그램을 통계적으로 분석하고 패턴 변화가 크게 발생하는 픽셀을 부호화 한다. 통계적인 정보를 사용하는 얼굴 모양 구분에 중요한 뚜렷한 에지 방향 패턴 영역을 구분하는 중요한 정보를 제공 할 수 있다. 이는 뚜렷한 에지 방향 패턴이 나타나는 영역의 주변도 유사한 에지 방향 패턴이 나타내기 때문에 통계적으로 특정 방향이 히스토그램에 많이 누적될 수 있기 때문이다. 또한 통계적인 방법은 주변 영역의 정보를 많이 수용하기 때문에 잡음으로 발생하는 에지 방향 변화 오류에 강력한 장점이 있다. 제안된 방법은 기존 방법들 보다 더 강력한 성별인식에 중요한 얼굴 모양 구분 능력을 보여주면서 국소적으로 발생하는 잡음에 견고함을 보여준다. 우리는 제안된 방법의 성능을 평가하기 위해 밝기, 표정, 연령, 머리 포즈가 변화하는 성별 인식 데이터 셋에 다양한 실험을 실험 했고 기존 방법 보다 제안된 방법의 성능이 우수함을 입증했다.

딥러닝과 객체 특징점을 활용한 항만 보안시스템 설계 (Design of Port Security System Using Deep Learning and Object Features)

  • 왕태수;김민영;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.50-53
    • /
    • 2022
  • 최근 위조 외국 선박이 국내항을 여러번 입출항한 경우가 있었다. 선박에는 국제해사기구(IMO)가 선박을 식별하기 위해 부여한 선박 고유 일련번호가 있으며 2004년 이후 건조된 모든 선박에 IMO 표시를 의무적으로 해야 한다. 대표적인 물류 플랫폼인 공항과 항만의 경우 보안체계가 필수적이지만 항만에서의 보안체계를 세우는 것은 어렵고 사각지대가 많아 보안체계의 미흡으로 인한 보안문제가 발생할 수 있다. 본 논문에서는 딥러닝 객체인식 및 OpenCV를 이용하여 항만 보안시스템을 설계한다. 보안시스템 프로세스는 선박 입항시 객체 인식 후, 선박의 IMO번호를 추출하여 입항 기록이 있는 선박의 경우 특징점 매칭을 통해 동일한 선박인지 판단하고, 최초 입항 선박의 경우 입출항 DB에 선박 이미지 및 IMO번호를 저장한다. 본 논문의 시스템을 통해 항만보안시스템을 활용하여 입항 관리 인력 단축으로 인한 효율성 증가와 미허가 입항으로 발생하는 부대 비용 절감을 통한 항만 물류 업무 효율성 및 체계 개선과 보안시스템 도입을 통해 항만 보안을 강화할 수 있다.

  • PDF

병렬 분산 처리를 이용한 영상 기반 실내 위치인식 시스템의 프레임워크 구현 (Framework Implementation of Image-Based Indoor Localization System Using Parallel Distributed Computing)

  • 권범;전동현;김종유;김정환;김도영;송혜원;이상훈
    • 한국통신학회논문지
    • /
    • 제41권11호
    • /
    • pp.1490-1501
    • /
    • 2016
  • 본 논문에서는 인메모리(In-memory) 병렬 분산 처리 시스템 Apache Spark(이하 Spark)를 활용하여 사용자에게 실시간 측위 정보를 제공할 수 있는 영상 기반 실내 위치인식 시스템을 제안한다. 제안하는 시스템에서는 사용자에게 실시간 측위 정보를 제공하기 위해서, Spark를 이용한 영상 특징점 추출 알고리즘의 병렬 분산화를 통해 알고리즘 연산 시간을 단축시킨다. 하지만 기존의 Spark 플랫폼에서는 영상 처리를 위한 인터페이스가 존재하지 않아, 영상 처리와 관련된 연산을 수행하는 것이 불가능하였다. 이에 본 논문에서는 Spark 영상 입출력 인터페이스를 구현하여 측위 연산을 위한 영상 처리를 Spark에서 수행 가능하게 하였다. 또한 무손실 압축(lossless compression)기법을 이용하여 특징점 기술자(descriptor)를 압축된 형태로 데이터베이스에 저장하여, 대용량의 실내 지도 데이터를 효율적으로 저장 및 관리하는 방법을 소개한다. 측위 실험은 실제 실내 환경에서 수행하였으며, 싱글 코어(Single-core) 시스템과의 성능 비교를 통해 제안하는 시스템이 최대 약 3.6배 단축된 시간으로 사용자에게 측위 정보를 제공 할 수 있다는 것을 입증하였다.

지능형 자동차를 위한 조명 변화에 강인한 도로표지판 검출 및 인식 (An Illumination Invariant Traffic Sign Recognition in the Driving Environment for Intelligence Vehicles)

  • 이태우;임광용;배건태;변혜란;최영우
    • 정보과학회 논문지
    • /
    • 제42권2호
    • /
    • pp.203-212
    • /
    • 2015
  • 본 논문은 도로주행 영상에서 도로표지판을 인식하는 방법을 제안한다. 지능형 차량에서 얻어지는 도로표지판 영상은 일반적인 사물 영상과는 다른 두 가지 특징이 있다. 첫째는 대상이 되는 사물들은 종류가 제한적이고 형태가 단순한 도형인 경우가 대부분이다. 둘째는 일반적인 도로주행 영상은 다양한 조명 환경과 날씨 상태로 인해서 선명한 영상을 취득하기 어려운 점이다. 본 논문에서는 조명 변화가 심한 도로주행 영상에 대해서 효과적으로 특징을 추출하기 위해서 Modified Census Transform(MCT)을 개선한 특징추출 방법을 제안한다. 추출된 특징들은 히스토그램으로 쌓여지고 영상 전반에 걸쳐 아주 고차원의 기술자(Descriptor)로 변환되며, 변환된 수많은 기술자들은 가우시안 혼합 모델(Gaussian Mixture Model)을 활용한 Fisher-vector 방법에 의해서 저차원으로 변형하여 특징으로 사용한다. 본 논문에서 제안하는 방법은 일반적인 표지판 인식 방법에 비해서 조명변화에 강한 검출 결과를 보여주었으며, 실시간 검출 및 인식도 가능하였다.

일반 CCTV 기반 차량 번호판 인식 시스템 (License Plate Recognition System based on Normal CCTV)

  • 장지웅;박구만
    • 전자공학회논문지
    • /
    • 제54권8호
    • /
    • pp.89-96
    • /
    • 2017
  • 본 논문에서는 일반 도로상에 설치된 CCTV 영상으로부터 차량 검출과 번호판을 인식하는 시스템을 제안하였다. 본 시스템의 환경은 일반 도로 환경에서 영상을 취득하기 때문에 기존의 차량 진출입 시스템에 적용되는 안정적인 조건이 주어지지 않으며 입력 영상이 왜곡되고 해상도가 불규칙적이다. 동시에 입력 영상의 시야각이 넓어 연산량이 높고 번호판의 인식 정확도가 떨어지기 쉽다. 본 논문에서는 별도의 입력 제어 장치 없이 차량을 검출하고, 번호판 검출 및 인식이 가능한 향상된 방법을 제안하였다. HOG 특징 기술자를 기반으로 차량 및 번호판을 검출하고, k-NN 알고리즘을 사용하여 번호판 내부 문자의 인식을 수행하였다. CCTV에서 45m 이상 떨어진 장소의 도로를 실험 환경으로 설정하고, 육안으로 번호판을 식별할 수 있는 진입 차량에 대한 실험을 진행하였으며 실험을 통하여 제안 방식의 우수한 결과를 확인하였다.

MPEG-7 기반 DCT영역에서의 에지히스토그램 고속 추출 기법 (Fast Extraction of Edge Histogram in DCT Domain based on MPEG-7)

  • 엄민영;최윤식;원치선;남재열
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.19-26
    • /
    • 2006
  • 오늘날 대부분의 멀티미디어 데이터는 압축된 형태로 저장되고 전송된다. MPEG-7 에지 히스토그램 기술자는 공간영역에서 특정정보를 추출하기 때문에 특정정보추출을 위해 필요로 되는 복호화과정과 공간영역에서의 필터링 과정은 특정추출시간 과 연산량을 증가시키는 원인이 된다. 영상 검색 효율을 높이기 위하여 본 논문에서는 DCT 영역에서 직접적으로 에지 히스토그램을 추출하는 기법을 제안한다. OCT 계수들 중 AC 계수로부터 얻을 수 있는 에지에 대한 정보를 이용하여 DCT 영역에서 직접적으로 에지의 방향과 강도를 구한다. 실험결과는 제안하는 기법을 통해 검색 효율과 연산량에서 모두 만족할만한 결과를 얻을 수 있음을 보여준다.