• 제목/요약/키워드: feature histogram

검색결과 377건 처리시간 0.024초

Deep Learning based Human Recognition using Integration of GAN and Spatial Domain Techniques

  • Sharath, S;Rangaraju, HG
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.127-136
    • /
    • 2021
  • Real-time human recognition is a challenging task, as the images are captured in an unconstrained environment with different poses, makeups, and styles. This limitation is addressed by generating several facial images with poses, makeup, and styles with a single reference image of a person using Generative Adversarial Networks (GAN). In this paper, we propose deep learning-based human recognition using integration of GAN and Spatial Domain Techniques. A novel concept of human recognition based on face depiction approach by generating several dissimilar face images from single reference face image using Domain Transfer Generative Adversarial Networks (DT-GAN) combined with feature extraction techniques such as Local Binary Pattern (LBP) and Histogram is deliberated. The Euclidean Distance (ED) is used in the matching section for comparison of features to test the performance of the method. A database of millions of people with a single reference face image per person, instead of multiple reference face images, is created and saved on the centralized server, which helps to reduce memory load on the centralized server. It is noticed that the recognition accuracy is 100% for smaller size datasets and a little less accuracy for larger size datasets and also, results are compared with present methods to show the superiority of proposed method.

블록가중치의 최적화를 통해 개선된 LBP기반의 표정인식 (An Improved LBP-based Facial Expression Recognition through Optimization of Block Weights)

  • 박성천;구자영
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.73-79
    • /
    • 2009
  • 본 논문에서는 Local Binary Pattern 히스토그램의 템플릿 매칭을 이용한 얼굴 표정 인식에서 인식률을 높이는 방법을 제안한다. 이 방법에서, 주어진 얼굴 영상은 작은 크기의 블록으로 분할되고 각 블록에서 구해진 LBP 히스토그램은 블록 특징으로 사용된다. 입력 영상에서의 블록 특징과 모델의 해당블록 특징 사이에서 블록 상이도가 계산된다. 주어진 영상과 모델 영상 사이의 영상 상이도는 블록 상이도의 가중 합으로 계산된다. 기존의 방법들에서는 직관에 따른 블록 가중치를 사용하는데 본 논문에서는 블록 가중치를 트레이닝 샘플들로부터 최적화를 통해서 구하는 방법을 제안하고 있다. 실험을 통해서 제안된 방법이 기존의 방법보다 우수함을 보인다.

차이값 히스토그램 기반 가역 워터마킹을 이용한 블록 단위 영상 인증 알고리즘 (Block-based Image Authentication Algorithm using Differential Histogram-based Reversible Watermarking)

  • 여동규;이해연
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.355-364
    • /
    • 2011
  • 위변조되지 않은 고신뢰성의 영상이 요구되는 서비스에서 무결성을 인증하기위하여 가역 워터마킹 기법이 유용하게 적용될 수 있다. 콘텐츠의 인증을 위한 기존의 연구들은 워터마크의 제거후에 원본 복원이 불가능한 것이 많다. 가역 워터마킹 기법은 디지털 콘텐츠에 지각적 투명성을 유지하며 워터마크를 삽입한 후, 이를 아무런 손상없이 원본 상태로 복원할 수 있는 메시지 은닉 수단으로서 높은 품질과 높은 삽입용량이 요구되는 분야에서 다양하게 이용되어질 수 있다. 본 논문에서는 차이값 히스토그램 기반의 가역 워터마킹을 이용하여 영상의 위변조된 영역을 탐지하는 블록단위 인증 알고리즘을 제안한다. 먼저, 영상의 각 블록에 대하여 DCT 계수에 기반하여 영상의 특징값을 추출하고, 사용자의 정보와 결합하여 영상 인증 코드를 생성한다. 생성된 인증코드는 가역 워터마킹을 통하여 콘텐츠 자체에 직접 삽입한다. 이와 같은 영상의 인증을 위해서는 추출된 인증코드와 새로 생성된 인증코드의 비교를 수행한다. 다양한 영상들에 대하여 비교 분석한 실험 결과에 따르면 제안한 알고리즘은 완전한 가역성과 함께 낮은 왜곡을 유지하면서도 97% 이상의 높은 인증률을 얻을 수 있었다.

증강현실을 위한 히스토그램 기반의 손 인식 시스템 (Histogram Based Hand Recognition System for Augmented Reality)

  • 고민수;유지상
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1564-1572
    • /
    • 2011
  • 본 논문에서는 증강현실을 위한 히스토그램 기반의 손 인식 기법을 제안한다. 손동작 인식은 사용자와 컴퓨터 사이의 친숙한 상호작용을 가능하게 한다. 하지만, 비젼 기반의 손동작 인식은 복잡한 손의 형태로 인한 관찰 방향 변화에 따른 입력 영상의 다양함으로 인식에 어려움이 따른다. 따라서 본 논문에서는 손의 형태적인 특징을 이용한 새로운 모델을 제안한다. 제안하는 기법에서 손 인식은 카메라로부터 획득한 영상에서 손 영역을 분리하는 부분과 인식하는 부분으로 구성된다. 카메라로부터 획득한 영상에서 배정을 제거하고 피부색 정보를 이용하여 손 영역을 분리한다. 다음으로 히스토그램을 이용하여 손의 특징점을 구하여 손의 형태를 계산한다. 마지막으로 판별된 손인식 정보를 이용하여 3차원 객체를 제어하는 증강현실 시스템을 구현하였다. 실험을 통해 제안한 기법의 구현 속도가 빠르고 인식률도 91.7%로 비교적 높음을 확인하였다.

회전에 강인한 고속 이진패턴을 이용한 실시간 교통 신호 표지판 인식 (Real-time Traffic Sign Recognition using Rotation-invariant Fast Binary Patterns)

  • 황민철;고병철;남재열
    • 방송공학회논문지
    • /
    • 제21권4호
    • /
    • pp.562-568
    • /
    • 2016
  • 본 논문에서는 다양한 교통 표지판 중에서 운전자의 안전운행에 밀접하게 관계가 있는 속도 표지판을 인식하는 연구에 초점을 맞추고 있다. HOG (histogram of gradient)와 LBP (local binary patterns) 가 객체 인식을 위한 대표적 특징이지만, 이러한 특징들은 패턴을 생성할 때 목표 객체의 회전을 고려하지 않음으로써 객체의 회전에 약한 특성을 가지고 있다. 따라서 본 논문에서는 회전에 강인한 이진 패턴을 생성하기 위해 FRIBP (fast rotation-invariant binary patterns)를 제안하고 있다. 본 논문에서 제안하는 FRIBP 알고리즘은 히스토그램에서 불필요한 레이어를 삭제하고 비교연산과 시프트 연산을 제거하여 빠르게 원하는 특징을 추출할 수 있도록 설계되었다. 제안된 FRIBP 알고리즘은 GTSRB (German Traffic Sign Recognition Benchmark) 데이터에 적용되어, 다른 비교 알고리즘과 유사한 성능을 보여주었다. 또한, 12,630개의 테스트 데이터에 대해 기존의 방법들보다 약 0.47초가 향상된 인식 속도를 보여주었다.

물체 분할 기법을 이용한 내용기반 영상 검색 (A Content-Based Image Retrieval using Object Segmentation Method)

  • 송석진;차봉현;김명호;남기곤;이상욱;주재흠
    • 융합신호처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.1-8
    • /
    • 2003
  • 현재 사회전반에 걸쳐 급격히 증가하고 있는 멀티미디어 정보를 효율적으로 관리, 활용할 수 있는 방법이 다양하게 연구되고 있다. 본 논문에서는 정지영상 검색을 위해 사용자가 질의(query)를 요구하면 질의 물체를 배경으로부터 분할한 후 유사물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상이 들어오면 우선 메디안 필터링 처리를 하여 잡음 제거한 후 캐니 에지 탐지법으로 물체의 에지를 구한다. 그리고 볼록 다각형 기법을 이용하여 배경으로부터 질의물체를 분할한다. 분할된 영상으로부터 컬러 히스토그램을 구한 후 데이터 베이스내의 영상과 히스토그램 인터섹션을 하여 유사치를 구한다 또한 공간적 그레이 분포와 질감특성을 추출하기 위해 분할된 영상을 그레이 영상으로도 변환시켜 웨블릿 변환한 후 밴디드 오토코릴로그램과 에너지를 구해 유사치를 구한다. 이렇게 구한 유사치을 더해 최종 유사영상을 검색하는데 물체 분할기법을 사용함으로써 배경에 강인할 뿐 아니라 보다 정확한 물체 검색이 가능하였다.

  • PDF

다해상도 웨이블렛 분석 기법을 이용한 영상 모자이크 (Image Mosaic using Multiresolution Wavelet Analysis)

  • 양인태;오명진;이인엽
    • 대한공간정보학회지
    • /
    • 제12권2호
    • /
    • pp.61-66
    • /
    • 2004
  • 최근 위성 탑재 센서의 종류와 영상의 공간해상도가 다양해지고 서로 다른 시기에 관측 수집된 영상자료를 모자이크하여 지형공간정보체계(GIS)와 같은 응용분야에서의 활용에 대한 필요성이 점차 커지고 있다. 영상 모자이크에는 영상정합, 분광정보 조정과 같은 다양한 기법들이 필요하다. 웨이블렛 변환 기반 영상정합 기법을 적용하여 영상 모자이크의 자동화에 대해 연구하고자 하였다. 본 논문에서는 폴리곤 클리핑 기법을 적용하여 두 영상에서 중복 영역을 추출하고자 중복영역에 대하여 형상 기반 정합과 영역 기반 정합을 동시에 적용하는 웨이블렛 변환 기법을 이용함으로써 자동으로 접합점을 추출하였다. 또한 영상 모자이크를 수행함에 있어서 두 영상의 분광 정보를 조정하기 위한 방사 보정기법은 히스토그램 정합 기법을 적용하여 연구 분석하였다. 본 연구에서 적용한 폴리곤 클리핑 기법 결과로 중복영역과 모자이킹 영역을 자동을 추출할 수 있었다. 그리고 다해상도 웨이블렛 분석 기법을 이용하여 특징점에 대해 영상정합을 수행하고 이를 이용하여 모자이킹 접합선을 추출한 결과 접합부분에서 불연속 부분 없이 모자이킹 영상을 생성할 수 있었다.

  • PDF

피치 히스토그램과 MFCC-VQ 동적 패턴을 사용한 음악 검색 (Music Identification Using Pitch Histogram and MFCC-VQ Dynamic Pattern)

  • 박철의;박만수;김성탁;김회린
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.178-185
    • /
    • 2005
  • 본 논문에서는 내용기반 음악 정보 검색 방법으로써 멜로디의 시간 변화 특성과 통계적 특성을 모두 이용할 수 있는 hybrid 방법에 대해 제안하였다. 실제 방송 환경에의 적용을 위해 드라마 OST의 좁은 검색 범위뿐만 아니라 가요 1,005곡의 넓은 검색 범위에서도 제안한 방법을 이용하여 실험하였다. 제안된 방법은 특징 벡터로써 pitch와 MFCC(Mel Frequency Cepstral Coefficient)를 사용하여 음의 특성을 나타내었으며 멜로디를 표현하기 위해 피치 히스토그램과 VQ (Vector Quantization) 코드화한 MFCC의 템포럴 시퀀스를 이용함으로써 음악 검색 방법에 멜로디의 시간 변화 특성과 통계적 특성을 함께 적용할 수 있었다. 또한 pitch 히스토그램과 MFCC-VQ 템포럴 방법을 모두 사용한 hybrid 방식에 적절한 패턴 매칭 방법을 제안함으로써 기존의 각 단일 방식을 이용한 성능 결과 (MFCC-VQ 템포럴)와 비교하여 볼 때 드라마 OST 검색 범위에서는 평균 $9.9\%$, 가요 1,005곡의 검색 범위에서는 $10.2\%$의 오류 감소율을 나타내었다.

웃음 치료 훈련을 위한 웃음 표정 인식 시스템 개발 (Development of a Recognition System of Smile Facial Expression for Smile Treatment Training)

  • 이옥걸;강선경;김영운;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.47-55
    • /
    • 2010
  • 본 논문은 실시간 카메라 영상으로부터 얼굴을 검출하고 얼굴 표정을 인식하여 웃음 치료훈련을 할 수 있는 시스템을 제안한다. 제안된 시스템은 카메라 영상으로부터 Haar-like 특징을 이용하여 얼굴 후보 영역을 검출한 다음, SVM분류기를 이용하여 얼굴 후보 영역이 얼굴 영상인지 아닌지를 검증한다. 그 다음에는 검출된 얼굴 영상에 대해, 조명의 영향을 최소화하기 위한 방법으로 히스토그램 매칭을 이용한 조명 정규화를 수행한다. 표정 인식 단계에서는 PCA를 사용하여 얼굴 특징 벡터를 획득한 후 다층퍼셉트론 인공신경망을 이용해 실시간으로 웃음표정을 인식하였다. 본 논문에서 개발된 시스템은 실시간으로 사용자의 웃음 표정을 인식하여 웃음 양을 화면에 표시해 줌으로써 사용자 스스로 웃음 훈련을 할 수 있게 해 준다. 실험 결과에 따르면, 본 논문에서 제안한 방법은 SVM 분류기를 통한 얼굴 후보 영역 검증과 히스토그램 매칭을 이용한 조명정규화를 이용하여 웃음 표정 인식률을 향상시켰다.

MPEG-7 기반 DCT영역에서의 에지히스토그램 고속 추출 기법 (Fast Extraction of Edge Histogram in DCT Domain based on MPEG-7)

  • 엄민영;최윤식;원치선;남재열
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.19-26
    • /
    • 2006
  • 오늘날 대부분의 멀티미디어 데이터는 압축된 형태로 저장되고 전송된다. MPEG-7 에지 히스토그램 기술자는 공간영역에서 특정정보를 추출하기 때문에 특정정보추출을 위해 필요로 되는 복호화과정과 공간영역에서의 필터링 과정은 특정추출시간 과 연산량을 증가시키는 원인이 된다. 영상 검색 효율을 높이기 위하여 본 논문에서는 DCT 영역에서 직접적으로 에지 히스토그램을 추출하는 기법을 제안한다. OCT 계수들 중 AC 계수로부터 얻을 수 있는 에지에 대한 정보를 이용하여 DCT 영역에서 직접적으로 에지의 방향과 강도를 구한다. 실험결과는 제안하는 기법을 통해 검색 효율과 연산량에서 모두 만족할만한 결과를 얻을 수 있음을 보여준다.