• 제목/요약/키워드: Robust tracking performance

검색결과 439건 처리시간 0.02초

수화 패턴 인식을 위한 2단계 신경망 모델 (Two-Stage Neural Networks for Sign Language Pattern Recognition)

  • 김호준
    • 한국지능시스템학회논문지
    • /
    • 제22권3호
    • /
    • pp.319-327
    • /
    • 2012
  • 본 논문에서는 착용식 추적장치나 표식 등의 보조 도구를 사용하지 않는 환경의 동영상 데이터로부터 수화 패턴을 인식하는 방법론에 관하여 고찰한다. 시스템 설계 및 구현에 관한 주제로서 특징점의 추출기법, 특징데이터의 표현기법 및 패턴 분류기법에 관한 방법론을 제시하고 그 유용성을 고찰한다. 일련의 동영상으로 표현되는 수화패턴에 대하여 특징점의 공간적 위치에 대한 변이 뿐만 아니라 시간차원의 변화를 고려한 특징데이터의 표현방법을 제시하며, 방대한 데이터에 의한 분류기의 크기 문제와 계산량의 문제를 개선하기 위하여 효과적으로 특징수를 줄일 수 있는 특징추출 방법을 소개한다. 패턴 분류과정에서 점진적 학습(incremental learning)이 가능한 신경망 모델을 제시하고 그 동작특성 및 학습효과를 분석한다. 또한 학습된 분류모델로부터 특징과 패턴 클래스 간의 상대적 연관성 척도를 정의하고, 이로부터 효과적인 특징을 선별하여 성능저하 없이 분류기의 규모를 최적화 할 수 있음을 보인다. 제안된 내용에 대하여 여섯 가지 수화패턴을 대상으로 적용한 실험을 통하여 유용성을 평가한다.

계통연계형 태양광 발전시스템의 태양전지 전류 추정을 위한 슬라이딩 모드 관측기 설계 (Design of Sliding Mode Observer for Solar Array Current Estimation in the Grid-Connected Photovoltaic System)

  • 김일송;백인철;윤명중
    • 전력전자학회논문지
    • /
    • 제10권4호
    • /
    • pp.411-419
    • /
    • 2005
  • 본 논문에서는 계통연계형 태양광 발전시스템의 태양전지 전류 추정을 위한 슬라이딩 모드 관측기 설계 방법이 제시되었다. 태양전지 전류 추정 정보는 슬라이딩 모드 관측기에서 얻어지고, 기준전압을 갱신하기 위한 최대전력 추적기의 입력정보로 사용되어 진다. 계통연계형 인버터의 입력 커패시턴스 값은 규정치의 50[$\%$] 정도까지 바뀔 수 있으며, 선형 관측기는 파라미터 변화나 외란이 존재하는 조건에서는 정확한 상태값을 추정할 수 없다. 슬라이딩 모드 관측기의 구조는 간단하지만, 파라미터 변화나 외란에서도 슬라이딩 모드 관측기는 강인한 추종능력을 보여주고 있다. 본 논문에서는 등가 입력조건을 이용한 슬라이딩 모드 관측기를 설계하는 방법이 제시되고, 제시된 관측기의 수렴조건에 대해 서술하였다. 수학적인 모델링과 실험결과로서 제안한 방법의 타당성을 입증하였다.

SKL 알고리즘을 이용한 얼굴인식 후보의 점진적 등록 (Sequential Registration of the Face Recognition candidate using SKL Algorithm)

  • 한학용;이생목;곽부동;최원태;강봉순
    • 융합신호처리학회논문지
    • /
    • 제11권4호
    • /
    • pp.320-325
    • /
    • 2010
  • 본 논문은 주성분 분석을 이용하는 얼굴인식 시스템에서 인식후보를 점진적으로 등록하기 위한 방법과 절차에 관한 연구이다. 점진적인 주성분 갱신 방법으로 R-SVD알고리즘을 변형한 SKL 알고리즘을 이용한다. SKL 알고리즘을 이용하면 주성분을 이용하는 얼굴 인식의 문제점으로 지적되어 왔던 인식 후보의 점진적 증가에 따른 재학습 문제를 해결할 수 있다. 또한 이 방법은 밝기 변화에 견고한 객체 트랙킹 분야에도 이용될 수 있다. 본 논문에서는 얼굴인식 시스템에서 SKL 알고리즘을 이용하여 주성분을 점진적으로 갱신하며 적용하는 절차를 제안하고, 표준 KL 변환에 의하여 주성분을 일괄적으로 계산하는 결과와 얼굴 인식성능을 비교한다. 그리고 SKL 알고리즘에 포함된 망각 인자(forgetting factor)가 얼굴인식 성능에 미치는 효과를 실험적으로 확인한다.

실시간 응용을 위한 웨이블릿 변환 기반의 얼굴 검출 (Wavelet Transform-based Face Detection for Real-time Applications)

  • 송해진;고병철;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권9호
    • /
    • pp.829-842
    • /
    • 2003
  • 최근 화상 회의, 화상 전화, 모바일 환경에서의 화상 통신, 얼굴 인식을 이용한 보안 시스템 등의 상업화에 힘입어 비디오에서의 얼굴 검출 및 추적 기술은 눈부신 발전을 이룩하였다. 또한, 얼굴 요소 검출은 요소 그 자체뿐 아니라 정화한 얼굴 영역 검출을 위한 필수 단계로서 중요한 연구 주제가 되고 있다. 그러나 영상에 나타난 복잡한 배경과 카메라 조작 및 조명에 의한 색상 왜곡 그리고 다양한 조명 조건 둥은 얼굴 검출 및 추적, 요소 검출에 있어 여전히 큰 장애가 되고 있다. 이에 따라, 본 논문에서는 실시간 화상 통신을 위한 새로운 얼굴 영역 검출 및 추적 알고리즘과 검출된 얼굴 영역에서 효과적으로 눈 영역을 검출할 수 있는 알고리즘을 제안한다. 제안하는 얼굴 검출 알고리즘은 복잡한 배경과 다양한 조명 조건에 관계없이 얼굴을 검출하고 추적하기 위해 웨이블릿 변환된 세 종류의 부 영역을 이용하여 얼굴 형판을 생성하고 웨이블릿 변환된 입력 영상과의 유사도를 측정하여 얼굴을 검출한다. 특히 다양한 조명 조건을 극복하기 위해 최소-최대 정규화와 히스토그램 평활화를 혼합 적용하여 매우 밝거나, 매우 어두운 영상에서의 얼굴 오 검출 및 놓침을 줄일 수 있었으며 세 가지 크기의 얼굴 형판을 이용함으로써 입력 영상에 존재하는 다양한 크기의 얼굴도 검출할 수 있었다. 또한 효과적인 얼굴 추적 알고리즘을 통해 다음 프레임에서의 얼굴 위치를 예측하고 예측된 얼굴 위치를 중심으로 탐색 영역을 정해 형판 정합을 수행함으로써 얼굴 검출률을 높이면서 수행 시간도 단축시킬 수 있었다. 수직, 수평방향 투영을 이용한 합리적인 눈 검출 알고리즘은 어두운 조명이나 부정확한 얼굴 영역에서도 만족스러운 결과를 보여주었다.26$이었으며, 점차 감소, 다시 증가하여 담금 10일에는 $3.42{\sim}3.69$이었다. 시험구별로는 KKR이 가장 낮았다. 총산은 담금 1일에 $0.29{\sim}0.82%$였으며 담금 6일에 $1.75{\sim}2.53%$로 최고값을 나타내었으며 그 후 감소하여 담금 10일에는 $1.61{\sim}2.34%$였다. 시험구간에는 KKR, SKR이 비교적 높은 값을 나타내었다. 무기질 함량은 발효기간이 경과할수록 증하였고 Ca는 $2.95{\sim}36.76$, Cu는 $0.01{\sim}0.14$, Fe는 $0.71{\sim}3.23$, K는 $110.89{\sim}517.33$, Mg는 $34.78{\sim}122.40$, Mn은 $0.56{\sim}5.98$, Na는 $0.19{\sim}14.36$, Zn은 $0.90{\sim}5.71ppm$을 나타내었으며, 시험구별로 보면 WNR, BNR구가 Na만 제외한 다른 무기성분 함량이 가장 높았다.O to reduce I/O cost by reusing data already present in the memory of other nodes. Finally, chunking and on-line compression mechanisms are included in both models. We demonstrate that we can obtain significantly high-performance

Inmarsat M4 시스템 수신기를 위한 16-QAM Carrier Recovery Loop 설계 (Design of a 16-QAM Carrier Recovery Loop for Inmarsat M4 System Receiver)

  • 장경덕;한정수;최형진
    • 한국통신학회논문지
    • /
    • 제33권4A호
    • /
    • pp.440-449
    • /
    • 2008
  • 본 논문에서는 Inmarsat M4 시스템의 수신기의 실제 구현에 적합한 16-QAM (Quadrature Amplitude Modulation) carrier recovery loop를 제안한다. Inmarsat M4 시스템 규격에서 권고하는 frequency tolerance는 ${\pm}924\;Hz$ (Signal bandwidth: 33.6 kHz) 로서 이러한 상대적으로 큰 주파수 옵셋 환경에서 안정된 동작이 가능한 carrier recovery loop 설계가 요구된다. 일반적인 PLL(Phase Locked Loop) 만을 이용한 carrier recovery loop는 상대적으로 큰 주파수 옵셋 환경에서 안정적인 성능을 보장할 수 없으며, 이에 따라 본 논문에서는 상대적인 주파수 옵셋이 큰 환경에서도 안정적이 동작이 가능한 Inmarsat M4 시스템을 위한 carrier recovery loop 루프를 제안한다. 제안된 carrier recovery loop는 우선 carrier recovery 이전에 UW 신호 detection 을 위해 주파수 옵셋에 강인한 differential filter 기반의 noncoherent 방식의 detector를 이용하여 UW detection을 수행하였으며, 이후 초기 주파수 옵셋 포착을 위해 UW(Unique Word) 신호를 이용한 차동 방식의 CP(Cross Product)-AFC를 적용하였다. 또한 일반적으로 알려진 16-QAM NDA (Non Data Aided) 방식 대신 안정적인 jitter 성능을 위하여 16-QAM DD(Decision Directed) 방식의 PLL 을 적용하여 위상 추적을 수행하였으며, 성능 검증을 통해 제안된 16-QAM carrier recovery loop가 만족스러운 성능과 신뢰성 있는 동작이 가능함을 입증하였다.

슈퍼픽셀을 활용한 전자광학센서의 안개 제거 기법 연구 (Haze Removal of Electro-Optical Sensor using Super Pixel)

  • 노상우
    • 한국산학기술학회논문지
    • /
    • 제19권6호
    • /
    • pp.634-638
    • /
    • 2018
  • 안개는 전자광학센서를 활용한 탐지, 추적, 인식 등의 다양한 영상처리 알고리즘 성능을 저하시키는 요인이다. 실외 환경에서 사용되는 전자광학센서 기반 무인 시스템의 안정적인 작동을 위해서는 안개를 효과적으로 제거할 수 있는 기술이 필요하다. 단일 전자광학센서의 영상을 이용한 안개 제거 방법으로는 전자광학센서의 통계적 속성을 활용한 dark channel prior가 가장 널리 알려져 있다. 기존의 방법들은 dark channel prior를 활용하여 전달량을 구할 때 정방형 필터를 사용하였다. 정방형 필터 사용 시 필터의 크기가 커질수록 안개 제거의 효과가 작아지며, 필터의 크기가 과도하게 작아질 경우 과포화가 발생하여 영상의 색 정보가 손실된다. 필터의 크기가 알고리즘의 성능에 크게 영향을 끼치기 때문에, 일반적으로는 비교적 큰 크기의 필터를 사용하거나 영상에 따라 과포화가 일어나지 않는 범위에서 작은 크기의 필터를 사용한다. 본 논문에서는 컬러영상분할을 활용한 향상된 안개 제거 방법을 제안하였다. 컬러영상분할의 파라미터를 영상의 정보 복잡도에 따라 자동으로 조정하고, 이를 바탕으로 전달량을 추정하여 과포화 현상은 일어나지 않으며 뛰어난 안개 제거의 성능을 확보하였다.

SOM 기반의 계층적 군집 방법을 이용한 계산 효율적 비디오 객체 분할 (Computation ally Efficient Video Object Segmentation using SOM-Based Hierarchical Clustering)

  • 정찬호;김경환
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.74-86
    • /
    • 2006
  • 본 논문에서는 계산 효율적이고 노이즈에 강건한 비디오 객체 분할 알고리즘을 제안한다. 움직임 분할과 색 분할을 효율적으로 결합한 시공간 분할 방법의 구현을 위해 SOM 기반의 계층적 군집 방법을 도입하여 특징 벡터들의 군집 관점에서 분할 과정을 해석함으로써 기존의 객체 분할 방법에서 정확한 분할 결과를 얻기 위해서 요구되어지는 많은 연산량과 노이즈에 의한 시스템의 성능 저하 문제를 최소화한다. 움직임 분할 과정에서는 움직임 추정 에러에 의한 영향을 최소화하기 위해서 MRF 기반의 MAP 추정 방법을 이용하여 계산한 움직임 벡터의 신뢰도를 이용한다. 또한 움직임 분할의 성능 향상을 위해서 움직임 신뢰도 히스토그램을 이용한 노이즈 제거 과정을 거칠 뿐만 아니라 자동으로 장면 내에 존재하는 객체의 수를 구하기 위해서 군집 유효성 지표를 이용한다. 객체 추적의 성능 향상을 위해 교차 투영 기법을 이용하며, 분할 결과의 시간적 일관성 유지를 위해 동적 메모리를 이용한다. 다양한 특성을 가지는 비디오 시퀀스들을 이용한 실험을 통해 제안하는 방법이 계산 효율적이고 노이즈에 강건하게 비디오 객체 분할을 수행함은 물론 기존의 구현 방법에 비해 정확한 분할 결과를 얻을 수 있음을 확인하였다.

보행 인식 시스템 성능 개선을 위한 영상 왜곡 보정 기법 (Image Distortion Compensation for Improved Gait Recognition)

  • 전지혜;김대희;양윤기;백준기;이창수
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.97-107
    • /
    • 2009
  • 영상기반 보행인식 시스템에서 카메라와 객체가 이루는 각도(angle) 및 렌즈 왜곡과 같은 물리적 요인과 조명(illumination)과 같은 환경적 요인에 따라 인식률이 다르게 나타난다. 본 논문은 카메라에서 입력된 다양한 형태의 영상 왜곡을 보정하여 보행 인식 시스템의 성능 및 안정성을 향상시키는 기법을 제안한다. 제안된 방법은 물리적, 환경적 왜곡 요인이 존재하는 입력 영상에서의 인간의 보행 인식률을 기존 방식과 실험적으로 비교한다. 보다 구체적으로는 투영 변환(projective transform)을 통해 입력 영상의 왜곡을 효과적으로 보정하는 알고리듬을 제안하고 입력 영상의 왜곡 보정 전, 후를 비교하여 알고리듬의 실효성을 확인한다. 제안된 방법은 카메라로부터의 거리 및 환경에 불변하는 보편적인 보행 데이터를 획득하였다. 그 결과 제안된 보편적인 보행 데이터를 이용하여 실내 영상에서는 평균적으로 41.5%, 실외 영상에서는 평균적으로 55.5%의 향상된 보행 인식률을 보였다. 이것은 특정 개체의 특징을 데이터베이스(DB)화 하고 DB에 저장된 특정 개체를 검색하고 추적하는 데 효과적으로 이용될 수 있다.

모바일 랜드마크 가이드 : LOD와 문맥적 장치 기반의 실외 증강현실 (A Mobile Landmarks Guide : Outdoor Augmented Reality based on LOD and Contextual Device)

  • 조비성;누르지드;장철희;이기성;조근식
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.1-21
    • /
    • 2012
  • 최근 스마트폰의 등장으로 인해 사용자들은 시간과 공간의 제약 없이 스마트폰을 이용한 새로운 의사소통의 방법을 경험하고 있다. 이러한 스마트폰은 고화질의 컬러화면, 고해상도 카메라, 실시간 3D 가속그래픽과 다양한 센서(GPS와 Digital Compass) 등을 제공하고 있으며, 다양한 센서들은 사용자들(개발자, 일반 사용자)로 하여금 이전에 경험하지 못했던 서비스를 경험할 수 있도록 지원하고 있다. 그 중에서 모바일 증강현실은 스마트폰의 다양한 센서들을 이용하여 개발할 수 있는 대표적인 서비스 중 하나이며, 이러한 센서들을 이용한 다양한 방법의 모바일 증강현실 연구들이 활발하게 진행되고 있다. 모바일 증강현실은 크게 위치 정보 기반의 서비스와 내용 기반 서비스로 구분할 수 있다. 위치 정보 기반의 서비스는 구현이 쉬운 장점이 있으나, 증강되는 정보의 위치가 실제의 객체의 정확한 위치에 증강되는 정보가 제공되지 않는 경우가 발생하는 단점이 존재한다. 이와 반대로, 내용 기반 서비스는 정확한 위치에 증강되는 정보를 제공할 수 있으나, 구현 및 데이터베이스에 존재하는 이미지의 양에 따른 검색 속도가 증가하는 단점이 존재한다. 본 논문에서는 위치 정보 기반의 서비스와 내용기반의 서비스의 장점들을 이용한 방법으로, 스마트폰의 다양한 센서(GPS, Digital Compass)로 부터 수집된 정보를 이용하여 데이터베이스의 탐색 범위를 줄이고, 탐색 범위에 존재하는 이미지들의 특징 정보를 기반으로 실제의 랜드마크를 인식하고, 인식한 랜드마크의 정보를 링크드 오픈 데이터(LOD)에서 검색하여 해당 정보를 제공하는 랜드마크 가이드 시스템을 제안한다. 제안하는 시스템은 크게 2개의 모듈(랜드마크 탐색 모듈과 어노테이션 모듈)로 구성되어있다. 첫 번째로, 랜드마크 탐색 모듈은 스마트폰으로 인식한 랜드마크(건물, 조형물 등)에 해당하는 정보들을 (텍스트, 사진, 비디오 등) 링크드 오픈 데이터에서 검색하여 검색된 결과를 인식한 랜드마크의 정확한 위치에 정보를 제공하는 역할을 한다. 스마트폰으로부터 입력 받은 이미지에서 특징점 추출을 위한 방법으로는 SURF 알고리즘을 사용했다. 또한 실시간성을 보장하고 처리 속도를 향상 시키기 위한 방법으로는 입력 받은 이미지와 데이터베이스에 있는 이미지의 비교 연산을 수행할 때 GPS와 Digital Compass의 정보를 사용하여 그리드 기반의 클러스터링을 생성하여 탐색 범위를 줄임으로써, 이미지 검색 속도를 향상 시킬 수 있는 방법을 제시하였다. 두 번째로 어노테이션 모듈은 사용자들의 참여에 의해서 새로운 랜드마크의 정보를 링크드 오픈 데이터에 추가할 수 있는 기능을 제공한다. 사용자들은 키워드를 이용해서 링크드 오픈 데이터로에서 관련된 주제를 검색할 수 있으며, 검색된 정보를 수정하거나, 사용자가 지정한 랜드마크에 해당 정보를 표시할 수 있도록 지정할 수 있다. 또한, 사용자가 지정하려고 하는 랜드마크에 대한 정보가 존재하지 않는다면, 사용자는 랜드마크의 사진을 업로드하고, 새로운 랜드마크에 대한 정보를 생성하는 기능을 제공한다. 이러한 과정은 시스템이 카메라로부터 입력 받은 대상(랜드마크)에 대한 정확한 증강현실 컨텐츠를 제공하기 위해 필요한 URI를 찾는데 사용되며, 다양한 각도의 랜드마크 사진들을 사용자들에 의해 협업적으로 생성할 수 있는 환경을 제공한다. 본 연구에서 데이터베이스의 탐색 범위를 줄이기 위해서 랜드마크의 GPS 좌표와 Digital Compass의 정보를 이용하여 그리드 기반의 클러스터링 방법을 제안하여, 그 결과 탐색시간이 기존에는 70~80ms 걸리는 반면 제안하는 방법을 통해서는 18~20ms로 약 75% 정도 향상된 것을 확인할 수 있었다. 이러한 탐색시간의 감소는 전체적인 검색시간을 기존의 490~540ms에서 438~480ms로 약 10% 정도 향상된 것을 확인하였다.