• 제목/요약/키워드: 프레임 검출

검색결과 838건 처리시간 0.041초

실시간 보행자 검출을 위한 HOG 연산 알고리즘 고속화 방법 (A Speed-up Method of HOG Computation Algorithm for Realtime Pedestrian Detection)

  • 이윤구;이재흥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.921-923
    • /
    • 2014
  • 보행자 검출과정은 특징추출, 추출된 특징을 기반으로 한 학습과정, 그리고 학습된 데이터를 기반으로 한 분류과정으로 나눌 수 있다. 이들 중 연산시간이 가장 오래 걸리는 특징추출과정이다. 기존의 HOG 특징 추출은 하나의 학습 샘플 이미지에 대하여 많은 픽셀 연산이 필요하기 때문에 많은 시간이 소요되었다. 본 논문에서는 실시간 스트리밍 환경에서 이전 프레임의 HOG 특징 검출정보를 분석하여 다음 프레임에서 보행자가 존재 할 가능성이 높은 부분에 대해서만 특징을 추출한다. 이 방법으로 기존의 연구와 비교하여 인식성능에는 거의 영향을 주지 않고 인식 속도를 향상할 수 있다.

색상 및 거리 영상에서의 얼굴검출 기반 손 제스처 인식 (Face Detection-based Hand Gesture Recognition in Color and Depth Images)

  • 전훈기;고재필
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.580-582
    • /
    • 2012
  • 본 논문에서는 얼굴검출을 통한 실시간 피부색 모델링과 거리정보를 결합하여 손 영역을 검출하고 손 움직임에 따른 방향 및 원 제스처 인식을 위한 규칙 기반 인식방법을 제안한다. 기존과는 달리 손좌표를 사용하는 대신 기존 프레임과 현재 프레임에서의 손 좌표 차이를 이용하여 제스처 구간을 설정하고 자연스러운 제스처 동작에서의 속도변화를 고려할 수 있도록 한다. 실험 데이터는 5명을 대상으로 4방향과 원을 포함하여 총 5가지 제스처를 10회씩 실행하여 획득하였다. 이들 데이터에 대한 인식 실험에서 97%의 인식률을 보였다.

2.4 kbps 하모닉-CELP 코더를 위한 웨이블렛 피치 검출기 (Wavelet-based Pitch Detector for 2.4 kbps Harmonic-CELP Coder)

  • 방상운;이인성;권오주
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.717-726
    • /
    • 2003
  • 본 논문은 2.4 kbps 하모닉-CELP 부호화기를 위한 피치 검출기의 설계 방법과 전이 시점을 검출하고 그 값을 기준으로 유/무성음 변환 구간에 대한 합성 윈도우를 달리하여 효과적인 파형 보간이 이루어지도록 하기 위한 방법을 제안하였다. 하모닉-CELP 부호화기에서 유성음 구간은 과거와 현재 프레임의 표준 파형을 보간하여 이루어지므로 전이 구간에서 피치 주기가 반으로 줄거나 두 배로 예측되어질 경우, 피치주기의 심한 변화량에 의해 파형 왜곡 및 프레임 경계에서의 불연속을 발생시킨다. 또한 하모닉 합성을 할 때 삼각 윈도우에 의한 중첩-합산 (overlap-add) 방법을 사용하기 때문에 전이 구간에서 유성음 구간의 신호가 순간적인 증가 (감소)를 할 경우 삼각 윈도우의 영향으로 합성 여기 신호가 선형 증가 (감소) 하는 단점이 있다. 우선 피치 검출기의 설계는 정확한 피치의 검출을 하되 피치 더블링에 의한 프레임 불연속성을 막기 위해 1차 혼성 검색법을 사용하였으며, ACF에 의한 2차 검색으로 피치의 정확도를 높였다. 그리고 삼각 윈도우에 의해 합성 파형이 선형 증가하던 문제는 웨이블렛에 의해 검출된 GCI를 이용하여 전이 시점을 검출한 후, 그 값을 기준으로 사다리꼴 윈도우 설정을 하여 해결하였다. 실험 결과 파형 보간 코더에서 가장 문제가 되었던 피치 더블링이 사라졌으며, 피치 검색 오차율은 ACF 검출법에 비해 5.4% 개선되었고 웨이블렛에 의한 검출법에 비해 2.66% 개선되었다. 전이 구간에서의 MOS값은 0.13 향상되었다.

음성 및 잡음 인식 알고리즘을 이용한 환경 배경잡음의 제거 (Reduction of Environmental Background Noise using Speech and Noise Recognition)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.817-822
    • /
    • 2011
  • 본 논문에서는 먼저 신경회로망의 학습에 오차역전파 학습 알고리즘을 사용하여 각 프레임에서의 음성 및 잡음 구간의 검출에 의한 음성인식 알고리즘을 제안한다. 그리고 신경회로망에 의하여 음성 및 잡음 구간의 검출에 따라서 각 프레임에서 잡음을 제거하는 스펙트럼 차감법을 제안한다. 본 실험에서는 제안한 음성인식알고리즘의 성능을 원음성에 백색잡음 및 자동차 잡음을 부가하여 인식율을 평가한다. 또한 인식시스템에 의하여 검출된 음성 및 잡음 구간을 이용하여 각 프레임에서의 스펙트럼 차감법에 의한 잡음제거의 실험결과를 나타낸다. 잡음에 의하여 오염된 음성에 대하여 신호대잡음비를 사용하여 본 알고리즘이 유효하다는 것을 확인한다.

MPEG의 다차원 분석을 통한 디졸브 구간 검출 : I, P프레임의 DCT-R값을 이용 (Detecting Dissolve Cut for Multidimensional Analysis in an MPEG compressed domain : Using DCT-R of I, P Frames)

  • 허정;박상성;장동식
    • 융합신호처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.34-40
    • /
    • 2003
  • 본 논문에서는 비디오 장면전환 효과 중 디졸브(dissolve)에 의한 점진적인 장면전환 구간을 검출하는 알고리즘을 제안한다. 제안한 알고리즘은 처리의 효율성과 MPEG Sequence의 최소한의 복원과정을 위해 Ⅰ, P 프레임의 Color-R값에 대한 DCT계수를 사용하였다. 인간의 시각으로는 비디오의 장면전환점을 쉽게 구분해 낼수 있듯이 컴퓨터가 인식하기 쉽도록 영상을 3차원으로 시각화하고 분석하여 장면전환 구간을 검출하였다. 우선 각각의 영상에서 Color-R에 대한 DCT계수를 추출하고 블록단위인 8*8단위 열의 합을 구해 다시 프레임에 대한 행을 4단계로 분할하여 특징치를 분석하고 4단계의 샷 특징치를 통합하여 샷을 검출한다. 실험결과 제안한 방법이 영상의 단일 특징치를 사용한 방법보다 4단계의 특징치 분석을 사용함으로서 더 좋은 성능을 나타내었다 또한 Ⅰ, P 프레임의 Color-R값의 부분적 복원과정으로 계산시간을 절약할 수 있었다.

  • PDF

H.264 비디오 압축에서 GOP 내의 프레임특성을 이용한 강인한 워터마킹 방법 (A method of Robust Watermarking using Frame Characteristics of Group of Picture on H.264)

  • 정용재;문광석;김종남
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.861-864
    • /
    • 2009
  • 디지털 콘텐츠는 원본을 훼손하지 않고 복제 및 인터넷을 통한 배포가 가능하기 때문에 콘텐츠에 대한 지적 재산권 보호 할 수 있는 장치는 필수적이다. 본 논문에서는 디지털 콘텐츠의 지적 재산권을 보호할 수 있는 강인한 워터마킹 방법을 제안한다. 제안한 방법은 최신의 비디오 압축방법인 H.264에서 GOP(group of picture)내에서 시각적으로 민감하지 않고, 에러 전파를 할 수 없는 GOP의 프레임에 워터마크 강도를 크게 하고, 그렇지 않은 프레임에는 워터마크 강도를 상대적으로 낮추어 적은 화질열화에 비해 상대적으로 검출율이 높아 질 수 있도록 하였다. 실험 결과 H.264의 압축에서 높은 검출률을 보였고, 프레임별 화질 열화는 존재하지만 비디오를 재생하여 시각적인 테스트를 할 경우 화질 열화가 숨겨짐을 보였다. 제안하는 방법은 콘텐츠의 지적 재산권을 보호하기 위한 응용프로그램을 필요로 하는 DVD 제작자, IPTV 방송국과 같은 곳에 필요로 할 것이다.

  • PDF

표정 HMM과 사후 확률을 이용한 얼굴 표정 인식 프레임워크 (A Recognition Framework for Facial Expression by Expression HMM and Posterior Probability)

  • 김진옥
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권3호
    • /
    • pp.284-291
    • /
    • 2005
  • 본 연구에서는 학습한 표정 패턴을 기반으로 비디오에서 사람의 얼굴을 검출하고 표정을 분석하여 분류하는 프레임워크를 제안한다. 제안 프레임워크는 얼굴 표정을 인식하는데 있어 공간적 정보 외시간에 따라 변하는 표정의 패턴을 표현하기 위해 표정 특성을 공간적으로 분석한 PCA와 시공간적으로 분석한 Hidden Markov Model(HMM) 기반의 표정 HMM을 이용한다. 표정의 공간적 특징 추출은 시간적 분석 과정과 밀접하게 연관되어 있기 때문에 다양하게 변화하는 표정을 검출하여 추적하고 분류하는데 HMM의 시공간적 접근 방식을 적용하면 효과적이기 때문이다. 제안 인식 프레임워크는 현재의 시각적 관측치와 이전 시각적 결과간의 사후 확률 방법에 의해 완성된다. 결과적으로 제안 프레임워크는 대표적인 6개 표정뿐만 아니라 표정의 정도가 약한 프레임에 대해서도 정확하고 강건한 표정 인식 결과를 보인다. 제안 프레임 워크를 이용하면 표정 인식, HCI, 키프레임 추출과 같은 응용 분야 구현에 효과적이다

폭발장면 자동 검출을 위한 저급 수준 비디오 특징의 추상화 (Abstraction Mechanism of Low-Level Video Features for Automatic Retrieval of Explosion Scenes)

  • 이상혁;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.389-401
    • /
    • 2001
  • 본 논문에서는 MPEG형식의 영화 데이터를 대상으로 폭발 장면 자동 추출을 위한 저급 수준 비디오 내용정보의 추상화 방법을 제안하고, 실제 구현을 통하여 그 유용성을 보인다. 제안한 추상화 방법은 폭발시 발생하는 불꽃의 색이 노란색 톤을 가진다는 사실과, 불꽃이 나타나는 프레임은 같은 tit에 속하는 이웃한 프레임과는 화면 구성이 달라지게 되므로 움직임 에너지 값이 커지게 된다는 사실을 바탕으로 한다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프래임을 키 프레임으로 하다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프레임을 키 프레임으로 선택한 후 영역별 주 색깔(Dominant Color)를 추출한다. 이때 색 공간은 양자화를 통한 512색 중 노란색 톤을 가지는 48 색 범위로 정의한다. 이후 매 샷마다 첫 번째 프레임과 이웃한 프레임의 에지 이미지(Edge Image)를 추출하여 이들의 차이로써 움직임 에너지(Motion Energy)를 얻는다. 이 두 가지 정보, 즉 노란색 톤을 가지는 색 정보와, 같은 장면 내의 다른 샷의 움직임 에너지에 비해 큰 값의 움직임 에너지를 갖는 샷을 폭발장면이 포함된 장면으로 검출한다. 실험 결과에 의하면 검색 결과는 주어진 임계값에 의존적이나, Recall과 Precision에서 80% 이상의 검출률을 보이고 있다. 그러나 일반적인 폭발 장면은 찾기에는 노란색 불꽃을 보이지 않는 예외적인 경우가 발생하여 이를 추출하는데 어려움이 있었다. 앞으로 이러한 문제점등은 기존의 오디오 정보를 이용한 폭발 장면 검출 방법과 함께 이용함으로써 해결되어질 수 있을 것이다.

  • PDF

플래시라이트에 강건한 장면전환 검출 알고리즘 (Robust Scene Change Detection Algorithm for Flashlight)

  • 고경철;최형일;이양원
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.83-91
    • /
    • 2006
  • 비디오에 삽입된 플래시라이트는 연속된 프레임사이의 차이 값을 높게 형성하여 장면전환 검출을 위한 임계값 결정에 많은 어려움을 주며, 특히 장면전환 지점으로 잘못 검출되는 문제점을 가지고 있다. 따라서 본 논문에서는 이러한 플래시라이트를 연속된 프레임으로부터 효율적으로 제거하여 신뢰할 수 있는 장면전환 지점을 검출하는 강건한 장면전환 검출 알고리즘을 제안한다. 제안된 방법은 먼저, 연속된 프레임사이의 차이 값 추출을 위하여 객체나 카메라의 움직임에 덜 민감하고 프레임의 공간정보를 이용하는 지역 히스토그램 비교에 의한 추출 식을 사용하며, 추출된 차이 값들의 큰 변이 폭에 의한 임계 값 결정의 문제점을 해결하기 위하여 차이 값들의 동적 압축에 의한 정규화 작업을 수행한다. 또한 추출된 차이 값들의 시간적 연속성의 변이에 따라 플래시라이트가 가지는 특징을 이용하여 플래시라이트와 장면전환 검출을 따로 구분하여 추출할 수 있는 새로운 장면전환 검출 알고리즘을 제안한다. 제안된 방법은 플래시라이트가 들어있는 다양한 비디오 타입으로부터 실험되어졌으며, 실험결과 플래시라이트 검출에 높은 신뢰성과 효율성을 보여주었다.

영역 궤적의 클러스터링을 이용한 비디오 영상에서의 움직이는 객체의 검출 (Moving Object Segmentation Using the Clustering of Region Trajectories)

  • 권영진;이재호;김회율
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.15-18
    • /
    • 2001
  • 동영상에서 움직이는 객체 검출은 동영상의 내용을 표현하고 유사한 동영상을 검색하는 데 있어 중요한 특징간을 추출하는 방법으로 사용된다. 그러나 복잡하게 카메라가 움직이는 동영상에서 움직이는 객체 검출은 아직까지 어려운 과제이다. 본 논문에서는 복잡한 카메라의 움직임이 있는 환경에서 움직이는 객체를 강인하게 검출하는 방법을 제안한다. 움직이는 객체 검출 방법은 입력 영상을 색상간의 클러스터링을 이용하여 각 영역으로 구분하는 Mean Shift 알고리즘과 인접한 프레임에서 구분된 영역을 대응시켜 영역의 모션 벡터를 구하는 영역 매칭, 유사한 궤적을 가지는 영역들의 클러스터링을 이용하여 객체를 검출하는 궤적 클러스터링 알고리즘을 사용한다. 제안한 영역 기반 알고리즘은 기존의 픽셀이나 블록 기반의 방법보다 움직이는 객체를 정확하게 검출하였다. 실험 결과 복잡하게 움직이는 카메라의 환경 속에서 움직이는 객체를 강인하게 검출하였다.

  • PDF