• Title/Summary/Keyword: 프레임 검출

검색결과 838건 처리시간 0.029초

MSE를 이용한 동영상데이터의 컷 검출시스템에 관한 연구 (A Study on the Cut Detection System of Video Data using MSE)

  • 김단환;정기봉;오무송
    • 한국정보통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1399-1404
    • /
    • 2004
  • 컴퓨터의 발전과 정보통신기술의 발달은 멀티미디어 기술 확산과 대용량의 멀티미디어 동영상데이터 사용을 증가시켰다. 동영상데이터는 전체적인 데이터를 파악하고, 원하는 동영상을 바로 재생 가능할 뿐만 아니라 동영상 데이터의 정보가 된 리스트제공이 필요하다. 그리고 효과적인 동영상 검색을 위해서는 동영상 데이터의 색인과정이 필수적이며 꼭 필요한 기술이다. 따라서 본 연구는 동영상 데이터 내용기반 색인에 기초가 될 프레임의 컷 검출의 효과적인 방법을 제안한다. 제안된 방법은 동영상데이터 각각의 프레임을 대각선 방향으로 나누어 일정한 픽셀 색상 정보 값을 추출하여 각각 프레임에서 추출된 칼라색상의 픽셀값은 A(i, ij행렬로 j는 프레임 수, i는 프레임의 영상 높이로 저장한다. 저장되어진 픽셀값은 MSE(Mean Square Error)을 이용하여 프레임간의 특정 값의 차이를 임계 값보다 클 경우 빠르고 정확하게 컷을 검출하였다. 프레임 컷 검출에 대한 실험을 포괄적으로 하기 위해 여러 종류의 동영상 데이터를 실험 대상으로 하여 컷 검출 시스템의 성능을 비교 분석하였다.

고성능 실시간 얼굴 검출 엔진의 설계 및 구현 (Design and Implementation of Real-time High Performance Face Detection Engine)

  • 한동일;조현종;최종호;조재일
    • 대한전자공학회논문지SP
    • /
    • 제47권2호
    • /
    • pp.33-44
    • /
    • 2010
  • 본 논문에서는 로봇 시각 처리 활용을 위한 실시간 얼굴 검출 하드웨어 구조를 제안한다. 제안한 구조는 조명 변화에 강인하고 초당 60 프레임 이상의 속도로 처리된다. 조명 변화에 강인한 얼굴 특성 추출을 위해 MCT(Modified Census Transform) 변환을 이용하였다. 그리고 AdaBoost 알고리즘은 얼굴 특징 데이터의 학습 및 생성을 하며, 이 생성된 학습 데이터를 이용해 얼굴 검출을 하게 된다. 본 논문에서는 메모리 인터페이스부, 이미지 크기 조정부, MCT 생성부, 후보 얼굴 검출부, 신뢰도 비교부, 좌표 재조정부, 데이터 그룹화부, 검출 결과 표시부로 구성된 얼굴 검출 하드웨어 구조 및 Xilinx사의 Virtex5 LX330 FPGA를 이용한 하드웨어 구현 검증 결과에 대해 설명한다. 카메라로 부터 입력받은 이미지를 이용해 검증한 결과로 초당 최대 149프레임의 속도로 한 프레엠 당 최대 32개 얼굴을 검출함을 확인하였다.

뉴스 비디오에서 키 프레임 추출과 앵커 인식 (The Key Frame Extraction and Anchor Recognition in News Videos)

  • 신성윤;임정훈;이양원;표성배
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.286-289
    • /
    • 2001
  • 뉴스 비디오에서 앵커가 등장하는 첫 번째 프레임은 하나의 뉴스를 샷으로 설정하는데 기준이 되는 키 프레임이라고 볼 수 있다. 본 논문에서는 뉴스 비디오의 장면 전환을 검출을 위하여 컬러 히스토그램과 $\chi$$^2$ 히스토그램을 합성한 방법을 이용하여 키 프레임을 추출하며, 추출된 키 프레임을 대상으로 앵커 프레임의 공간적 구성과 얼굴의 특징 정보에 대한 사전 지식을 바탕으로 한 유사성 측정을 통하여 앵커를 인식하도록 한다. 앵커로 인식된 프레임은 하나의 뉴스 신에 대한 키 프레임이 되며 뉴스 비디오를 색인화 하는데 중요한 역할을 수행한다.

  • PDF

컨텍스트 기반의 지능형 영상 감시 시스템 구현에 관한 연구 (Implementation of Intelligent Image Surveillance System based Context)

  • 문성룡;신성
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.11-22
    • /
    • 2010
  • 본 논문은 컨텍스트 기반의 지능형 영상 감시 시스템 구현에 관한 연구로써 기존 연구의 시공간적 제약성 및 실시간 처리가 어려운 단점을 보완하여 초당 30 프레임으로 이루어져 있는 저해상도 동영상(320*240)을 대상으로 다양한 환경에서 실시간 처리가 가능한 움직임 검출 및 장면 분석 알고리즘을 제안하고 이를 이용해 동영상 감시 시스템을 구축한다. 먼저 장면 분석을 수행하기 위한 전처리 과정인 움직임 검출 알고리즘에서는 연속된 프레임 중 의미 없는 유사 프레임과 배경을 제거하고 움직임 영역만을 검출하기 위해 웨이브렛 변환과 에지 히스토그램을 이용하여 샷의 경계를 검출한다. 다음으로 키프레임 선정 파라미터에 의해 샷 경계 내 대표 키프레임을 선정하며, 에지 히스토그램 및 수학적 형태론을 이용하여 움직임 영역만을 검출한다. 장면 분석 알고리즘에서는 검출된 객체의 수직 수평 비율과 질량 중심을 통해 재구성된 허프 변환 후의 각도를 이용해 독립 객체 분석을 수행하며, '서다, 걷다, 눕다, 앉다'의 4가지 기본 상황 정보를 정의한다. 또한 각 상황의 연결 상태 추정을 통해 일반 상황 및 위급 상황으로 구성되는 단순 상황 모델을 정의함으로써 장면 분석을 수행하며, 제안된 알고리즘의 실시간 처리 가능성을 확인하기 위해 시스템을 구성한다. 제안된 시스템은 저해상도 영상을 대상으로 인식률 면에서 평균 92.5%의 성능을 보였으며, 처리속도는 프레임 당 평균 0.74초로 실시간 처리가 가능함을 확인하였다.

이동 카메라 영상에서 움직이는 물체 검출 및 추적 (Detection and Tracking of Moving Object in Moving Camera Images)

  • 오윤환;이은주
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2007년도 춘계학술대회
    • /
    • pp.1-8
    • /
    • 2007
  • 본 논문은 저해상도와 많은 노이즈를 갖는 일반 CCTV의 입력 영상에서 실시간으로 움직이는 물체를 검출하고 그 물체의 움직임을 추적하는 방법을 제안 한다. 본 논문은 CCTV영상으로부터의 입력 영상을 순차를 갖는 명암도 영상으로 실시간 변환 하여 진행 한다. 움직이는 물체의 추출은 첫째, 획득한 영상의 그레이 영상을 포스터라이징을 이용하여 명암 분포를 축소하고 차영상을 통해 윤곽을 추출한다. 둘째, 본 논문이 제안하는 영역 단위 이진화를 통해 이진화와 잡음의 제거를 동시에 수행한다. 셋째, 손실된 정보의 보정을 위해 이진 영상의 팽창을 수행한다. 넷째, 이진 영상의 가로/세로 명암 밀도 분포를 통해 움직이는 물체 영역을 검출한다. 검출된 물체의 추적은 현 재 프레임의 물체 영역과 이전 프레임의 물체 영역의 중심을 계산한 후, 두 중심의 거리 차를 계산한다. 계산된 거리가 임계값보다 작을 경우 같은 물체로 인식하고 계속 추적하며, 임계값 이상의 값일 경우 새로운 물체로 인식한다. 추적된 이동물체의 중심점이 화면의 중앙 부분에 있지 않을 경우, 이동물체의 중심으로 카메라의 방향을 조정한다. 실험결과, 제안한 방법으로 저해상도와 많은 노이즈를 갖는 일반 CCTV 의 입력 영상에서도 실시간으로 움직이는 물체를 검출하고, 그 물체의 움직임을 추적 할 수 있었다.

  • PDF

퍼셉트론 신경회로망을 사용한 유성음, 무성음, 묵음 구간의 검출 알고리즘 (Voiced-Unvoiced-Silence Detection Algorithm using Perceptron Neural Network)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.237-242
    • /
    • 2011
  • 본 논문에서는 다층 퍼셉트론 신경회로망을 사용하여 각 프레임에서의 유성음, 무성음, 그리고 묵음 구간을 검출하는 구간검출 알고리즘을 제안한다. 다층 퍼셉트론 신경회로망의 입력으로는 고속 푸리에변환에 의한 전력스펙트럼 및 고속 푸리에변환 계수가 사용되어 네트워크가 학습된다. 본 실험에서는 원 음성에 백색잡음이 중첩된 음성을 신경회로망에 입력함으로서 각 프레임에서의 유성음, 무성음, 묵음 구간의 검출성능 결과를 나타낸다. 본 실험에서는 신경회로망의 학습 데이터 및 평가 데이터가 다를 경우에도 이러한 음성 및 백색잡음에 대하여 92% 이상의 검출율을 구할 수 있었다.

중계 영상을 활용한 야구 경기 분석 방법 (Baseball Game Analysis Method Using Broadcast Video)

  • 손종웅;이명진
    • 방송공학회논문지
    • /
    • 제25권4호
    • /
    • pp.576-586
    • /
    • 2020
  • 레이더나 라이더 센서를 활용한 야구 경기 분석은 많은 비용이 요구된다. 본 논문에서는 중계 비디오에서 피치 샷과 타구 샷을 검출하고, 카메라의 움직임 기반 타구 궤적 생성 알고리즘을 제안한다. 제안하는 알고리즘은 객체 검출과 옵티컬 플로우 기반 피치 샷과 타구 샷 검출 이후, 프레임 간 변환 관계를 통해 프레임 내 타구 위치와 타구 궤적을 계산한다. 제안 방법은 KBO 중계 영상 시퀀스 3개에 대해 성능을 평가하였고 피치 샷과 타구 샷 검출 정확도와 검출률은 89-95[%] 이내의 성능을 보였으며, 평균 타구 위치 거리차이는 13.6[m], 방향 차이 7.5°, 파울 분류 정확도 98.6%의 성능을 보였다.

전역적 결정트리를 이용한 샷 경계 검출 (Shot Boundary Detection Using Global Decision Tree)

  • 신성윤;문형윤;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.75-80
    • /
    • 2008
  • 본 논문에서는 프레임들의 차이값으로부터 카메라 브레이크에 의해 발생하는 큰 변화의 폭을 갖는 경계지점을 추출하는 전역적 결정트리를 이용하여 샷 경계를 검출하는 방법을 제시한다. 먼저 지적 $X^2$ 히스토그램과 정규화를 통하여 프레임 간 차이값을 계산하고, 다음으로 차이값간의 거리를 정규화를 통하여 계산한다. 계산된 차이값간의 거리를 바탕으로 전역적 임계치 거리를 계산하여 인접한 두 프레임들에 대한 거리값과 전역적 임계치 거리를 비교하여 샷 경계를 검출한다. 본 논문에서 제시한 전역적 결정트리를 이용하여 객체나 카메라의 움직임과 플래시 라이트와 같은 갑작스런 장면 변화를 쉽게 검출할 수 있다.

  • PDF

MPEG 압축 영상에서의 고속 특징 요소 추출을 이용한 장면 전환 검출과 키 프레임 선택 (Scene Change Detection and Key Frame Selection Using Fast Feature Extraction in the MPEG-Compressed Domain)

  • 송병철;김명준;나종범
    • 방송공학회논문지
    • /
    • 제4권2호
    • /
    • pp.155-163
    • /
    • 1999
  • 본 논문은 새로운 장면 전환 검출과 키 프레임 선태 기법을 제안하였다. 이를 위해 본 논문에서는 MPEG 압축 동영상에서 직접 DC 영상 및 에지(edge) 영상을 추출하여 이용하는데, 공간 영역으로 변환 후 에지 연상을 추출할 경우 계산량이 많다는 문제점이 있다. 따라서 본 논문에서는 그 계산량을 줄이기 위해 DCT 블록 당 5개의 저 대역 AC 계수들만을 이용하여 축소된 에지 영상을 고속으로 추출하는 방법을 제안하고, 이를 바탕으로 AC 예측(prediction)을 이용한 고속 에지 추출 기법도 추가적으로 제안하였다. 화질 측면에서 전자가 후자보다 약간 우수하지만, 두 방법 모두 영상의 중요한 에지 특징들을 잘 추출할 수 있다. 이와 같이 얻어진 에지 영상 및DC 영상을 이용하여 에지 에너지 다이어그램(dege energy diagram)과 히스토그램(histogram)을 구하여 급진적인 장면 전환 및 페이드(fade), 디졸브(dissolve) 같은 점진적인 장면 전환을 정확하게 검출함을 모의 실험을 통해 확인하였다. 또한 공간 영역에서 구한 에지 영상들에 비해 제안한 방법들에 의한 에지 영상들이 점진적인 장면 검출에 있어 훨씬 적은 계산량으로 비슷한 성능을 보임을 확인하였다. 마지막으로 HVS(human visual system)에 기반하여 각 장면에서 키 프레임을 선택하는 방법도 제안하였다. 위에서 얻어진 에지 및 DC 영상을 이용하기 때문에 optical flow를 이용하는 기존 방법에 비해 적은 계산량으로 의미 있는 키 프레임을 선택할 수 있었다.

  • PDF

OpenCL 기반의 그래디언트 라돈변환을 이용한 만화영상의 정규화 (Comic Image Normalization using the gradient Radon Transform based on OpenCL implementation)

  • 김동근;전혁준;황치정
    • 정보처리학회논문지B
    • /
    • 제18B권4호
    • /
    • pp.221-230
    • /
    • 2011
  • 디지털 만화영상은 인터넷에서 매우 인기 있는 컨텐츠이다. 일반적으로 디지털 만화영상은 디지털 스캐너에 의해 스캔되며, 후처리를 하지 않으면 서로 다른 크기와 기울어짐을 가질 수 있으며, 경계부분에 내용이외의 여백이 있을 수 있다. 기울어짐과 여백이 없이 영상의 내용의 크기를 정규화하는 것은 내용기반 만화영상 검색과 같은 응용에서 매우 중요한 단계이다. 본 논문에서는 그래디언트 라돈변환을 사용하여 검출한 선분을 이용하여 만화영상의 박스 프레임을 검출하는 방법을 제안한다. 만화영상에서 박스프레임은 여백이 없는 만화영상 내용으로 이루어진 최대 사각영역이다. 만화영상의 크기를 정규화하고, 기울어짐을 없애기 위하여 박스 프레임을 사용하고, 선분 검출 속도를 높이기 위하여 OpenCL로 구현하였다. 제안 방법이 만화영상에서 효과적으로 박스 프레임을 검출함을 실험으로 보였다.