• 제목/요약/키워드: video sequences

검색결과 543건 처리시간 0.033초

배경 모델 갱신을 통한 코드북 기반의 전배경 분할 (Codebook-Based Foreground-Background Segmentation with Background Model Updating)

  • 정재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권5호
    • /
    • pp.375-381
    • /
    • 2016
  • 최근 코드북 기반의 전 배경 분리 알고리즘에 대한 연구가 활발히 진행되고 있다. 코드북은 입력 영상 시퀀스로부터 화소당 하나씩 만들어 지는데, 코드북 내의 각 코드워드는 동일 위치의 훈련 화소들을 대상으로 양자화를 수행한 클러스터 대표 벡터이다. 일반적인 코드북 기반 방법들은 초기 배경 모델 생성을 위하여 긴 시간동안 훈련 샘플들의 학습 과정을 거친다. 본 논문에서는 초기 몇 장의 프레임으로 부터 간단한 중위수 연산을 통하여 초기 배경 모델을 생성하고, 시간의 흐름에 따라 변화된 배경 정보를 포함할 수 있도록 코드워드의 사용 빈도수에 기반하여 배경 모델을 갱신한다. 제안한 알고리즘을 OpenCV 3.0과 연동하여 C언어로 구현하여 몇 개의 PETS2009 데이터에 적용 실험하였다. 해당 데이터는 준-주기적 움직임을 갖는 영상 시퀀스, 이동 물체의 일시 정지 등의 시나리오를 포함하고 있다. 실험을 통하여 제안한 방식이 GMM 알고리즘, 표준 코드북 알고리즘에 비하여 우수한 성능을 나타내고 있음을 확인하였다.

상황인식 컴퓨팅을 위한 사람 움직임 이벤트 인식 (Recognition of Events by Human Motion for Context-aware Computing)

  • 최요환;신성윤;이창우
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.47-57
    • /
    • 2009
  • 최근 컴퓨터비젼 분야에서 이벤트 검출 및 인식이 활발히 연구되고 있으며, 도전적인 주제들 중 하나이다. 본 논문에서는 사무실 환경에서 발생할 수 있는 이벤트의 검출 및 인식을 위한 방법을 제안한다. 제안된 방법은 MHI(Motion History Image) 시퀀스(sequence)를 이응한 인간의 모션을 분석하며, 사람의 처형과 착용한 옷의 종류와 색상, 그리고 카메라로부터의 위치관계에 불변한 특성을 가진다. 제안된 방법은 기존의 방법들 중, 칼라 정보를 이용한 방법에 비해 조명의 변화에 민감하지 않은 장점이 있으며, 관심의 대상이 되는 객체의 외형과 같은 사전지식에 의존하는 방법에 비해 스케일에 민감하지 않은 장점이 있다. 에지검출 기술을 HMI 순서 영상 정보와 결합하여 사람 모션의 기하학적 특징을 추출한 후, 이벤트 인식의 기본정보로 활용한다. 제안된 방법은 단순한 이벤트 검출 프레임웍을 사용하기 때문에 검출하고자 하는 이벤트의 설명만을 첨가하는 것으로 확장이 가능하다. 또한, 제안된 방법은 컴퓨터비젼 기술에 기반한 많은 감시시스템 뿐 아니라 상황인식 기반의 이벤트 검출 시스템에 핵심기술이다.

효과적인 인터랙티브 비디오 저작을 위한 얼굴영역 기반의 어노테이션 방법 (Annotation Method based on Face Area for Efficient Interactive Video Authoring)

  • 윤의녕;가명현;조근식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.83-98
    • /
    • 2015
  • TV를 보면서 방송에 관련된 정보를 검색하려는 많은 시청자들은 정보 검색을 위해 주로 포털 사이트를 이용하고 있으며, 무분별한 정보 속에서 원하는 정보를 찾기 위해 많은 시간을 소비하고 있다. 이와 같은 문제를 해결하기 위한 연구로써, 인터랙티브 비디오에 대한 연구가 활발하게 진행되고 있다. 인터랙티브 비디오는 일반적인 비디오에 추가 정보를 갖는 클릭 가능한 객체, 영역, 또는 핫스팟을 동시에 제공하여 사용자와 상호작용이 가능한 비디오를 말한다. 클릭 가능한 객체를 제공하는 인터랙티브 비디오를 저작하기 위해서는 첫째, 증강 객체를 생성하고, 둘째, 어노테이터가 비디오 위에 클릭 가능한 객체의 영역과 객체가 등장할 시간을 지정하고, 셋째, 객체를 클릭할 때 사용자에게 제공할 추가 정보를 지정하는 과정을 인터랙티브 비디오 저작 도구를 이용하여 수행한다. 그러나 기존의 저작 도구를 이용하여 인터랙티브 비디오를 저작할 때, 객체의 영역과 등장할 시간을 지정하는데 많은 시간을 소비하고 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 유사한 샷들의 모임인 샷 시퀀스의 모든 샷에서 얼굴 영역을 검출한 샷 시퀀스 메타데이터 모델과 객체의 어노테이션 결과를 저장할 인터랙티브 오브젝트 메타데이터 모델, 그리고 어노테이션 후 발생될 수 있는 부정확한 객체의 위치 문제를 보완할 사용자 피드백 모델을 적용한 얼굴영역을 기반으로 하는 새로운 형태의 어노테이션 방법을 제안한다. 마지막으로 제안한 어노테이션 방법의 성능을 검증하기 위해서 인터랙티브 비디오 저작 시스템을 구현하여 기존의 저작도구들과 저작 시간을 비교하였고, 사용자 평가를 진행 하였다. 비교 분석 결과 평균 저작 시간이 다른 저작 도구에 비해 2배 감소하였고, 사용자 평가 결과 약 10% 더 유용한다고 평가 되었다.

이동형 단말기 사용자를 위한 축구경기 비디오의 시청경험 향상 방법 (Raising Visual Experience of Soccer Video for Mobile Viewers)

  • 안일구;고재승;김원준;김창익
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권3호
    • /
    • pp.165-178
    • /
    • 2007
  • 최근 멀티미디어 신호처리 및 통신 기술의 발전에 힘입어 작은 LCD 패널을 통한 스포츠경기 시청이 증가하고 있다. 하지만 멀티미디어 단말에 방송되는 대부분의 영상들은 주로 경제적인 이유로 일반 TV나 HDTV 용으로 제작되어 단순히 크기만을 변환하거나 추가적인 편집 없이 녹화되고 있는 실정이다. 이는 작은 이동형 단말 사용자들이 경기화면 내의 상황을 인식하는데 있어서 많은 불편함을 겪는다. 예를 들어, 원거리 샷 카메라 기법으로 찍힌 축구 경기 동영상의 경우, 운동장 내의 공과 선수들은 매우 작아서 알아보기가 힘든 경우가 발생한다. 또한 경기 진행 시간이나 점수를 포함하는 점수상자(scorebox)의 내용 역시 시청자가 쉽게 알아보기 힘들다. 따라서 소형 디스플레이 시청자들의 원활한 이해를 위한 지능형 디스플레이 기술이 필요하다. 이를 위한 핵심기술의 하나가 관심 영역을 자동으로 결정하고 확대하여 보여주는 일이다. 여기서 관심영역이란 시청자들이 화면 내에서 다른 부분에 비해 더욱 관심을 갖게 되는 영역을 말하며 축구경기 비디오의 경우, 주로 상단 모서리에 존재하는 점수상자나 원거리 샷에서의 공을 둘러싼 주변영역 등이 해당된다. 본 논문에서 우리는 이동형 단말기 시청자들을 위한 시청경험 향상을 위한 방법을 제안한다. 경기장면에서 관심영역의 추출을 위해 화면 내에서 시각적으로 현저한 부분의 검출에 관심을 갖는 방법 대신, 축구 경기 비디오 고유의 특징을 이용하는 도메인 한정적인 접근법을 이용한다. 제안된 시스템은 크게 두 가지 모듈 관심영역 결정, 점수상자 추출로 구성된다. 실험 결과를 통해 제안된 알고리즘이 이동형 단말기상에서 지능형 디스플레이를 위한 좋은 해결책임을 보이고자 한다.

고화질 확장성을 위한 FGS 코딩 구조의 개선 (An improvement in FGS coding scheme for high quality scalability)

  • 부희형;김승호
    • 정보처리학회논문지B
    • /
    • 제18B권5호
    • /
    • pp.249-254
    • /
    • 2011
  • MPEG-4 파트 2에서 화질 확장성을 지원하는 FGS (fine granularity scalability) 코딩 기법은 가변적인 네트워크 대역폭에서 최적의 화질을 구현할 수 있는 스케일러블 비디오 코딩 기법이다. 본 논문에서는 기본 FGS 코딩 구조의 향상 계층에서, 영상의 잔여 신호를 다시 한 번 더 비트 평면 (bit-plane) 코딩을 해주는 FGS 코딩 구조를 제안하였다. 실험에서는 제안된 FGS 코딩 구조와 MPEG-4 VM (verification model) FGS 코딩 구조를 비교하여 제안된 FGS 코딩 구조의 화질 확장성을 평가하였다. 비교는 테스트된 3개의 비디오의 PSNR의 분석으로 이루어졌다. 결과는 제안된 구조가 비트율 제어 기법 VM5+를 이용했을 때, VM-FGS 코딩 구조보다 Y, U, V PSNR이 평균적으로 각각 0.4 dB, 9.4dB, 9 dB 더 높게 나타났고, QP (quantization parameter) 값을 17로 고정시킨 경우는, 제안된 구조가 4.61 dB, 20.21 dB, 16.56 dB 더 높게 나타났다. 결과에 의해, 제안된 구조가 VM-FGS 코딩 구조보다 최저부터 최대의 화질을 얻을 수 있는 화질 확장성이 더 높은 구조임을 알 수 있었다.

스크린 콘텐츠를 위한 VVC 화면내 삼각형 분할 예측 방법 (VVC Intra Triangular Partitioning Prediction for Screen Contents)

  • 최재륜;권대혁;한희지;이하현;강정원;최해철
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.325-337
    • /
    • 2020
  • VVC(Versatile Video Coding)는 ISO/IEC/ITU-T의 JVET(Joint Video Experts Team)에서 표준화 중인 새로운 비디오 부호화 표준으로 스크린 콘텐츠 부호화 툴을 포함한 다양한 기술을 채택하고 있다. 스크린 콘텐츠는 문자 영역과 같이 사선 방향 에지가 자주 발생하는 특징을 가지며, 이런 특징을 갖는 영상에 삼각형 형태의 분할 부호화를 적용하면 압축 효율이 증가할 수 있다. 본 논문에서는 스크린 콘텐츠를 위한 VVC 기반 화면내 삼각형 분할 예측 방법을 제안한다. 기존 VVC의 화면간 예측 부호화에서 삼각형 분할 예측을 지원하는 Triangular Prediction Mode 방법과 유사하게, 제안 방법은 화면내 예측 부호화에서 수직과 수평 방향 예측 모드와 주변 복원 참조 라인을 이용하여 두 개의 사각형 예측 블록을 생성하고 삼각형 모양의 마스크로 두 예측 블록을 가중합하여 최종 예측 신호를 만든다. 제안 방법의 실험 결과는 All Intra 스크린 콘텐츠 영상 실험에서 YUV 각각 평균 1.86%, 1.49%, 1.55% 부호화 성능향상을 보이고, 자연 영상 실험 조건에서는 부호화 효율에 미미한 손실을 보였다. 결론적으로, 화면내 예측 부호화 모드에 제안 방법을 적용하여 압축 성능을 향상할 수 있었다.

커널상관필터를 이용한 소형무인기 추적 (Small UAV tracking using Kernelized Correlation Filter)

  • 선선구;이의혁
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.27-33
    • /
    • 2020
  • 최근 영상 센서를 이용한 물체 탐지 및 추적 기술은 많은 응용분야에서 그 사용이 널리 확대되고 있다. 민수 산업 분야에서 로보틱스, 비디오 감시정찰 및 차량 네비게이션 분야와 같은 영역으로 널리 확대되고 있는 추세이다. 특히, 드론의 사용이 널리 확대되고 있는 현 상황에서 공항, 원자력 발전소 및 중요시설에서는 불법적으로 운용되고 있는 소형무인기를 탐지 및 추적하여 격추시키는 시스템 개발이 매우 중요하다. 최근 영상센서를 활용한 물체 추적 방법으로 이목을 끌고 있는 방법이 학습에 기반을 둔 KCF 방법이다. 그러나 이 방법은 추적 기간이 길어지면 추적 과정에서 표적의 드리프트가 발생하는 문제점이 있다. 비디오 감시정찰 분야에서 표적의 드리프트 문제를 줄이기 위해 우리는 KCF와 적응 임계치설정 및 칼만필터를 적용하여 표적 드리프트 문제를 줄일 수 있는 방법을 제안하였다. 실험을 통해서 실제 무인비행체가 운용되는 실제 환경에서 획득된 흑백 비디오 영상에 제안한 방법과 기존의 KCF 알고리즘을 비교하여 제안한 방법의 우수성을 입증하였다.

해안 디지털 비디오를 이용한 쇄파지역에서의 파랑궤적 측정 (Remote Sensing of Wave Trajectory in Surf Zone using Oblique Digital Videos)

  • 유제선;신동민;조용식
    • 한국해안·해양공학회논문집
    • /
    • 제20권4호
    • /
    • pp.333-341
    • /
    • 2008
  • 본 연구에서는 해안 디지털 비디오를 이용하여 쇄파지역에서의 파랑궤적을 원격으로 측정하는 기술을 제안한다. 쇄파에 의해 발생하는 거품은 비디오 이미지로부터 파랑속성을 측정하는데 큰 오차를 야기한다. 이러한 이유로, 본 연구는 이미지 상에서 파랑신호와는 다른 거품 노이즈를 제거하기 위한 고급 영상처리기술과 쇄파지역에서 파랑속성을 효과적으로 측정하는데 필요한 파랑궤적을 검출하는 방법에 초점을 두고 있다. 이를 위하여 본 연구는 100 m 이상 거리범위의 쇄파지역에서 3 Hz 주파수로 촬영한 해안 비디오 자료를 이용한다. 비디오 원 영상으로부터 고주파수의 특성을 가지는 거품신호를 제거하기 위하여 이미지 프레임 후방차분과 방향성 로패스 이미지 필터를 통하여 비디오 이미지를 영상처리한다. 개별의 쇄파 파랑궤적은 레이돈 변환 선인식 알고리듬을 이용하여, 거품 노이즈가 제거된 해안선 수직방향 이미지 Timestack상에 적용하여 검출된다. 이 이미지 Timestack의 물리적 공간차원은 2차원 공간-시간 도메인으로 표현된다. 비디오 자료로부터 측정된 유효 파랑궤적의 개수는 실측자료로부터 얻어진 파랑개수의 약 2/3이다.

적외선 비디오에서 Haar 웨이블릿과 이동평균을 이용한 화염검출 (Flame Detection Using Haar Wavelet and Moving Average in Infrared Video)

  • 김동근
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.367-376
    • /
    • 2009
  • 본 논문은 적외선 영상에서 Haar 웨이블릿과 이동평균을 이용한 화염검출 방법을 제안한다. 제안된 방법은 Haar 웨이블릿 변환 단계, 화염 후보영역 검출단계, 화염후보영역 추적 및 화염 판단의 3단계로 구성된다. Haar 웨이블릿 변환 단계는 Haar 웨이블릿을 적용하여 입력영상 프레임을 4개의 부영상으로 분할하고, 고주파 영상을 합성하여 에너지를 계산한다. 화염 후보영역 검출단계에서는 저주파영역에서 임계값을 적용하여 높은 밝기 값을 갖는 이진영상을 구한 다음, 연결 알고리즘을 이용하여 초기 화염후보영역의 경계선을 구하고, 영역확장 방법을 이용하여 최종 화염 후보영역을 계산한다. 화염후보영역의 추적 및 화염 판단 단계에서는 화염후보영역의 크기와 고주파 성분 에너지 평균을 계산하고, 큐를 사용하여 추적하면서, 계산된 특징의 이동평균이 변동되는 영역을 화염영역으로 판단한다.

다시점 동영상 부호화를 위한 가변형 다시점GOP 예측 구조 (Flexible GGOP prediction structure for multi-view video coding)

  • 윤재원;서정동;김용태;박창섭;손광훈
    • 방송공학회논문지
    • /
    • 제11권4호
    • /
    • pp.420-430
    • /
    • 2006
  • 본 논문에서는 다시점 동영상 부호화를 위한 참조 소프트웨어의 부호화기 성능을 높이기 위해 가변형 다시점GOP 예측 구조로 부호화 하는 방법을 제안한다. 다시점 동영상 부호화를 위한 참조 소프트웨어에서는 고정된 시공간 예측구조를 사용하여 다시점 동영상을 부호화한다. 그러나 다시점 동영상 부호화의 성능은 영상의 특성에 따라 예측 부호화 구조를 가변적으로 변경하는 것에 영향을 받는다. 따라서 다시점 동영상의 전역 변이를 이용하여 부호화의 기준 시점을 정하고 카메라 간의 간격을 고려하여 B-픽쳐의 개수를 조절하여 영상의 특성에 따라 다시점 동영상의 부호화 단위인 다시점GOP 예측 구조를 가변적으로 적용하는 방법을 제안한다. 실험 결과에서 제안된 가변형 다시점GOP 예측구조의 부호화 방법이 기존의 참조 소프트웨어보다 우수한 성능을 보여줌을 확인하였다. 제안 예측 부호화 구조는 기존의 부호화 구조와 비교하여 7.1%의 비트량 감소를 보였다.