• 제목/요약/키워드: 비디오 분류

검색결과 275건 처리시간 0.021초

장면전환 탐지와 예측을 통한 비디오 자료의 전송 제어 (Transmission Control of Video Data through Prediction and Shot Transition Detection)

  • 이근수;김원
    • 인터넷정보학회논문지
    • /
    • 제5권6호
    • /
    • pp.59-66
    • /
    • 2004
  • 본 논문에서는 MPEG 비디오 데이터를 GoP 단위로 분할하여 장면전환 특성을 파악하고 그에 따라 칼만필터를 사용하여 비디오 데이터의 전송량을 예측하는 방법을 제안하고자 한다. 비디오 데이터의 정확한 장면전환을 파악하기 위해서 압축 도메인에서 고속으로 장면에 대한 정보를 검출하는 알고리즘을 사용하여 급진적 장면전환 유형과 점진적 장면전환 유형으로 분류하였다. 분류된 정보는 칼만필터의 세부 인자로 사용되어 비디오 데이터의 전송량을 예측한다. 본 논문에서 제안한 방법은 압축 도메인에서 장면전환 탐지와 비디오 데이터의 전송량을 예측하여 처리 시간을 감소시키고자 하였다. 세 종류의 서로 다른 비디오 데이터 911개의 1프레임을 사용한 실험에서 96.2- 97.6%로 전송량을 예측하였다.

  • PDF

비디오에서 소매치기의 분류에 관한 연구 (A Study on Classification of Pickpocket in Video)

  • 이양원;신광성
    • 한국산업정보학회논문지
    • /
    • 제17권7호
    • /
    • pp.95-100
    • /
    • 2012
  • 현대의 범죄는 날로 치밀해지고 있으며 수법 또한 매우 교묘하다. 범죄 중에서 절도죄인 소매치기는 대부분 붐비거나 혼잡한 곳에서 발생한다. 그러나 현재에는 인적이 드문 한적한 곳에서 더 많이 발생하고 있다. 본 논문에서는 소매치기의 수법과 종류에 대하여 알아본다. 그리고 비디오를 분류하여 현실적으로 제출하기 위하여 서있는 경우, 앉아있는 경우, 그리고 누워있는 경우로 분류한다. 이는 소매치기를 대상으로 영상 포렌식의 증거 자료로 제출하기 위하여 분류하는 것이다. 본 논문은 소매치기 예방은 물론 소매치기 범죄의 대처를 위해서 반드시 필요하다고 사료된다.

비디오 셧으로부터 영역, 모션 및 퍼지 이론을 이용한 계층적 대표 프레임 선택 (Hierarchical Keyframe Selection from Video Shots using Region, Motion and Fuzzy Set Theory)

  • 강행봉
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권5호
    • /
    • pp.510-520
    • /
    • 2000
  • 내용 기반의 비디오 인덱싱 및 검색을 위해서는 비디오 데이타를 셧(shot)으로 분할하고, 또 각 셧을 나타내는 대표 프레임을 선택하는 것이 필요하다. 하지만, 대표 프레임을 선택하는 것은 주관적이어서 일관되게 자동적으로 대표 프레임을 선택하는 것은 쉬운 문제가 아니다. 본 논문에서는 각 프레임에서의 영역을 바탕으로한 컨텐트 정보 및 시간 축 상의 변화를 이용하여 계층적으로 대표 프레임을 선택하는 방법을 제안한다. 먼저, 비디오 셧에서 카메라 모션을 검출하여 이에 따라 비디오 셧을 분류한다. 다음, 분류된 비디오 셧에 컨텐트의 중요도를 계산하기 위한 퍼지 규칙을 적용하여 대표 프레임을 선택한다. 끝으로, 선택되는 대표 프레임의 수는 브라우징 상세도(detailness)에 따라 계층적으로 선택되게끔 한다.

  • PDF

자동차 멀티미디어 시스템에서의 사진과 음악을 이용한 음악스토리 비디오 자동생성 기술 (Automatic Music-Story Video Generation Using Music Files and Photos in Automobile Multimedia System)

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제9권5호
    • /
    • pp.80-86
    • /
    • 2010
  • 본 논문에서는 차량 내의 멀티미디어 시스템에 장착되는 엔터테인먼트 기능 중의 하나인 음악스토리 자동생성 기술을 소개한다. 음악스토리 비디오 자동생성 기술은 개인이 소지하고 있는 휴대폰을 차량 내의 멀티미디어 시스템과 연결하여, 휴대폰 안에 저장된 음악과 사진의 결합을 통해 음악비디오를 자동으로 생성하는 멀티미디어 요소기술로서, 사용자에게 분위기에 맞게 음악을 들으면서 생성된 음악스토리 비디오를 즐기는 기능을 제공한다. 음악스토리 비디오 자동생성 기술에 대한 성능은 음악분류, 사진분류, 핵심단어 검출 등의 정확도와 생성된 음악스토리 비디오를 시청한 사용자의 MOS 결과를 통해 측정되었다.

칼라 정보를 이용한 비디오 데이터에서의 감정 분석 (Emotional analysis in video data using color information)

  • 전성호;강행봉
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.725-728
    • /
    • 2003
  • 사용자의 감정에 관련된 정보를 처리하는 것은 인간과 컴퓨터와의 상호작용(HCI)에 있어서 매우 중요한 역할을 한다. 특히 비디오 데이터에 대한 사용자의 감정을 처리하는 것은 비디오 검색이나 요약본 구성에 매우 중요하다. 사용자의 감정을 처리하기 위해서는 감정에 관련된 특징들을 추출 및 측정하고 이를 기반으로 비디오 장면을 분류하는 것이 필요하다. 본 논문에서는 칼라 정보를 바탕으로 Fisher의 Linear Discriminant Analysis 방식 및 Mahalanobis Distance 측정을 이용하여 기본 감정의 분류 방식을 제안한다. 공포 감정의 경우 77.8%의 의미 있는 결과를 얻었다.

  • PDF

DVD/HD-DVD 비디오의 결함 복구 알고리즘 (Recovering from Disc Defects in DVD/HD-DVD Video)

  • 강세희;이인환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.295-300
    • /
    • 2006
  • DVD 비디오와 차세대 DVD의 한 진영인 HD-DVD 비디오 디스크는 다른 광 디스크와 마찬가지로 스크래치와 같은 결함이 발생할 수 있다. 결함은 물리적/논리적 원인에 따라 분류 가능하다. 결함은 디스크의 내부구조(네비게이션 데이터와 프리젠테이션 데이터)의 위치에 따라 각각 다른 이상 동작 현상을 발생 시킨다. 본 논문에서는 결함으로 인한 이상 동작 현상을 분류하고, 복구 또는 회피 할 수 있는 알고리즘을 제안하여 DVD/HD-DVD 비디오 디스크를 사용하는데 있어 결함으로 인한 불편함을 최소화하는데 목적이 있다.

  • PDF

훈련 샘플 수집을 통한 온라인 학습 기반 사람 추적 방법 (Online Learning based Human Tracking by Collecting Training Samples)

  • 길종인;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.19-20
    • /
    • 2016
  • 비디오로부터 객체를 검출하기 위해서는 오프라인에서 미리 객체를 검출할 수 있는 분류기가 학습되어있어야 한다. 이러한 분류기는 훈련에 사용된 훈련 집합에 매우 의존적이어서, 다양한 환경의 비디오 영상에 모두 적용할 수 있는 분류기의 설계는 불가능하다. 또한 분류기의 학습을 위해서는 상당히 많은 수의 훈련 집합이 필요하므로, 이는 신뢰도 높은 분류기 학습을 위한 높은 비용을 초래한다. 본 논문에서는 이러한 문제를 해결 할 수 있는 온라인 학습 기반 사람 추적 방법을 제안한다. 실험 영상으로부터 적절하게 훈련 집합을 수집함으로써 해당 실험 영상에 최적화된 분류기의 학습이 가능하며, 다양한 환경의 영상에 적용적으로 설계될 수 있다.

  • PDF

의미적 개념 기반 비디오 트랜스코딩 방법 및 시스템 (Semantic Concept-based Video Transcoding Method and System)

  • 정용주;김영석;;노용만;김태희;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2004년도 정기총회 및 학술대회
    • /
    • pp.59-63
    • /
    • 2004
  • 본 논문에서는 다양한 사용자 환경에서 비디오의 범용적인 서비스를 위한 다차원 비디오 트랜스코딩의 판단에 관하여 논한다 효율적인 판단을 위해 여러 영화 비디오 클립들을 비슷한 의미적 개념을 가지는 비디오들과 비슷한 장면 복잡도를 가지는 비디오들로 분류하고, 각 종류별로 주관적인 테스트(subjective test)를 실시하여 비디오 트랜스코딩에 있어서 사용자인지(perception)의 특성을 분석한다. 이렇게 분석된 인간의 시각 특성들을 이용해 비디오 트랜스코딩 판단 궤적(trajectory)을 만들고 이를 다차원 비디오 트랜스코딩 판단 시에 적용하기 위한 방법을 제안한다.

  • PDF

딥러닝 기반 비디오 프레임 보간 기술 연구 동향

  • 허진강;윤기환;김성제;정진우
    • 방송과미디어
    • /
    • 제27권2호
    • /
    • pp.51-61
    • /
    • 2022
  • 비디오 프레임 보간 기술은 연속되어 있는 두 개의 프레임 사이의 중간 프레임을 생성하는 기술로 비디오의 프레임율을 늘리거나 슬로우 모션 영상을 생성 시 사용된다. 최근 딥러닝 기술의 발전에 따라 다양한 알고리즘의 비디오 프레임 보간 기술이 연구되고 있다. 본 고에서는 이러한 기알고리즘들을 커널 기반 방식과 플로우 기반 방식으로 분류하고, 각 범주에 속하는 대표적인 알고리즘들의 특징 및 한계점에 대해 살펴본다.

분산 기반의 Gradient Based Fuzzy c-means 에 의한 MPEG VBR 비디오 데이터의 모델링과 분류 (Modeling and Classification of MPEG VBR Video Data using Gradient-based Fuzzy c_means with Divergence Measure)

  • 박동철;김봉주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.931-936
    • /
    • 2004
  • GPDF(Gaussian Probability Density Function)을 효율적으로 군집화할 수 있는 GBFCM(DM)(Gradient Based Fuzzy c_means with Divergence Measure) 알고리즘이 본 논문에서 제안되었다. 제안된 GBFCM(DM)은 데이터 사이의 거리 척도로 발산거리(Divergence measure)를 적용한 새로운 형태의 FCM으로, 기존의 GBFCM에 기반을 두는 알고리즘이다. 본 논문에서는 MPEG VBR 비디오 데이터를 GPDF형태의 다차원 데이터로 변형시켜 모델링 하고, 모델링 한 MPEG VBR 비디오 데이터를 영화 또는 스포츠 형태로 분류하는데 응용되었다. 본 논문의 실험에서 기존의 FCM, GBFCM과 새롭게 제안된 GBFCM(DM)을 사용하여 모델링 및 분류결과를 상호 비교하였다. 비교결과 GBFCM(DM)이 오분류율의 기준에서 기존의 다른 알고리즘들에 비해 약 5∼l5%의 향상된 성능을 보였다.