• 제목/요약/키워드: 비디오 분류

검색결과 277건 처리시간 0.021초

영상 데이터베이스 검색을 위한 Temporal texture 모델링의 성능분석 (Performance Analysis of Temporal Texture Modeling for Image Database Retrieval)

  • 홍지수;김도년;김영복;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1661-1664
    • /
    • 2000
  • 내용 기반의 비디오 검색에 있어 텍스처는 중요한 변수로 사용될 수 있다. 모든 물체의 표면은 독특한 성질을 보유하고 있으므로, 텍스처는 형상이나 색과 더불어 중요한 변수로 사용될 수 있다. 어떤 영상의 특징을 올바르게 추출하고 잘 분류하여 표현하는 것은 비디오 검색에 있어서 매우 중요하다. Temporal texture는 무한한 시공간적 범위의 복잡하고, 추상적인 움직임 패턴이며 자연 세계에 흔히 나타난다. 그러므로 이를 특징화시킬 수 있고, temporal texture 패턴을 얼마나 잘 이용할 수 있느냐는 비디오 검색의 성능에 많은 영향을 끼칠 수 있다. 본 논문은 temporal texture 모델링들 중 서로 다른 특징을 가진 세 가지의 모델을 선정하여 비교, 분석한다. 특히, 특징 추출의 분류가 정확하게 이루어지느냐에 초점을 맞추어서 분석하였다. 분류의 성능은 두 가지 변수 즉, 어떤 성질의 모델이며 비디오 데이터인가에 따라 달라지게 된다. 이들 모델링이 분류하기까지 걸리는 시간의 차이는 무시할 수 있을 정도의 시간차이므로, 정확도를 위주로 성능을 분석했다.

  • PDF

멀티모달 특징을 이용한 비디오 장르 분류 (Video genre classification using Multimodal features)

  • 진성호;배태면;추진호;노용만;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.219-222
    • /
    • 2003
  • 본 논문에서는 멀티모달(multimodal) 특징을 이용한 비디오 장르 식별 방법을 제안한다. 비디오 장르 식별 기술은 방대한 양의 방송 컨텐츠를 보다 효율적으로 분류할 뿐 아니라 자동적인 비디오 요약을 위한 전처리 과정으로 활용될 수 있는 기술이다. 따라서, 그 필요성 및 중요성이 부각되고 있다. 본 논문에서 제안하고 있는 방법은 MPEG-7의 오디오 및 비주얼 서술자들을 적용하여 멀티모달 특징을 추출하고 여러 가지 방송 비디오 장르(genre)들로 구성된 데이터베이스에서 장르 분류를 위해 설계된 인식기(classifier)를 통한 성능을 평가한다.

  • PDF

비디오기반 사람의 모션 검출 (Video Based Human Motion Detection)

  • 이창수;박연출;박세준;오해석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.879-883
    • /
    • 2000
  • 비디오 기반 사람의 모션 캡쳐에 관한 연구는 최근 몇 년 동안 컴퓨터 비전분야에서 폭넓은 연구가 진행되어지고 있다. 본 논문은 비디오 기반으로 사람의 모션을 전체 프레임이 진행되는 동안 프레임 별로 디스플레이 한다. 첫 프레임에서 비디오 세그멘테이션 과정에서 샷을 검출하고 이를 이용하여 객체를 분류한다. 분류된 객체에서 사람의 영역을 추출한다. 추출된 영역은 다음 프레임의 위치를 예측하게 된다.

  • PDF

화자 인식을 통한 등장인물 기반의 비디오 요약 (Character-Based Video Summarization Using Speaker Identification)

  • 이순탁;김종성;강찬미;백중환
    • 융합신호처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.163-168
    • /
    • 2005
  • 본 논문에서는 인물 기반의 비디오 요약 방법으로써 비디오 내 음성정보를 이용하여 화자 인식 기법을 통한 등장인물 중심의 요약 기법을 제안한다. 먼저, 얼굴 영역을 포함하는 장면을 중심으로 비디오로부터 배우의 대사에 해당하는 음성 정보를 분리하고, 화자 인식 기법을 수행하여 등장인물 별로 분류하였다. 화자인식 기법은 각 화자별로 MFCC(Mel Frequency Cepstrum Coefficient) 값을 추출하고 GMM(Gaussian Mixture Model)을 이용하여 분류한다. 본 논문에서는 4명의 등장인물에 대해 GMM을 학습시키고 4명 중 1명을 검출하는 실험을 통해 학습된 GMM 분류기가 실험 비디오에 대해 0.138 정도의 오분류율을 보임을 확인하였다.

  • PDF

오디오와 영상 정보를 이용한 비디오 세그먼테이션 및 크래시피케이션 (Segmentation and Classification Using Audio and Image Information)

  • 정해준;정성환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.891-894
    • /
    • 2000
  • 본 논문에서는 효과적인 내용기반 비디오 검색을 위한 샷 경계 검출, 장면 경계 검출, 그리고 비디오 크래시피케이션 방법을 연구하였다. 먼저, 샷 경계 검출을 위해 칼라 히스토그램과 DCT 변환 계수를 통합하여 사용했다. 그리고 장면 경계 검출을 위해서는 영상 정보뿐만 아니라 오디오 정보를 함께 사용하여 장면 경계를 검출하였다. 또한 비디오 크래시피케이션에서는 장면 경계검출시 추출한 오디오 정보를 이용해 비디오를 내용별로 분류하는 연구를 제안하였다. 뉴스, 광고, 스포츠 등 다양한 3개 분야의 TV 프로그램으로 구성된 약 8,500개 영상 프레임과 약 50,000개의 오디오 프레임을 가진 실험 비디오 데이터베이스를 구성하여 제안된 시스템을 실험하였다. 실험한 결과, 약 88%의 정확도(Precision)를 가지는 장면 경계 검출과 약 85%의 평균 분류율을 보였다.

  • PDF

HEVC 비디오 영상 압축 왜곡 제거를 위한 Generative Adversarial Network 적용 기법 (Generative Adversarial Network based CNN model for artifact reduction on HEVC-encoded video)

  • 전진;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.192-193
    • /
    • 2017
  • 본 논문에서는 비디오 영상 압축 왜곡 제거를 위해 Generative Adversarial Network (GAN)을 적용한 컨벌루션 뉴럴 네트워크 (CNN) 모델을 제안한다. GAN 모델의 생성 모델 (Generator)은 노이즈가 아닌 High Efficiency Video Coding (HEVC)로 압축된 영상을 입력 받은 뒤, 압축 왜곡이 제거된 영상을 출력하며, 분류 모델 (Discriminator)은 원본 영상과 압축된 영상을 입력 받은 뒤, 원본 영상과 압축 왜곡이 포함된 압축된 영상을 분류한다. 분류 모델은 5 개 층을 쌓은 컨벌루션 뉴럴 네트워크 구조를 사용하였고, 생성 모델은 5 개 층을 쌓은 SRCNN 구조와 VDSR 구조를 기반으로 한 두 개의 모델을 이용한 실험을 통해 얻은 결과를 비교하였다. 비디오 영상 압축 왜곡 제거 실험을 위해 원본 비디오 영상을 HEVC 을 이용하여 2Mbps, 4Mbps 로 압축된 영상을 사용하였으며, 압축된 영상 대비 왜곡이 제거된 영상을 얻을 수 있었다.

  • PDF

농구 비디오에서 특정 음성 특징 추출에 관한 연구 (A Study on the Extraction of Specific Audio Feature In Basketball Video)

  • 공현장;김원필;김판구
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.1075-1080
    • /
    • 2002
  • 최근 멀티미디어 정보 시스템에서의 음성 핀 시각적 내용의 분류에 관한 연구가 활발히 진행되고 있다. 이에 본 논문에서는 농구 경기의 비디오 데이터로부터 특정 음성 정보를 추출하는 방법과 이를 농구 게임의 중요 이벤트 검출에 이용하는 방법을 제안한다. MFCC 특징들과 LPC 엔트로피의 조합을 이용하여 검출된 관중들의 환호 소리로부터 중요한 이벤트의 위치를 예측할 수 있다. 농구 경기의 다양한 소리들 중에서 관중들의 환호 소리를 분류하여 이를 농구 비디오 데이터에서 중요한 이벤트들을 검출하는데 사용함으로써 매우 효과적 결과를 얻을 수 있었다.

  • PDF

인간 캐릭터 포즈 식별: FPS 게임에서의 포즈 추정 기법 (Pose Estimation Techniques for Humanoid Characters in FPS Gaming Environments)

  • 한유정;이민섭;차민수;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.29-30
    • /
    • 2024
  • 본 논문은 Krafton의 PUBG: BATTLEGROUNDS 게임에서 플레이어 분류를 목표로 하며, 포즈 추정기술을 사용하여 일반 플레이어와 봇을 구분한다. 이는 게임에서 직접 수집한 비디오 데이터를 기반으로 하며, 다음과 같은 두 가지 접근 방식을 제안한다. 첫 번째 방법은 동작 시퀀스 분석을 통해, 사용자의 특정동작 패턴을 식별하고 로지스틱 회귀 모델을 활용해 사용자 유형을 분류한다. 두 번째 방법은 YOLO-pose 모델을 사용하여 비디오 데이터에서 키포인트를 추출하고, 이를 LSTM 모델에 적용하여 프레임별로 사용자의 유형을 분류한다. 이러한 이중 접근 방식은 게임의 공정성과 사용자 경험을 향상시키는 새로운 도구를 제공하며, 보다 안전한 게임 환경에 기여할 수 있다. 이 연구는 게임 산업뿐만 아니라 보안 및 모니터링 분야에서도 동작 분석에 대한 혁신적인 접근 방식으로 활용될 잠재력을 가지고 있다.

  • PDF

스포츠 장르 분석을 위한 스포츠 뉴스 비디오의 의미적 장면 분류 (Semantic Scenes Classification of Sports News Video for Sports Genre Analysis)

  • 송미영
    • 한국멀티미디어학회논문지
    • /
    • 제10권5호
    • /
    • pp.559-568
    • /
    • 2007
  • 앵커 장면 검출은 내용기반 뉴스 비디오 색인과 검색 시스템에서 비디오 장면의 의미적 파싱과 색인을 추출하는데 중요한 역할을 한다. 이 논문은 스포츠 뉴스의 단위 구조화를 위해서 뉴스 동영상에 존재하는 앵커 구간을 구분해내는 효율적인 알고리즘을 제안한다. 앵커 장면을 검출하기 위해서, 우선 MPEG4 압축 비디오에서 DCT 계수치와 모션 방향성 정보를 이용하여 앵커 후보 장면을 결정한다. 그리고 검출된 후보앵커 장면으로부터 영상처리 방법을 활용하여 뉴스 비디오를 앵커 장면과 비앵커(스포츠) 장면으로 분류한다. 제안된 방법은 앵커 장면 검출 실험에서 평균적으로 98%의 정확도와 재현율을 얻었다.

  • PDF

MPEG 비디오 소스의 특성화 및 트래픽 모델링에 관한 연구 (A study on the characterization and traffic modeling of MPEG video sources)

  • 전용희;박정숙
    • 한국정보처리학회논문지
    • /
    • 제5권11호
    • /
    • pp.2954-2972
    • /
    • 1998
  • 광대역 종합정보 통신망에서 주문형 비디오 서비스 등의 멀티미디어 서비스가 본격적으로 도입됨에 따라 압축된 비디오의 전송이 전체 통신망 트래픽의 상당 부분을 차지할 것으로 기대된다. 가변 비트율로 부호화된 비디오가 통계적 이득과 일정한 비디오 품질을 제공할 수 있는 장점 때문에 많이 사용이 될 것이다. 비디오 트래픽을 전송하기 위해서는 음성 및 데이터 보다 많은 대역폭을 요구하기 때문에 ATM 통신망에서의 적절한 자원 할당 기법의 설계를 위하여 비디오 소스의 특성화와 트래픽 모델링은 아주 중요하다. 그리고 셀 손실, 지연 및 지터 등과 같은 성능 척도를 분석하기 위하여도 적절한 통계적 소스 모델이 필요하다. 본 논문에서는 MPEG 비디오 소스에 대한 특성화와 트래픽 모델링에 대하여 분석 기술하였다. 모델들을 크게 두 가지 즉, 통계적 모델과 결정적 모델로 분류하였다. 통계적 모델에서는 AR(autoregnessive), Markov, Markov와 AR의 복합, TES, 그리고 자기유사 모델로 분류하였다. 결정적 모델에서는 $({\sigma},\;{\rho}$, 매개변수화된 모델, D-BND, Empirical Envelopes 모델로 분류하였다. 각 모델들에 대한 특성, 장점 및 단점을 분석하고, 각 모델의 복잡도에 대하여 비교 분석하였다.

  • PDF