• Title/Summary/Keyword: 비디오기술

Search Result 1,666, Processing Time 0.024 seconds

Video genre classification using Multimodal features (멀티모달 특징을 이용한 비디오 장르 분류)

  • Jin Sung Ho;Bea Tea Meon;Choo Jin Ho;Ro Yong Man;Kang Kyeongok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2003.11a
    • /
    • pp.219-222
    • /
    • 2003
  • 본 논문에서는 멀티모달(multimodal) 특징을 이용한 비디오 장르 식별 방법을 제안한다. 비디오 장르 식별 기술은 방대한 양의 방송 컨텐츠를 보다 효율적으로 분류할 뿐 아니라 자동적인 비디오 요약을 위한 전처리 과정으로 활용될 수 있는 기술이다. 따라서, 그 필요성 및 중요성이 부각되고 있다. 본 논문에서 제안하고 있는 방법은 MPEG-7의 오디오 및 비주얼 서술자들을 적용하여 멀티모달 특징을 추출하고 여러 가지 방송 비디오 장르(genre)들로 구성된 데이터베이스에서 장르 분류를 위해 설계된 인식기(classifier)를 통한 성능을 평가한다.

  • PDF

Design and Implementation of MPEG-4 File Formatter included MPEG-4 System Information, with MOV Compatibility (시스템 정보가 포함된 MOV 호환 MPEG-4 파일 포맷터의 설계 및 구현)

  • 전형국;마평수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.520-522
    • /
    • 2001
  • 본 논문에서 제시하는 시스템은 MPEG-4로 부호화된 비디오/오디오에 대해서 MPEG-4 파일 포맷에 맞는 MPEG-4 파일 생성 포맷터이다. 본 논문에서 설계하고 구현된 파일 포맷터는 전처리 부분, 부호화기 파일 포맷터로 구성된 저작도구의 모듈로서 존재한다. 따라서 본 논문에서는 저작도구에서 사용될 MPEG-4 파일 포맷터의 구조 및 기능에 대해서 선명하고, 포맷터의 세부 설계 사항을 기술한다. 본 논문에서 MPEG-4 파일 포맷터의 기능은 비디오/오디오 인코더로부터 출력되는 비디오/오디오 데이터를 MPEG-4 파일 포맷의 형식에 맞는 MPEG-4 파일을 생성하는 것이다. 생성된 파일은 비디오/오디오 각각에 대한 정보와 생성된 비디오/오디오를 처리할 디코더에 대한 정보를 제공한다. 표준 상의 MPEG-4 시스템에서의 동기화 정보를 파일 포맷상의 비디오/오디오 데이터에 제공하여 , 스트리밍 서비스을 제공하는 서버쪽에서의 동기화 과정과 먹싱을 배제할 수 있게 한다. 비디오/오디오 인코더로부터 생성되는 다양만 종류의 비디오/오디오 데이터를 효율적으로 포맷팅하여 다양한 범위의 응용에서 사용될 수 있게 하며, 차기에 계위화 부호화를 효율적으로 적용시키기 위해 파일 포맷팅을 수행하게 된다.

  • PDF

Enhanced Video Frame Interpolation Transformer based on Optical Flow Guidance (광학 흐름 안내 기반의 향상된 비디오 프레임 보간 트랜스포머)

  • Huh, Jingang;Jeong, Jinwoo;Kim, Sungjei;Yoon, Kihwan;Kwon, Yonghoon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.214-216
    • /
    • 2022
  • 비디오 프레임 보간 기술은 시간 해상도를 증가시키는 기술로 최근 Convolutional Neural Network(이하 CNN) 기반의 다양한 연구가 진행되고 있다. 하지만 일부 시각에서는 CNN 기반의 연구가 동일한 커널을 모든 화소에 적용하는 것과 객체의 움직임을 예측하기 위해 장기간의 데이터를 활용하는 것에 한계점이 있다고 주장한다. 이에 따라 장기간의 데이터 활용에 특화된 트랜스포머 기반의 비디오 프레임 보간 기술이 제안되었다. 본 논문에서는 트랜스포머 기반의 기존 연구에서 합성 네트워크의 성능을 향상시키기 위해 광학 흐름 안내 기반의 새로운 학습 방법을 제안한다 실험 결과를 통해 평균 PSNR 0.09dB와 SSIM 0.0031 성능 향상을 확인한다.

  • PDF

Completion of Occluded Moving Object in a Video Sequence (비디오 영상에서 가려짐이 있는 이동 물체의 복원)

  • Heo, Mi-Kyoung;Park, Soon-Yong
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.281-286
    • /
    • 2007
  • 비디오 복원(video completion)은 비디오 영상에서 색상값에 대한 정보가 없는 픽셀에 적절한 색을 채워 영상을 복원하는 기술이다. 본 논문에서는 움직이는 두 물체가 교차하는 입력영상으로부터 하나의 물체를 제거함으로 발생하는 홀(hole)을 채우는 비디오 복원 기술을 제안한다. 입력 영상에서의 두 물체 중 카메라와 가까운 물체를 제거함으로써 영상의 홀이 발생하게 되고, 이 홀을 다른 프레임들의 정보를 이용하여 채움으로써 가려진 물체를 복원한다. 모든 프레임에 대해 각 물체의 중심을 추정하여 물체의 중심을 기준으로 시-공간 볼륨(spatio-temporal volume)을 생성하고, 복셀 매칭(voxel matching)을 통한 시간적 탐색을 수행한 후 두 물체를 분리한다. 가리는 물체 영역으로 판단 된 부분을 삭제하고 공간적 탐색 방법을 이용하여 홀을 채워 가려짐이 있는 물체를 복원하는 과정을 소개한다. 실험 결과를 통해 제안한 기술이 비교적 자연스러운 결과를 얻을 수 있다는 것을 보여준다.

  • PDF

A Design of H.263+ Codec using VHDL (VHDL을 이용한 H.263+ Codec의 설계)

  • 김은성;김상철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.12-14
    • /
    • 1999
  • H.263+[1]는 1996년에 비디오압축 표준안으로 확정된 H.263의 확장으로 현재 널리 퍼져 있는 저 전송률의 가정용 전화선을 위한 비디오 압축에 관한 표준안으로 1988년에 확정되었다. H.263+의 기본 알고리즘은 H.263과 같으나 사용상의 편의를 위한 여러 선택모드와 이종의 네트워크환경에서 발생하는 대역폭의 변화나 에러를 위한 scalability(계층부호화)와 같은 새로운 기능이 추가되었다. 새로운 표준안에 따른 실시간 비디오 전송을 처리하기 위해서 필연적으로 하드웨어 코덱의 개발 필요성이 대두되고 있으며 실시간 비디오 코덱은 영상회의 전화기나 멀티미디어 전송시스템의 핵심기술로써 적용될 수 있다. 본 논문에서는 ITU-T H.263+의 기본모드와 새로이 추가된 선택모드 일부를 지원하는 코덱을 하드웨어 기술 언어인 VHDL(VHSIC Hardware Description Language)을 사용하여 기술하고 각 모듈과 최상의 모듈을 시뮬레이션하여 동작을 검증했다.

  • PDF

Video Summarization Using Activity Descriptor In Compressed Domain (압축공간에서 활동도 기술자를 이용한 비디오 요약)

  • Yoon, Jin-Sun;Kim, Gye-Young;Choi, Hyung-Il
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.7-10
    • /
    • 2002
  • 본 논문에서는 MPEG-7의 활동도 기술자를 이용한 비디오 기술을 제안한다. 제안한 방법은 압축상태의 비디오 자료에서 직접 움직임 벡터들을 추출, 각 프레임들의 활동도의 강도를 계산하고 프레임의 흐름에 따라 계산된 활동도의 변화량에 대해 퓨리에 변환을 적용하여 얻어진 주파수 성분을 분석하여 활동도의 시간적 분포도를 계산한다. 계산된 강도 및 분포도는 MPEG-7의 표준에 따르기 위해 양자화하여 비디오 요약에 이용한다.

  • PDF

Development of Video Test Pattern and Test Harness for Testing ATSC 3.0 Receivers (ATSC 3.0 수신기 검증을 위한 비디오 패턴 및 시험도구 개발)

  • Kwak, Kyungchul;Yang, Jinyoung;Kwon, Donghyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.328-330
    • /
    • 2019
  • 국내를 시작으로 2020년 북미에서도 ATSC 3.0 기반 차세대 방송 서비스를 준비하고 있는 상황에서, 본 논문은 실제 상용 서비스 수신기를 검증하기 위한 비디오 테스트 패턴과 시험도구를 소개하고 있다. 본 논문에서 소개되는 비디오 테스트 패턴은 단순 수신기에서의 수신을 육안으로 확인하는데 그치지 않고 복호화 성능과 관련된 몇 가지 지표들을 평가할 수 있도록 개발되었다. 시험도구의 구조는 방송망(Broadcast)과 통신망(Broadband)을 이용하여 ATSC 3.0 표준에서 정의하고 있는 다양한 Media Essence(비디오, 오디오, 자막, 시그널링)의 복조화 기능에 초점이 맞춰져 있으며, 방송망과 통신망을 동시에 활용할 수 있는 구조로 구성되어 있다.

  • PDF

A Study on MPEG-4 Based 3D Video Contents Creation Method using Time-of-Flight Sensor (Time-of-Flight 센서를 이용한 MPEG-4 기반의 3 차원 비디오 콘텐츠 생성기법에 관한 연구)

  • Cho, Ji-Ho;Kim, Sung-Yeol;Yoo, Jae Doug;Lee, Kwan H.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.542-545
    • /
    • 2010
  • 본 논문에서는 TOF 카메라를 이용한 3 차원 비디오의 생성하는 방법을 제안한다. 또한 생성된 콘텐츠를 전송 및 재생하기 위해 MPEG-4 멀티미디어 프레임워크를 사용하였다. TOF 센서로 획득한 데이터를 알파매팅 및 깊이 최적화 과정을 거쳐 고품질의 깊이 비디오를 생성하고 MPEG-4 시스템으로 부호화 한 후 전송하여 사용자에게 3 차원 비디오를 제공한다.

The research of transmission delay reduction for selectively encrypted video transmission scheme on real-time video streaming (실시간 비디오 스트리밍 서비스를 위한 선별적 비디오 암호화 방법의 전송지연 저감 연구)

  • Yoon, Yohann;Go, Kyungmin
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.25 no.4
    • /
    • pp.581-587
    • /
    • 2021
  • Real-time video streaming scheme for multimedia content delivery and remote conference services is one of technologies that are significantly sensitive to data transmission delay. Recently, because of COVID-19, real-time video streaming contents for the services are significantly increased such as personal broadcasting and remote school class. In order to support the services, there is a growing emphasis on low transmission delay and secure content delivery, respectively. Therefore, our research proposed a packet aggregation algorithm to reduce the transmission delay of selectively encrypted video transmission for real-time video streaming services. Through the application of the proposed algorithm, the selectively encrypted video framework can control the amount of MPEG-2 TS packets for low latency transmission with a consideration of packet priorities. Evaluation results on testbed show that the application of the proposed algorithm to the video framework can reduce approximately 11% of the transmission delay for high and low resolution video.

Modeling of Video Data for Sffective Content-based Retrival (효율적인 의미 검색을 위한 동영상 데이터 모델링)

  • Jeong, Mi-Yeong;Lee, Won-Seok
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.4
    • /
    • pp.908-922
    • /
    • 1997
  • In this paper,we present an dffcient way to describe the commplex meaning embedded in video data for the cintent-based retrival in a video database.Intead of viewing the data stored in a file as continuous bit stream,we associate the desired interval in the stream with a set of atteibute and value pairs which describe its meaning.Since the meaning of video data can be cimplex and can change dyamically. It is necessary to com-bine the fixed schema of attributes used in the traditional database systrm with a description method through a set of attribute and value pairs that can be defined dynamically.As the cintent of viedo data can be expressed differently according to the view point of a user,it is important ot maintain the meaning of the attribute and value pairs cinsistently for different users.This paper proposes the dffctive way to manage the set of attri-bute and value pairs.In addition,it also describes a way to define a new video presentation by separating a video stream phsycally or by sharing the portion of a bit stream,and the new method can minimize the required storage space.

  • PDF