• 제목/요약/키워드: MPEG-4 scene

검색결과 79건 처리시간 0.023초

MPEG의 다차원 분석을 통한 디졸브 구간 검출 : I, P프레임의 DCT-R값을 이용 (Detecting Dissolve Cut for Multidimensional Analysis in an MPEG compressed domain : Using DCT-R of I, P Frames)

  • 허정;박상성;장동식
    • 융합신호처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.34-40
    • /
    • 2003
  • 본 논문에서는 비디오 장면전환 효과 중 디졸브(dissolve)에 의한 점진적인 장면전환 구간을 검출하는 알고리즘을 제안한다. 제안한 알고리즘은 처리의 효율성과 MPEG Sequence의 최소한의 복원과정을 위해 Ⅰ, P 프레임의 Color-R값에 대한 DCT계수를 사용하였다. 인간의 시각으로는 비디오의 장면전환점을 쉽게 구분해 낼수 있듯이 컴퓨터가 인식하기 쉽도록 영상을 3차원으로 시각화하고 분석하여 장면전환 구간을 검출하였다. 우선 각각의 영상에서 Color-R에 대한 DCT계수를 추출하고 블록단위인 8*8단위 열의 합을 구해 다시 프레임에 대한 행을 4단계로 분할하여 특징치를 분석하고 4단계의 샷 특징치를 통합하여 샷을 검출한다. 실험결과 제안한 방법이 영상의 단일 특징치를 사용한 방법보다 4단계의 특징치 분석을 사용함으로서 더 좋은 성능을 나타내었다 또한 Ⅰ, P 프레임의 Color-R값의 부분적 복원과정으로 계산시간을 절약할 수 있었다.

  • PDF

MPEG-4 비디오 코딩을 위한 Scene Level Rate Control 알고리즘 (Scene Level Rate control Algorithm for MPEG-4 Video Coding)

  • 김용욱;신윤식;허도근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.37-40
    • /
    • 2002
  • MPEG-4 부호화기는 16×16 픽셀로 이루어진 매크로 블록을 기본 단위로 하는 비디오 객체에 대해 움직임 추정과 움직임 보상을 수행한다. 이때 이전 블록과 현재 블록간의 차이를 8×8 블록으로 BCT하여 압축한다. DCT는 영상 신호의 에너지를 낮은 대역으로 집중시켜 낮은 에너지를 갖는 고주파 성분을 제거하여 정보를 압축하므로 복원된 영상은 블록의 경계선이 표시되는 블록킹 현상이 발생한다. 본 논문에서는 4×4 블록과 8×8 블록을 이용하여 DCT하는 가변 블록 변환 방식을 사용한다. 이는 작은 크기의 블록을 사용하므로 블록내 주파수의 분포를 비교적 좁은 영역으로 변환할 수 있어 블록킹 현상을 줄일 수 있다. 또한 INTRA 프레임의 DCT 과정에서 4개의 DCT 변환 블록중 하나를 이웃하는 블록의 DC 계수와 화소값들을 이용하여 그 값을 예측하여 DCT계수를 결정하고 INTER 프레임에서는 간략화된 정수 DCT의 사용과 작은 블록단위의 작업으로 인한 부호화의 부담을 줄인 다.

  • PDF

MPEG-4 LASeR 장면기술을 활용한 효율적인 EPG 서비스 제공 방법 (Effective EPG service on the basis of using MPEG-4 LASeR scene description)

  • 박용철;김병철;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.188-191
    • /
    • 2011
  • 본 논문에서는 MPEG-4 LASeR (Lightweight Application Scene Representation) 장면기술을 활용하여 효과적인 EPG(Electronic Program Guide) 서비스를 제공하는 방안을 제안한다. EPG는 텔레비전 방송 프로그램의 편성표를 텔레비전 화면상에 표시하는 것으로, 텔레비전을 시청하는 사람은 이 편성표를 통해 원하는 프로그램을 선택하거나 시간, 제목, 채널, 장르 등을 기준으로 원하는 프로그램을 검색할 수 있는 서비스를 말한다. 국제 표준 규격인 MPEG-4에는 장면의 동적인 업데이트를 위해 다양한 명령을 포함한 장면 서술정보를 제공 할 수 있는 LASeR 기술을 제공하고 있다. 특히, LASeR 표준은 구조화된 정보의 표현 및 수정 방법을 제공하기 위한 방법으로 PMSI (Presentation Method & Structured Information)를 제정하였으며, 해당 기술은 장면 서술정보에서 구조화된 정보의 일부분을 참조하여 장면에 효과적으로 표현하는 것을 가능하게 해 준다. 본 논문에서는 MPEG-4 LASeR PMSI를 기존의 텍스트 중심의 단순 EPG에 적용하여 텍스트 뿐만이 아닌 이미지 비디오 등의 멀티미디어 데이터를 활용하여 보다 동적으로 EPG 서비스를 제공하는 방법에 대하여 제안한다.

  • PDF

MPEG 영상에서의 점진적 장면전환에 대한 효과적인 검출 기법 (Effective Detection Techniques for Gradual Scene Changes on MPEG Video)

  • 윤석중;지은석;김영로;고성제
    • 한국통신학회논문지
    • /
    • 제24권8B호
    • /
    • pp.1577-1585
    • /
    • 1999
  • 점진적인 장면전환 종류로는 비디오 편집 과정에서 삽입되는 디졸브(dissolve), 페이드인/아웃(fade-in/out), 와이프(wipe) 등과, 카메라 움직임에 의한 팬(pan), 줌(zoom), 스크롤(scroll) 등이 있다. 본 논문에서는 점진적 장면전환 종류 중 편집과정에서 사용되는 디졸브, 그리고 카메라 움직임에 의한 팬과 줌의 검출을 위한 효과적인 방법을 제안하였다. 디졸브 구간의 검출을 위하여 각 프레임에 대한 공간적 영역 분할을 하고, 영역별 화소값의 평균치를 제곱하여 전환 프레임의 특징 요소로 사용하였다. 팬과 줌의 검출을 위하여 배경화면을 대표할 수 있는 4개의 국부 영역으로 선정하여 각 국부 영역의 움직임 벡터로부터 대표 움직임 벡터를 결정하고, 이들의 방향 성분을 사용하였다. 제안된 방식들은 검출의 정확도를 향상시키기 위해 모든 프레임(I, P, B)을 사용하였으며 아울러 검출 속도를 높이기 위해 완전 복원된 영상을 사용하는 대신 DCT DC 계수와 움직임 벡터를 이용한 축소영상을 사용하였다. 실제 MPEG 비디오에 적용하여 기존의 방법들에 비해 우수한 검출 결과를 확인하였다.

  • PDF

씬 그래프의 빠른 탐색을 위한 MPEG-4 객체 Naming 기법 (A Naming Technique of the MPEG-4 Object for the Quick Search of the Scene Graph)

  • 김남영;이숙영;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.208-210
    • /
    • 2002
  • 재생기에서 MP4 파일을 재생하기 위해서는 Drawing 정보와 Routing 정보가 필요하다. 기존의 저작도구에서의 객체 Naming은 그 객체와는 상관없이 단순히 문자열과 숫자의 조합으로 되어 있고 실제 화면상에 기술되는 객체의 ID값을 부여하는 방법이었다. 객체 Naming을 구현하는 객체 ID 설정이 이러한 방법이었기 때문에 재생기에서 객체 정보를 구하려면 Scene 그래프를 반복해서 검색하는 load가 발생한다. 본 논문에서는 이러한 load를 줄이기 위해서 비트 연산을 이용한 각 객체의 ID를 부여함으로써 각 객체에 속하는 Attribute의 ID가 자신의 실제 객체의 ID를 추론할 수 있는 방법으로 객체에 대한 Naming을 구현하였다. 이러한 객체 Naming 기법으로 설정된 객체의 ID값은 비트 연산과 시프트 연산을 이용해서 객체 정보를 구할 수 있기 때문에 Scene 그래프 탐색 load를 줄일 수 있다.

  • PDF

국부 분산을 이용한 장면 전환 적응 비트율 제어 (Scence Change Adaptive Bit Rate Control Using Local Variance)

  • 이호영;김기석;박영식;송근원;남재열;하영호
    • 한국통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.675-684
    • /
    • 1997
  • The bit rate control algorithm which is capable of handing scene change is proposed. In MPEG-2 TM5, block variance is used to measure block activity. But block variance is not consistent with human visual system and does not differenciate the distribution of pixel values within the block. In target bit allocation process of TM5, global complexity, obtained by results of previous coded pictures, is used. Since I pictures are spaced relatively far apart, their complexity estimate is not very accurate. In the proposed algorithm local variance is used to measure block activity and detect scene change. Local variance, using deviation from the mean of neighboring pixels, well represents the distribution of pixel values within the block. If scene change is detected, the local variance information is used for target bit allocation process. Allocating target bits for I picture, the average local variance difference between previous and current I picture is considered. The experimental results show that the proposed algorithm can detect scene change very precisely and gives better picture quality and higher PSNR values than MPEG-2 TM5.

  • PDF

LASeR 기반 모바일 콘텐츠 저작 도구 (Authoring Tool for Mobile Contents based on LASeR)

  • 김선경;김희선
    • 한국산업정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.31-37
    • /
    • 2008
  • MPEG 4 Part 20 LASeR (ISO/IEC 14496 20) is a specification designed to deliver rich media services in a mobile environment. The specification is an emerging standard that can replace the MPEG 4 BIFS specification designed to deliver PC based heavyweight media contents. The specification describes the representation of scene information in a resource constrained mobile environment. Unlike the BIFS standard designed to deliver heavyweight rich media, the LASeR specification has a restricted description that conforms to the SVG Tiny 1.2 specification. Also, the specification has an advantage of allowing for the efficient conversion of one graphics format to another. In this paper, we present the design and the implementation of a LASeR authoring system that allows for fast and efficient creation of interactive rich media contents in a mobile environment. The Gill interface of the authoring system presented in this paper allows users, who do not have prior knowledge of the scene description language, to conveniently create contents and store the produced scenes using the internal list data structure. The system allows users to navigate scene objects internally stored and to create LASeR XML files in the structured XML format.

  • PDF

객체 기반 MPEG-4 재생 기술의 PDA 적응 기법 (Adaptation Techniques of an Object-based MPEG-4 Player to PDA)

  • 김남영;김상욱
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권2호
    • /
    • pp.220-230
    • /
    • 2006
  • 컴퓨팅 기술과 다양한 모바일 디바이스의 발전에 따라 모바일 환경에서의 멀티미디어 콘텐츠에 대한 이용도가 증가하고 있다. 현재 PDA에서 제공되는 멀티미디어 콘텐츠는 비디오, 오디오로 이루어진 콘텐츠로 제한되어 있다. MPEG-4는 비디오, 오디오, 이미지, 텍스트, 2차원 객체 등의 멀티미디어 데이타를 효율적으로 저장, 전송 및 표현하기 위한 국제 표준으로 다양한 사용자 상호 작용과 여러 종류의 객체들로 장면을 구성할 수 있다. 또한 현재 대부분의 MPEG-4 콘텐츠는 대부분 데스크 탑 용으로 저작되었기 때문에 PDA 환경에서 제한된 메모리, GUI 등에서 정상적으로 재생할 수 없다. 따라서 본 논문에서는 객체 기반의 MPEG-4 표준을 이용하여 제한된 리소스를 가진 PDA 환경에서 다수의 객체로 장면을 구성하고 사용자 상호 작용이 가능한 MPEG-4 콘텐츠를 재생하기 위한 PDA 적응 기법에 관하여 기술한다. 제안하는 기법은 크게 3가지로 물리적 적응 기법, 리소스 적응 기법, 이벤트 적응 기법으로 나누어진다. 물리적 적응은 재생기 프리젠터에서 이루어지는 부분으로 콘텐츠 저작 환경과 재생 환경의 물리적 차이에 대한 적응 기법이고, 이벤트 적응은 PDA에서 지원하지 않는 이벤트에 대하여 PDA에 적합하게 변형하는 부분이다. 또한 리소스 적응은 제한적인 리소스를 제공하는 PDA에서 MPEG-4 콘텐츠 재생률을 높이기 위한 기법이다. PDA에서의 MPEG-4 재생기는 제안하는 PDA 적응 기법을 이용하여 객체 기반의 MPEG-4 콘텐츠를 정상적으로 재생할 수 있다.

Video Content Manipulation Using 3D Analysis for MPEG-4

  • Sull, Sanghoon
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.125-135
    • /
    • 1997
  • This paper is concerned with realistic mainpulation of content in video sequences. Manipulation of content in video sequences is one of the content-based functionalities for MPEG-4 Visual standard. We present an approach to synthesizing video sequences by using the intermediate outputs of three-dimensional (3D) motion and depth analysis. For concreteness, we focus on video showing 3D motion of an observer relative to a scene containing planar runways (or roads). We first present a simple runway (or road) model. Then, we describe a method of identifying the runway (or road) boundary in the image using the Point of Heading Direction (PHD) which is defined as the image of, the ray along which a camera moves. The 3D motion of the camera is obtained from one of the existing 3D analysis methods. Then, a video sequence containing a runway is manipulated by (i) coloring the scene part above a vanishing line, say blue, to show sky, (ii) filling in the occluded scene parts, and (iii) overlaying the identified runway edges and placing yellow disks in them, simulating lights. Experimental results for a real video sequence are presented.

  • PDF

비디오 프레임 타입을 이용한 비디오 셧 검출 (Video Shot Detection Based on Video Frame Types)

  • 김영빈;류광렬;로버트스크라바시
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.145-148
    • /
    • 2007
  • 논문은 비디오 픽쳐 타입을 이용한 비디오 셧 검출에 관한 연구이다. 제안한 방법은 압축된 비디오 프레임에 대하여 원 영상을 복원하지 않고, 압축 상태의 비디오 프레임을 이용한다. I픽쳐 프레임에서 DC영상을 복원하고, P픽쳐 프레임에서는 매크로블록의 개수를 이용하여 비디오 셧을 검출 한다. 테스트 비디오를 이용하여 실험 결과 $85\sim98%$의 장면전환 검출이 가능 하였고, 압축비트스트림을 복원하여 장면전환의 셧을 검출 하는 기법에 비해 4배 빠른 검색이 가능하다.

  • PDF