• Title/Summary/Keyword: MPEG-4 Visual

Search Result 81, Processing Time 0.024 seconds

MPEG-4 영상의 화질 개선에 관한 연구 (Image Enhancement Techniques for MPEG-4)

  • 김태근;신정호;백준기
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.169-181
    • /
    • 1997
  • 초고속압축률, 내용기반 부호화, 객체 단위의 계층적 구조로 대표되는 MPEG-4, 비디오의 화질 개선 기술에 관하여 논의한다. 화질 개설은 크게 두 가지로 나누어 압축과정에서 발생하는 화질 열화(degradation) 요인을 제거하고, 제한되어 있는 공간 및 시간적 해상도를 향상시키는 기술을 제안한다. 첫째 화질 열화의 제거를 위해서, 다시 MPEG-4 비디오 압축 기술을 크게 MPEG-2와 공통되는 부분과 차별되는 부분으로 나눈 후, 전자에 대해서는 이미 개발되어 있는 화질 개선을 적용하고, 후자에 대해서는 새로운 수학적 모델을 제시하여 복원이 가능하게 한다. 둘째 공간적 해상도 향상을 위해서는 다채널 영상보건(multichannel interpolation) 기법의 구현을 위한 일반화된 구조를 제안하고, 시간 해상도 향상을 위해서는 기존의 프레임률 향상 기법을 정리한다. MPEG-4 표준 제정 단계에서 매우 다양한 고려가 이루어지고 있지만, 가장 중요한 화질에 대해서는 상대적으로 제약이 많지 않기 때문에, 사용화 단계에서 화질 개선 기술의 추가가 매우 중요할 것으로 예상된다.

  • PDF

Image Retrieval via Query-by-Layout Using MPEG-7 Visual Descriptors

  • Kim, Sung-Min;Park, Soo-Jun;Won, Chee-Sun
    • ETRI Journal
    • /
    • 제29권2호
    • /
    • pp.246-248
    • /
    • 2007
  • Query-by-example (QBE) is a well-known method for image retrieval. In reality, however, an example image to be used for the query is rarely available. Therefore, it is often necessary to find a good example image to be used for the query before applying the QBE method. Query-by-layout (QBL) is our proposal for that purpose. In particular, we make use of the visual descriptors such as the edge histogram descriptor (EHD) and the color layout descriptor (CLD) in MPEG-7. Since image features of the CLD and the EHD can be localized in terms of a$4{\times}4$ sub-image, we can specify image features such as color and edge distribution on each sub-image separately for image retrieval without a query image. Experimental results show that the proposed query method can be used to retrieve a good image as a starting point for further QBE-based image retrieval.

  • PDF

New Interactive TV Service Model based on the MPEG-4 System

  • Kim, Jongho;Jechang Jeong
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.125-128
    • /
    • 2002
  • In this paper, a new interactive TV service model is proposed. The MPEG-4 system is specified for composing and managing various object streams including user interactions. The data broadcasting model supporting user interactions is designed using MPEG-4 system in our proposal. We evaluate possibility of proposed service model using simulation player. This player supports MPEG-2 TS which contains MPEG-2 video and AC-3 audio streams as a main service and MPEC-4 system data as interactive services as well as user specific EPG information, and XML data, etc as supplemetary services. The player also supports a multi-channel environment. The synchronization between audio and visual data is achieved by DTS and PTS in TS.

  • PDF

MPEG-4 CELP를 이용한 실시간 다자간 통신시스템의 구현 (Implementation of Real Time Multi-User Communication System with MPEG-4 CELP)

  • 김헌중;우광희;차형태
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.57-62
    • /
    • 2000
  • 본 논문은 6∼24kbit/s의 저비트율의 전송율을 지원하는 MPEG-4 CELP CODEC과 실시간 처리를 위한 효율적인 알고리즘의 최적화를 통한 인터넷 환경에서의 PC-to-PC 실시간 양방향 다자간 동시 통화 시스템을 구현하였다. 현재 구현된 시스템은 MPEG-4 CELP Mode-I을 사용하여 음성신호 압축 비트 열을 생성하고 있으며, Mode-I서 지원하는 비트율 중 18200bps 모드를 사용하고 있다. 이 경우 1프레임 당 처리하는 샘플 데이터 수는 160 샘플이고 현재 데이터 전송을 위한 데이터 package는 5 프레임이 1 package(117 byte)로 구성되어져 있으며, 동시에 4명의 용자가 접속하여 실시간으로 다자간 양방향 통신이 가능하도록 구현되었다. 개발 환경은 Windows 운영체제 하에서 Microsoft Visual C++ 6.0을 사용하였다.

  • PDF

인간 시각 양자화기를 이용한 MPEG-4 정지영상 압축 방법의 성능 개선 (Improvement of the MPEG-4 Still Image Compression Using Visually Weighted Quantizers)

  • 김민구;김승종;정제창
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.104-113
    • /
    • 1997
  • 본 논문에서는 최근 MPEG-4에서도 표준의 일부로 채택될 전망인 웨이브릿 기법의 정지영상 압축 기법에 대해서 살펴보고 MPEG-4에서의 정지영상 압축 기법보다도 간단하면서, 인간 시각 특성을 고려한 양자화기를 사용하여 시각 특성을 향상시킨 효율적인 압축 기법을 제안한다. MPEG-4에서 제시된 알고리즘과 본 논문에서 제안한 알고리즘을 구현하여 성능 평가를 실시하였다. 평가 결과 제안한 방법이 MPEG-4에서의 정지 영상 압축 방법보다도 훨씬 좋은 성능을 나타내었다. 또한 압축률이 매우 높을 경우를 제외하고는 Shapiro의 EZW 보다도 복잡도가 낮으면서 대부분의 경우 주관적, 객관적 화질이 우수함을 알 수 있었다. 웨이브릿 변환은 인간의 시각 특성을 잘 반영하고 있으므로 압축된 영상은 JPEG으로 압축할 때와 같이 블록간 왜곡이 거의 발생하지 않으며 전체적으로 JPEG보다 훨씬 우수한 화질의 향상을 가져왔다.

  • PDF

MPEG-4 기반 대화형 복수시점 영상콘텐츠 저작 시스템 (Interactive Multiview Contents Authoring System based on MPEG-4)

  • 이인재;기명석;김욱중;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2005년도 학술대회
    • /
    • pp.209-212
    • /
    • 2005
  • This paper introduces interactive multi-view contents authoring system based on MPEG-4. The MPEG-4 standard, which aims to provide an object based audiovisual coding tool, has been developed to address the emerging needs from communications, interactive broadcasting as well as from mixed service models resulting from technological convergence. Due to the feature of object based coding, it has been considered that MPEG-4 is the most suitable for interactive broadcasting content production. This feature is suitable for creation of the content which provides multiple views of object or scene in interactive manner. In this paper, we categorize the multi-view visual content into two types: panoramic multi-view content and object multi-view content. And design and implementation of the authoring system for interactive multi-view contents is presented. We believe that the proposed method can be effectively used for further deployment of MPEG-4 content to various interactive applications.

  • PDF

MPEG-4 BIFS와 무선데이터통신망을 이용한 인터렉티브 멀티미디어 저작 도구 (Interactive Multimedia Authoring Tool using MPEG-4 BIFS and Wireless Network)

  • 유성필;곽내정;권동진
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.458-460
    • /
    • 2006
  • MPEG-4 BIFS(Binary Format for Scene)는 장면에서 각 시각 객체의 시공간적 위치 정보를 기술하는 형식이다. 이는 국내의 지상파 DMB 방송에 시험 송출하고 있으며, 다양한 멀티미디어 포맷으로 전환이 가능하다. 현재 유통되는 DMB 수신기는 이동통신단말기에 탑재되는 경우가 많고 꾸준히 증가 추세를 보이고 있으며 DMB 방송과 이동통신 데이터망을 융합한 다양한 서비스가 가능하다. 따라서 본 논문에서는 이동통신 데이터망과 MPEG-4 BIFS를 이용한 인터렉티브 멀티미디어 저작 포맷의 새로운 방법은 제안한다. 제안한 방법은 MPEG-4 BIFS를 수정 및 보완하고 DMB 방송과 이동통신 데이터망과의 상호 보완하여 동작되며 사용자가 직접 참여한 저작 내용을 DMB 방송으로 재송출 할 수 있고, 유저가 원하는 내용으로 재구성하는 새로운 인터렉티브 멀티미디어 컨텐츠를 생성한다.

  • PDF

장면 기술을 위한 MPEG-4 기반 XMT API 구현 (MPEG-4 based XMT APIs for Scene Description)

  • 정예선;김규헌;기명석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.91-94
    • /
    • 2001
  • MPEG-4 시스템은 장면 자체를 하나의 구성 요소로 여기는 기존의 시스템과는 달리, 그 장면을 구성하는 부호화 또는 복호화된 A/V 객체(Audio/visual Objects)들을 하나의 단위로 인식하여, 다양한 멀티미디어 컨텐츠의 장면을 구성(Scene Composition)하고 표현 하는 것에 그 특징이 있다. 이러한 MPEG-4 시스템의 객체 기반 특징은 다양한 사용자와의 대화성(Interactivity)을 가능하게 하며 , 또한 편리한 컨텐츠 편집 및 재사용 등이 가능하기에 차세대 디지털 방송 컨텐츠 제작에 중요하게 활용될 전망이다. 객체 기반 A/V 편집 도구는 MPEG-4를 기반으로 차세대 디지털 방송 컨텐츠 제작을 용이하게 하기 위한 제작/편집 도구로써 , 장면을 표현하기 위하여 BIFS(Binary Format for Scene description)와 XMT(eXtensible MPEG-4 Textual format) 포맷을 모두 사용하고 있다. BIFS 포맷은 저작된 결과물을 바이너리 형태로 표현하기 때문에, 저작된 결과물을 전송하는 데에는 용이하나, 중간에 저작된 결과물을 확인하기 어렵고, 또한 기존의 다른 어플리케이션과의 상호 작용(Interoperability)과 교환(Exchange)에도 어려움이 따른다. 이에 반해, XMT는 차세대 마크업 언어로 각광 받고 있는 XML 에 그 기반을 두고 있기에 저작된 결과물을 제작자가 쉽게 저작물을 이해할 수 있으며, SMIL 과 X3D 같은 다른 어플리케이션과의 상호작용과 교환 또한 용이하게 한다 XMT는 기술 방법에 따라 XMT-A 와 XMT-0 두 가지 형태가 있으며, XMT-A 포맷은 VRML에서 발전한 X3D(extensible 3D)를 바탕으로 MPEG-4 시스템의 특징들을 수용하여 구성되고 BIFS와 일대일로 대응된다. 반면에 XMT-0는 멀티미디어 문서를 웹문서로 표현하는 SMIL 2.0 을 그 기반으로 하였기에 MPEG-4 시스템의 특징보다는 컨텐츠를 저작하는 제작자의 초점에 맞추어 개발된 형태이다. XMT를 이용하여 컨텐츠를 저작하기 위해서는 사용자 인터페이스를 통해 입력되는 저작 정보들을 손쉽게 저장하고 조작할 수 있으며, 또한 XMT 파일 형태로 출력하기 위한 API 가 필요하다. 이에, 본 논문에서는 XMT 형태의 중간 자료형으로의 저장 및 조작을 위하여 XML 에서 표준 인터페이스로 사용하고 있는 DOM(Document Object Model)을 기반으로 하여 XMT 문법에 적합하게 API를 정의하였으며, 또한, XMT 파일을 생성하기 위한 API를 구현하였다. 본 논문에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.

  • PDF

지상파 DMB 컨텐츠의 MPEG-4 BIFS 최적화 기법 (MPEG-4 BIFS Optimization for Interactive T-DMB Content)

  • 차경애
    • 한국산업정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.54-60
    • /
    • 2007
  • The Digital Multimedia Broadcasting(DMB) system is developed to offer high quality multimedia content to the mobile environment. The system adopts the MPEG-4 standard for the main video, audio and other media format. For providing interactive contents, it also adopts the MPEG-4 scene description that refers to the spatio-temporal specifications and behaviors of individual objects. With more interactive contents, the scene description also needs higher bitrate. However, the bandwidth for allocating meta data, such as scene description is restrictive in the mobile environment. On one hand, the DMB terminal renders each media stream according to the scene description. Thus the binary format for scene(BIFS) stream corresponding to the scene description should be decoded and parsed in advance when presenting media data. With this reasoning, the transmission delay of the BIFS stream would cause the delay in transmitting whole audio-visual scene presentations, although the audio or video streams are encoded in very low bitrate. This paper presents the effective optimization technique in adapting the BIFS stream into the expected bitrate without any waste in bandwidth and avoiding transmission delays inthe initial scene description for interactive DMB content.

  • PDF

이동로봇의 시각센서를 위한 동영상 압축기 구현 (Implementation of Visual Data Compressor for Vision Sensor of Mobile Robot)

  • 김형오;조경수;백문열;기창두
    • 한국정밀공학회지
    • /
    • 제22권9호
    • /
    • pp.99-106
    • /
    • 2005
  • In recent years, vision sensors are widely used to mobile robot for navigation or exploration. The analog signal transmission of visual data being used in this area, however, has some disadvantages including noise weakness in view of the data storage. A large amount of data also makes it difficult to use this method for a mobile robot. In this paper, a digital data compressing technology based on MPEG4 which substitutes for analog technology is proposed to overcome the disadvantages by using DWT(Discreate Wavelet Transform) instead of DCT(Discreate Cosine Transform). The TI Company's DSP chip, TMS320C6711, is used for the image encoder, and the performance of the proposed method is evaluated by PSNR(Peake Signal to Noise Rates), QP(Quantization Parameter) and bitrate.