• 제목/요약/키워드: MPEG(Moving Picture Experts Group)-4

검색결과 31건 처리시간 0.022초

MPEG-U-based Advanced User Interaction Interface Using Hand Posture Recognition

  • Han, Gukhee;Choi, Haechul
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권4호
    • /
    • pp.267-273
    • /
    • 2016
  • Hand posture recognition is an important technique to enable a natural and familiar interface in the human-computer interaction (HCI) field. This paper introduces a hand posture recognition method using a depth camera. Moreover, the hand posture recognition method is incorporated with the Moving Picture Experts Group Rich Media User Interface (MPEG-U) Advanced User Interaction (AUI) Interface (MPEG-U part 2), which can provide a natural interface on a variety of devices. The proposed method initially detects positions and lengths of all fingers opened, and then recognizes the hand posture from the pose of one or two hands, as well as the number of fingers folded when a user presents a gesture representing a pattern in the AUI data format specified in MPEG-U part 2. The AUI interface represents a user's hand posture in the compliant MPEG-U schema structure. Experimental results demonstrate the performance of the hand posture recognition system and verified that the AUI interface is compatible with the MPEG-U standard.

Complexity Analysis of Internet Video Coding (IVC) Decoding

  • Park, Sang-hyo;Dong, Tianyu;Jang, Euee S.
    • Journal of Multimedia Information System
    • /
    • 제4권4호
    • /
    • pp.179-188
    • /
    • 2017
  • The Internet Video Coding (IVC) standard is due to be published by Moving Picture Experts Group (MPEG) for various Internet applications such as internet broadcast streaming. IVC aims at three things fundamentally: 1) forming IVC patents under a free of charge license, 2) reaching comparable compression performance to AVC/H.264 constrained Baseline Profile (cBP), and 3) maintaining computational complexity for feasible implementation of real-time encoding and decoding. MPEG experts have worked diligently on the intellectual property rights issues for IVC, and they reported that IVC already achieved the second goal (compression performance) and even showed comparable performance to even AVC/H.264 High Profile (HP). For the complexity issue, however, there has not been thorough analysis on IVC decoder. In this paper, we analyze the IVC decoder in view of the time complexity by evaluating running time. Through the experimental results, IVC is 3.6 times and 3.1 times more complex than AVC/H.264 cBP under constrained set (CS) 1 and CS2, respectively. Compared to AVC/H.264 HP, IVC is 2.8 times and 2.9 times slower in decoding time under CS1 and CS2, respectively. The most critical tool to be improved for lightweight IVC decoder is motion compensation process containing a resolution-adaptive interpolation filtering process.

VVC 행렬가중 화면내 예측(MIP) 학습기법 분석 (Analysis of Training Method for Matrix Weighted Intra Prediction (MIP) in VVC)

  • 박도현;권형진;정세윤;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.148-150
    • /
    • 2020
  • 최근 VVC(Versatile Video Coding) 표준 완료 이후 JVET(Joint Video Experts Team)은 인공신경망 기반의 비디오 부호화를 위한 AhG(Ad-hoc Group) 구성하고 인공지능을 이용한 비디오 압축 기술들을 검증하고 있으며, MPEG(Moving Picture Experts Group)에서는 DNNVC(Deep Neural Network based Video Coding) 활동을 통해 딥러닝 기반의 차세대 비디오 부호화 표준 기술을 탐색하고 있다. 본 논문은 VVC 에 채택된 신경망 기반의 기술인 MIP(Matrix Weighted Intra Prediction)를 참조하여, MIP 모델의 학습에서 손실함수가 예측 성능에 미치는 영향을 분석한다. 즉, 예측의 왜곡(MSE)만을 고려한 경우와 예측오차의 부호화 비용도 함께 반영한 손실함수를 비교한다. 실험을 위해 HEVC(High Efficiency Video Coding) 화면내 예측 대비 평균적인 PSNR 향상 정도를 나타내는 성능 지표(��PSNR)를 정의한다. 실험결과 예측오차의 부호화 특성을 반영하는 손실함수를 이용한 학습이 MSE 만 고려한 학습 대비 ��PSNR 기준 평균 0.4dB 향상됨을 보였다.

  • PDF

VBR MPEG 비디오 추적을 위한 임계치 자회귀 모델 (Threshold Autoregressive Models for VBR MPEG Video Traces)

  • 오창윤;배상현
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.101-112
    • /
    • 1999
  • NPEG은 ISO 산하의 표준화 위원회에서 동영상 압축 기술의 필요에 의해 표준화된 동영상 압축 기술로 통신상에서 더 높은 비트율의 고화질 동화상 실현의 요구에 의해 1995년에 MPEG 2가 개발되었다. 본 논문에서는 VBR MPEG의 코드화된 완전한 동화상 통신을 위해 비선형 시계열 방식으로 효율적이고도 정확한 TAR모델 설계 알고리즘을 제안하며 실질적인 동영상 비디오 추적에 대한 통계적 특성을 보여주는 시뮬레이션 결과를 제시하고자 한다.

  • PDF

CMAF 기반 Mobile MMT를 활용한 콘텐츠 삽입 기술 (Content Insertion Technology using Mobile MMT with CMAF)

  • 김준식;박성환;김두환;김규헌
    • 방송공학회논문지
    • /
    • 제25권4호
    • /
    • pp.560-568
    • /
    • 2020
  • 최근 네트워크 기술이 발달함에 따라 스트리밍 서비스의 사용이 증가하고 있다. 그러나 코덱이나, 프로토콜, 포맷 및 다양한 장치들로 인해 스트리밍 서비스의 복잡성이 증가하고 있으며, 같은 콘텐츠를 스트리밍하는 경우에도 서비스의 형태에 맞게 다시 인코딩하는 과정이 필요하다. 이와 같은 스트리밍 서비스의 복잡성 및 대기시간의 문제점을 해결하고자 MPEG(Moving Picture Experts Group)에서는 공통 미디어 파일 포맷(CMAF: Common Media Application Format)을 표준화하였다. 이와 더불어, 통신망을 활용한 고품질 AV(Audio-Video) 콘텐츠의 전송이 가능해짐에 따라, 국내 UHD(Ultra High Definition) 방송 표준은 방송망과 통신망을 활용한 하이브리드 서비스 규격으로 제정되었다. 하이브리드 서비스는 방송망을 통해 전송된 콘텐츠의 부가적인 정보를 통신망을 활용하여 전송하거나, 사용자 맞춤형 콘텐츠 제공 등과 같은 다양한 서비스를 가능케 한다. 국내 지상파 UHD 전송 표준은 MMT(MPEG Media Transport)를 활용하고 있으며, Mobile MMT는 모바일 망에 특화된 기능을 제공하기 위해서 MMT를 확장한 표준이다. 본 논문에서는 MMT 및 Mobile MMT의 시그널링 메시지를 활용하여 다양한 스트리밍 서비스에 적합한 CMAF 콘텐츠의 삽입 방안을 제안한다. 또한, 방송망과 통신망을 활용한 이종망 환경에서의 콘텐츠 삽입 시스템 모델을 제안하고, 콘텐츠 삽입의 결과를 확인하여 제안 기술의 타당성을 검증한다.

Design on MPEC2 AAC Decoder

  • NOH, Jin Soo;Kang, Dongshik;RHEE, Kang Hyeon
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -3
    • /
    • pp.1567-1570
    • /
    • 2002
  • This paper deals with FPGA(Field Programmable Gate Array) implementation of the AAC(Advanced Audio Coding) decoder. On modern computer culture, according to the high quality data is required in multimedia systems area such as CD, DAT(Digital Audio Tape) and modem. So, the technology of data compression far data transmission is necessity now. MPEG(Moving Picture Experts Group) would be a standard of those technology. MPEG-2 AAC is the availableness and ITU-R advanced coding scheme far high quality audio coding. This MPEG-2 AAC audio standard allows ITU-R 'indistinguishable' quality according to at data rates of 320 Kbit/sec for five full-bandwidth channel audio signals. The compression ratio is around a factor of 1.4 better compared to MPEG Layer-III, it gets the same quality at 70% of the titrate. In this paper, for a real time processing MPEG2 AAC decoding, it is implemented on FPGA chip. The architecture designed is composed of general DSP(Digital Signal Processor). And the Processor designed is coded using VHDL language. The verification is operated with the simulator of C language programmed and ECAD tool.

  • PDF

클라이언트 측 연접 저장 결과 재생을 위한 MP4 기반 DASH 세그먼트에 대한 조건 (Conditions on the MP4-based DASH Segments for the Replay of Client-side Concatenated Storage Results)

  • 김용한;박민규;유성열;황서영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.216-219
    • /
    • 2011
  • DASH(Dynamic Adaptive Streaming over HTTP)는 MPEG(Moving Picture Experts Group)에서 표준화 중인 HTTP를 이용한 적응형 비디오 스트리밍 기술이다. 일반적으로 HTTP를 이용한 적응형 비디오 스트리밍에서 클라이언트가 사용할 수 있는 기능은 파일 전체 또는 그 일부를 다운로드하는 것이다. 따라서 전체 콘텐트를 작은 파일 조각 즉, 세그먼트(segment)로 분할하여 세그먼트들을 순차적으로 다운로드함으로써 마치 스트리밍이 달성되는 것과 같은 효과를 낼 수 있다. 네트워크의 상태에 따라 전송률을 조절하기 위해서는 서버에 서로 다른 비트율로 부호화된 세그먼트들을 함께 보관해 두어 클라이언트로 하여금 선택할 수 있게 한다. DASH에서는 MPEG-2 TS 또는 MPEG-4 파일 포맷(MP4)를 기반으로 하는 두 가지 형태의 서버 콘텐트를 제공할 수 있다. MP4 기반 DASH의 경우, 클라이언트가 수신한 세그먼트들을 순차적으로 이어 붙여 저장한다 하더라도 특별한 조건을 만족하는 경우를 제외하고는 MP4 파일을 재생할 수 있는 기존 미디어 플레이어가 이를 재생하지 못한다. 본 논문에서는 이러한 특별한 조건을 제시하고 이를 검증하였다. 이 조건은 서버에서 제공하는 세그먼트들에 대한 조건이다.

  • PDF

디지털 오디오 방송을 위한 AAC 오디오 코덱 구현 (Implementation of the AAC Audio CODEC for Digital Audio Broadcasting)

  • 장대영;홍진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.43-48
    • /
    • 2000
  • 본 논문에서는 디지털 오디오 방송 시스템으로서 사용하기 위한 AAC (MPEG-2 Advanced Audio Coding) 코덱 시스템의 개발에 관하여 기술한다. 인코더 및 디코더는 ETRI가 제안한 디지털 오디오 방송 시스템에 접속하기 위해 MPEG-2 (Moving Picture Experts Group phase 2) 시스템의 TS(Transport Stream) 형식으로 입/출력한다. 내부 오디오 신호처리를 위한 DSP(Digital Signal Processor)로서는 Tl(Texas Instruments) 사의 TMS320C6701 (Floating point, 166 MHz)을 사용하였다. 인코더에서는 DSP 를 4 개까지, 디코더에서는 3 개까지 사용하여 구성할 수 있도록 설계하였다. DSP 에서는 시스템 제어, 오디오 신호 입력, 오디오 신호 처리, TS 신호 발생, 비트스트림 출력 등의 처리를 수행하며, 각 DSP 는 직렬 및 병렬 접속에 의해 서로 데이터를 전달한다. 본 시스템은 이후 다양한 디지털 방송 분야에 활용될 것이다.

  • PDF

Encryption Scheme for MPEG-4 Media Transmission Exploiting Frame Dropping

  • Shin, Dong-Kyoo;Shin, Dong-Il;Shin, Jae-Wan;Kim, Soo-Han;Kim, Seung-Dong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권5호
    • /
    • pp.925-938
    • /
    • 2010
  • Depending on network conditions, a communication network could be overloaded when media are transmitted. Research has been carried out to lessen network overloading, such as by filtering, load distribution, frame dropping, and other methods. Among these methods, one of the most effective is frame dropping, which reduces specified video frames for bandwidth diminution. In frame dropping, B-frames are dropped and then I- and P-frames are dropped, based on the dependency among the frames. This paper proposes a scheme for protecting copyrights by encryption, when frame dropping is applied to reduce the bandwidth of media based on the MPEG-4 file format. We designed two kinds of frame dropping: the first stores and then sends the dropped files and the other drops frames in real time when transmitting. We designed three kinds of encryption methods using the DES algorithm to encrypt MPEG-4 data: macro block encryption in I-VOP, macro block and motion vector encryption in P-VOP, and macro block and motion vector encryption in I-, P-VOP. Based on these three methods, we implemented a digital rights management solution for MPEG-4 data streaming. We compared the results of dropping, encryption, decryption, and the quality of the video sequences to select an optimal method, and found that there was no noticeable difference between the video sequences recovered after frame dropping and the ones recovered without frame dropping. The best performance in the encryption and decryption of frames was obtained when we applied the macro block and motion vector encryption in I-, P-VOP.

가산 투영을 이용한 2단계 고속 블록정합 알고리즘 (Two-Stage Fast Block Matching Algorithm Using Integral Projections)

  • 김준식;박래홍;이병욱
    • 전자공학회논문지B
    • /
    • 제30B권1호
    • /
    • pp.45-55
    • /
    • 1993
  • In this paper, a two-stage block matching algorithm (BMA), which can reduce greatly the computational complexity of the conventional BMAs, is proposed, in which the onedimensional distortion measure based on the integral projection is introduced to determine the candidate motion vectors and then among them a final motion vector is detected based on the conventional two-dimensional distortion measure. Due to the one-dimensional calculation of a distortion measure, the proposed algorithm can reduce the computational complexity of the conventional BMA (full search method with a 16$\times$16 block) by a factor of 4, with its performance comparable to those of the conventional ones. Simulation results based on the original and noisy image sequences are shown. Also the simulation of the proposed method combined with the MPEG (Moving Picture Experts Group) SM3 (Simulation Model Three) is presented. Computer simulation shows that the proposed algorithm is fast with its performance comparable to those of the conventional ones.

  • PDF