• 제목/요약/키워드: Transform Coding

검색결과 577건 처리시간 0.03초

다중 레프런스 프레임 기반의 에러에 강인한 동영상 부호화 기법 (Multiple Reference Frame based Error-Resilient Video Coding)

  • 정한승;김인철;이상욱
    • 한국통신학회논문지
    • /
    • 제26권10B호
    • /
    • pp.1382-1389
    • /
    • 2001
  • 움직임 보상-이산 코사인 변환 (motion compensation-discrete cosine transform : MC-DCT) 기반의 동영상 부호화 기법이 부호화 효율성 및 구현의 단순성으로 인해 널리 사용되고 있으나, 에러 환경에서 구조적으로 취약한 면이 있다. 본 논문에서는 다중 메모리 움직임 보상 예측 (long-term memory motion compensated prediction : LTMP) 기반의 다중 레프런스 프레임을 사용하여 에러에 강인한 동영상 부호화 기법을 제안한다. 또한 제안하는 알고리듬에 기반한 에러 은닉 기법 (error concealment : EC)을 구현한다. 즉, R-D (rate-distortion) 최적화에 프레임간 움직임 벡터 (temporal motion vectors)의 확산 인자를 추가하여 에러에 대한 강인성 및 에러 은닉 기법의 효율성을 증가시켰다. 또한, 제안하는 알고리듬은 시간축상의 에러 전파를 피드백 정보 (negative acknowledgement : NAK)를 사용하여 억제한다. 즉, NAK는 채널 에러에 의해 손실된 영역과 에러가 전파된 영역을 추정하여 움직임 보상 영역에서 제외되도록 하는데 이용된다. 따라서, 제안하는 알고리듬은 PSNR 측면에서 FIU (forced intra update)에 근사하는 성능을 보이나, FIU와는 달리 비트율의 증가를 피할 수 있어 제한된 대역폭의 네트웍을 효율적으로 사용할 수 있다. 컴퓨터 모의 실험을 통해 제안하는 알고리듬이 기존의 H.263 및 LTMP 기반의 부호기에 비해 에러 환경에서 주관적 및 객관적 화질 측면에서 성능이 우수함을 보인다.

  • PDF

Design Criteria and Performance of Space-Frequency Bit-Interleaved Coded Modulations in Frequency-Selective Rayleigh Fading Channels

  • Park, Dae-Young;Lee, Byeong-Gi
    • Journal of Communications and Networks
    • /
    • 제5권2호
    • /
    • pp.141-149
    • /
    • 2003
  • In this paper, we investigate design criteria and the performance of the space-frequency bit-interleaved coded modulation (SF-BICM) systems in frequency-selective Rayleigh fading channels. To determine the key parameters that affect the performance of SF-BICM, we derive the pairwise error probability (PEP) in terms of the determinant of the matrix corresponding to any two codewords. We prove that the bit-interleavers do the function of distributing the nonzero bits uniformly such that two or more nonzero bits are seldom distributed into the symbols that are transmitted in the same frequency bin. This implies that the bit-interleavers transform an SF-BICM system into an equivalent 1-antenna system. Based on this, we present design criteria of SFBICM systems that maximizes the diversity order and the coding gain. Then, we analyze the performance of SF-BICM for the case of 2-transmit antennas and 2-multipaths by deriving a frame error rate (FER) bound. The derived bound is accurate and requires only the distance spectrum of the constituent codes of SF-BICM. Numerical results reveal that the bound is tight enough to estimate the performance of SF-BICM very accurately.

Long Term Average Spectrum Characteristics of Head and Chest Register Sounds of Western Operatic Singers - Possibility of a Second Singer's Formant-

  • Jin, Sung-Min;Kwon, Young-Kyung;Song, Yun-Kyung
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.99-109
    • /
    • 2003
  • The purpose of this study was to analyze and compare head register with chest register of singers acoustically. Fifteen healthy tenor major students were participated. Fifteen healthy untrained adults were chosen as the control group for this study. Long term average (LTA) power spectrum using the Fast Fourier transform (FFT) algorithm and Linear predictive coding (LPC) filter response were made with /a/ sustained in both head (G4, 392 Hz) and chest registers (C3, 131 Hz). Statistical analysis was performed using the Mann-Whitney test. In the LTA power spectrum, head register of singers increased in the level of energy gain within the frequency of 2.2-3.4 kHz (p<0.01), and 7.5-8.4 kHz (p<0.01, p<0.05). Chest register of singers increased in the frequency of 2.2-3.1 kHz (p<0.01), 7.8-8.4 kHz (p<0.05) and around 9.6 kHz (p<0.01). The LTA power spectrum revealed a peak of acoustic energy around 2,500 Hz, known as the singer's formant and another peak of acoustic energy around 8,000 Hz in the singer's voice.

  • PDF

Image Browse for JPEG Decoder

  • 정의필
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.96-100
    • /
    • 1998
  • DCT 변환을 기반으로 하는 비디오 코딩은 많은 사용자와 더불어 급속한 기술 발전을 하게 되었다. 공간영역내에서 디코딩을 수행하는 것보다 DCT 영역에서 직접 데이터를 처리하는 것이 계산속도 면에서 빠르다. 그리고 블록처리 알고리듬은 병렬처리에 기초하므로 데이터 처리속도가 빠른 하드웨어로 구성되어질 수 있다. 본 논문에서는 서브밴드의 필터뱅크에서 블록변환영역 필터링을 이용한 JPEG브라우저를 제안한다. 디코딩시에 압축된 파일로부터 전체 영상을 디코딩하는대신 사용자가 원하는 크기의 영상을 브라우징 할 수 있다. 한편 DCT 영상 데이터가 입력으로 사용될 경우 제안된 블록변환 필터링은 일반적인 서브밴드 필터링보다 필터뱅크내에서의 곱셈 수를 줄임으로서 계산속도면에서 빠른 결과를 얻을 수 었다.

  • PDF

다중선형회귀모델을 이용한 움직임 추정방법 (Motion estimation method using multiple linear regression model)

  • 김학수;임원택;이재철;이규원;박규택
    • 전자공학회논문지S
    • /
    • 제34S권10호
    • /
    • pp.98-103
    • /
    • 1997
  • Given the small bit allocation for motion information in very low bit-rate coding, motion estimation using the block matching algorithm(BMA) fails to maintain an acceptable level of prediction errors. The reson is that the motion model, or spatial transformation, assumed in block matching cannot approximate the motion in the real world precisely with a small number of parameters. In order to overcome the drawback of the conventional block matching algorithm, several triangle-based methods which utilize triangular patches insead of blocks have been proposed. To estimate the motions of image sequences, these methods usually have been based on the combination of optical flow equation, affine transform, and iteration. But the compuataional cost of these methods is expensive. This paper presents a fast motion estimation algorithm using a multiple linear regression model to solve the defects of the BMA and the triange-based methods. After describing the basic 2-D triangle-based method, the details of the proposed multiple linear regression model are presented along with the motion estimation results from one standard video sequence, representative of MPEG-4 class A data. The simulationresuls show that in the proposed method, the average PSNR is improved about 1.24 dB in comparison with the BMA method, and the computational cost is reduced about 25% in comparison with the 2-D triangle-based method.

  • PDF

A Single-Chip Video/Audio CODEC for Low Bit Rate Application

  • Park, Seong-Mo;Kim, Seong-Min;Kim, Ig-Kyun;Byun, Kyung-Jin;Cha, Jin-Jong;Cho, Han-Jin
    • ETRI Journal
    • /
    • 제22권1호
    • /
    • pp.20-29
    • /
    • 2000
  • In this paper, we present a design of video and audio single chip encoder/decoder for portable multimedia application. The single-chip called as video audio signal processor (VASP) consists of a video signal processing block and an audio single processing block. This chip has mixed hardware/software architecture to combine performance and flexibility. We designed the chip by partitioning between video and audio block. The video signal processing block was designed to implement hardware solution of pixel input/output, full pixel motion estimation, half pixel motion estimation, discrete cosine transform, quantization, run length coding, host interface, and 16 bits RISC type internal controller. The audio signal processing block is implemented with software solution using a 16 bits fixed point DSP. This chip contains 142,300 gates, 22 Kbits FIFO, 107 kbits SRAM, and 556 kbits ROM, and the chip size is $9.02mm{\times}9.06mm$ which is fabricated using 0.5 micron 3-layer metal CMOS technology.

  • PDF

영상의 크기 변환을 이용한 효율적인 움직임 보상 보간 기법 (Efficient Motion Compensated Interpolation Technique Using Image Resizing)

  • 권혜경;이창우
    • 방송공학회논문지
    • /
    • 제18권4호
    • /
    • pp.599-608
    • /
    • 2013
  • 움직임 보상 보간 기법은 동영상 정보의 프레임율 증가 뿐 아니라 분산 동영상 부호화 시스템에서 부가 정보 생성에 사용된다. 본 논문에서는 움직임 보상 보간 기법의 성능을 효율적으로 향상시키기 위하여 DCT(Discrete Cosine Transform) 혹은 LiftLT를 이용하여 영상의 크기를 두 배 확대 변환한 후 움직임 보상 보간을 수행하여 생성된 두 배 크기의 영상을 다시 축소 변환하여 원래 크기의 보간 프레임을 생성하는 기법을 제안한다. 또한 보간 필터를 사용하여 부화소 단위의 세밀한 움직임 보상 보간을 수행한 경우의 성능도 분석한다. 모의 실험 결과 제안하는 기법이 기존의 보간 필터를 이용한 기법에 비해서 우수한 성능을 보임을 확인하였다.

HEVC 코덱의 영블록 검출 및 CU 조기 종료 부호화 기법 (An Early CU Termination Scheme using All Zero Block Detection in HEVC)

  • 정재홍;이범식;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.12-14
    • /
    • 2014
  • 본 논문에서는 AZB (All-Zero Block) 검출을 이용한 조기 부호화 단위(Coding Unit, CU) 결정 방법을 제안한다. HEVC 영상 코덱의 하드웨어 구현에서 이산여현변환(DCT)는 많은 부호화 자원을 필요로 하는 과정으로 DCT 수행 이전에 블록 내의 모든 양자화 계수가 0 이 되는 영블록(All-zero Block)을 미리 검출하여 DCT 및 양자화 과정을 생략하고 CU 의 부호화 과정을 조기에 종료함으로써 부호화 복잡도를 크게 감소시키는 방법을 제안한다. 기존의 SAD (Sum of Absolute Difference) 또는 SATD (Sum of Absolute Transform Difference)에 기반하는 AZB 검출 방법은 HEVC 에서 새롭게 추가된 큰 크기의 $16{\times}16$$32{\times}32$ DCT 에서 AZB 을 효율적으로 검출할 수 없는 한계가 존재한다. 본 논문에서는 DCT 변환 커널이 하다마드 변환 커널과 또 다른 정규 직교 변환 커널로 분할하여 표현할 수 있는 성질을 이용하여, 부화소 움직임벡터 추정 과정을 통해 생성된 하드마드 변환 계수에 DCT 를 생성하는 변환 커널을 곱하여 DCT 변환 커널을 생성한 후 양자화 계수를 이용하여 CU 단위의 AZB 을 검출하는 방법을 제안한다. 또한 AZB 검출과 움직임 벡터의 크기를 이용하여 현재 CU 의 부호화 과정을 조기에 종료하는 방법을 제안한다. 제안하는 AZB 검출과 CU 조기 종료 부호화 방법을 사용하면 평균적으로 34.7%의 부호화 시간을 감소시켜 부호화 복잡도를 크게 줄일 수 있다.

  • PDF

SBR을 이용한 주파수 밴드선택 여기 선형예측 광대역 음성/오디오 부호화 (Frequency Band Selection Exited Linear Prediction Wideband Speech/Audio Coding Using SBR)

  • 장성훈;이인성
    • 한국음향학회지
    • /
    • 제32권6호
    • /
    • pp.556-562
    • /
    • 2013
  • 본 논문은 컴포트 노이즈(comfort noise)를 이용하는 주파수 밴드선택 음성/오디오 코덱에서 컴포트 노이즈 대신 SBR(Spectral Band Replication) 기술을 이용하여 여기 신호를 대체 함으로서 밴드 선택 광대역 음성/오디오 부호화기의 성능 향상을 목표로 한다. 비 전송 밴드에 SBR 기술로 합성된 신호를 삽입하기 위하여 부밴드 별로 전송된 신호를 활용하며, 각각의 부밴드 별로 에너지 가중치를 설정한다. 백색잡음 성분의 컴포트 노이즈 대신 전송신호에 의존하는 신호를 합성 함으로서 보다 높은 음질의 밴드 선택 부호화기를 제안하였다.

LPC와 DNN을 결합한 유도전동기 고장진단 (Fault Diagnosis of Induction Motor using Linear Predictive Coding and Deep Neural Network)

  • 류진원;박민수;김남규;정의필;이정철
    • 한국멀티미디어학회논문지
    • /
    • 제20권11호
    • /
    • pp.1811-1819
    • /
    • 2017
  • As the induction motor is the core production equipment of the industry, it is necessary to construct a fault prediction and diagnosis system through continuous monitoring. Many researches have been conducted on motor fault diagnosis algorithm based on signal processing techniques using Fourier transform, neural networks, and fuzzy inference techniques. In this paper, we propose a fault diagnosis method of induction motor using LPC and DNN. To evaluate the performance of the proposed method, the fault diagnosis was carried out using the vibration data of the induction motor in steady state and simulated various fault conditions. Experimental results show that the learning time of our proposed method and the conventional spectrum+DNN method is 139 seconds and 974 seconds each executed on the experimental PC, and our method reduces execution time by 1/8 compared with conventional method. And the success rate of the proposed method is 98.08%, which is similar to 99.54% of the conventional method.