• 제목/요약/키워드: Encoder-decoder

검색결과 453건 처리시간 0.023초

잡음 모델 선택을 이용한 Wyner-Ziv 비디오 압축 (Wyner-Ziv Video Compression using Noise Model Selection)

  • 박천호;심혁재;전병우
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.58-66
    • /
    • 2009
  • 최근 경량화 비디오 부호화를 위함 분산 비디오 부호화 기술 (DVC: Distributed Video Coding)에 대한 연구가 활발히 이루어지고 있으며, Wyner-Ziv 부호화 기술은 이의 대표적인 기술로써 각광받고 있다. Wyner-Ziv (WZ) 부호화기는, 영상을, 기존의 인트라 부호화기를 이용하는 키 (Key) 프레임과 WZ 부호화를 하는 WZ 프레임으로 나누어 독립적으로 부호화 한다. WZ 복호화기로 전송된 키 프레임은 복원된 뒤 키 프레임 사이의 WZ 프레임을 추정하는데 사용되며 추정된 WZ 프레임을 보조정보 (Side Information)라고 한다. 보조정보는 WZ 프레임에 대한 정보가 없는 상태에서 추정되므로 필연적으로 WZ 프레임과 다르며 WZ 복호화기에서는 보조정보와 WZ 프레임과의 차이를 가상의 채널 잡음으로 간주한다. WZ 복호화 과정은 가상의 채널잡음을 WZ 복호화기 내에 존재하는 채널코드를 이용하여 제거함으로써 이루어지므로 채널 정보를 정확히 아는 것은 채널코드의 에러정정능력에 큰 영향을 미친다. WZ 복호화기에서는 추정된 WZ 영상만이 존재하므로 정확한 잡음의 양을 알 수 없으며, 일반적으로 선형 움직임에 근거한 키 프레임 간의 차를 하나의 예측 수단으로 사용한다. 또한 이와 같이 예측이 갖는 불확실성으로 채널코드의 효율이 저하되는 것을 막기 위하여 주변의 잡음과 비교를 통한 잘못된 잡음을 정정하는 방법도 제안되었다. 하지만 이런 방법들이 모든 프레임이나 비트 플레인에 존재하는 잡음을 제대로 측정한다고 할 수는 없다. 따라서 본 논문에서는 여러 개의 후보 잡음 모델을 생성한 후, 복호화 과정에서 가장 효율적인 모델을 선택하는 방법을 제안한다. 제안 방법에 대한 실험결과는 최대 0.8 dB의 PSNR이득을 보여준다.

다중 사용자 환경에서의 광 CDMA 시스템 성능 분석 (Performance Analysis of an Optical CDMA System for multi-user Environment)

  • 전상영;김영일;이주희
    • 한국통신학회논문지
    • /
    • 제24권6B호
    • /
    • pp.1134-1141
    • /
    • 1999
  • 본 논문에서는 광 코드분할 다중접속(optical code division multiple access)시스템을 구현하고 그 구현된 시스템의 성능을 분석한다. 구현된 OCDMA 시스템에서 송신단은 레이저 다이오드를 이용하여 데이터를 광 펄스로 변환하며, 4단의 지연단으로 구성한 인코더를 이용하여 펄스 열로 확산한다. 수신단에서는 인코더의 지연선 구조와 동일한 구조의 디코더에서 펄스를 지연시킨 후 결합하여 수신된 신호를 복원한다. 성능분석에 있어서는, 먼저 단일 사용자 및 다중 사용자 환경 하에서 광 CDMA 신호의 auto-correlation과 cross-correlation을 분석하고, 실험을 통해 시뮬레이션 결과를 검증하였다. 또한 광섬유 지연선의 단 수 및 코드 길이 등 시스템의 성능에 영향을 미치는 파라메타를 컴퓨터 시뮬레이션을 통해 분석하였다. 실험 결과는 인코더와 디코더의 지연선 구조가 동일한 경우 펄스 열의 중앙에서 피크값의 펄스가 발생하는 auto-correlation 특성에 의해 데이터를 복원할 수 있었고, 지연선 구조가 동일하지 않은 경우 cross-correlation 특성에 의해 데이터를 복원할 수 없었다. 성능 분석 결과는 코드 길이가 감소하거나, 지연단위의 단 수를 증 $]$쳔갭\ulcorner비트 에러 확률이 감소하지만 요구되는 레이저 광원의 펄스폭이 점차로 감소하므로 시스템 구현이 어렵게 된다. 이러한 실험 및 분석 결과를 이용하면 CDMA 기술을 광 통신 네트워크로 적용할 수 있다.

  • PDF

이웃한 블록 내 화소 정보를 이용한 투표 결정 기반의 인트라 예측 모드 부호화 생략 방법 (Voting-based Intra Mode Bit Skip Using Pixel Information in Neighbor Blocks)

  • 김지언;조혜정;정세윤;이진호;오승준
    • 방송공학회논문지
    • /
    • 제15권4호
    • /
    • pp.498-512
    • /
    • 2010
  • 인트라 프레임 부호화 기술은 임의 접근성과 에러 확산 방지에 용이하기 때문에 비디오 부호화 기술의 필수적인 기술로 자리 잡고 있다. 그러나 인터 부호화 기술에 비해 낮은 부호화 효율이 문제점으로 지적되고 있다. H.264/AVC 인트라 부호화 방식은 기존 표준 방법들보다 부호화 효율을 크게 향상시켰지만 부호화 과정이 복잡하여 저 비트율 기반의 양방향 서비스에는 부적합하다. 따라서 본 논문에서는 복호화기 측의 예측을 이용해 인트라 부호화 효율을 보다 향상시키며 부호화 시간을 단축시키는 V-IMBS (Voting-based Intra Mode Bit Skip)를 제안한다. 제안하는 방법은 복호화기가 부호화기에서와 동일하게 최적의 인트라 예측 모드를 결정할 수 있으면 인트라 예측 모드를 전송하지 않는다. 그러나 최적의 인트라 예측 모드를 결정할 수 없을 경우에는 기존의 H.264/AVC 표준과 동일한 방식으로 인트라 예측 모드를 부호화하여 복호화기로 전송한다. V-IMBS는 H.264/AVC보다 시험 시퀀스에 대해 PSNR 값이 평균 약 0.24 dB 정도 향상되었고, 비트율도 평균 약 4.44% 정도 감소되었다. 또한 전체 부호화 시간도 평균 약 42.8% 정도 감소되었다.

실시간 처리를 위한 멀티채널 오디오 코덱의 구현 (The Implementation of Multi-Channel Audio Codec for Real-Time operation)

  • 홍진우
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.91-97
    • /
    • 1995
  • 본 논문은 저비트율을 갖는 고품질의 HDTV용 멀티채녈 오디오 코덱을 구현에 대해 기술한다. 이 코덱은 저주파수 효과 채널을 포함한 최대 3/2 스테레오 채널 구성, 최대 채널 구성보다 낮은 채널 구성과의 호환성, 기존 2채널 스테레오 시스템과의 호환성(MPEG-1 오디오), 그리고 다중 대화 채널 등을 제공하는 특징을 갖는다. 구현한 멀티채널 오디오 코덱의 인코더는 3개의 DSP(TI의 TMS320C40)로 구성되었고, 최대 48KHz 샘플링율과 16비트의 부호화를 갖는 5.1 채널의 아날로그 및 AES/EBU, IEC 958등의 포맷을 갖는 스테레오 2채널의 디지털 오디오를 이력으로 받아 지각 심리음향 모델을 사용하여 압축한후 384Kbps의 빛 스트림으로 전송하는 특징을 가지며, 디코더는 2개의 DSP로 구성되어 있고, 384Kbps로 입력되는 비트 스트림을 받아 최대 5.1 채널의 아날로그 및 2개의 2채널 스테레오의 디지털 오디오 신호로 출력시키는 특징을 갖는다. DSP를 이용한 다중처리는 DMA를 통한 통신포트를 이용한 DSP들간의 고속 데이터 전송에 의해 이루어진다. 끝으로, 멀티 채널 오디오 코덱의 구현을 통하여 나타난 실시간 처리는 위해 고려해야할 기술적 사항을 제안한다.

  • PDF

Efficient CT Image Denoising Using Deformable Convolutional AutoEncoder Model

  • Eon Seung, Seong;Seong Hyun, Han;Ji Hye, Heo;Dong Hoon, Lim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권3호
    • /
    • pp.25-33
    • /
    • 2023
  • CT 영상의 획득 및 전송 등의 과정에서 발생하는 잡음은 영상의 질을 저하시키는 요소로 작용한다. 따라서 이를 해결하기 위한 잡음제거는 영상처리에서 중요한 전처리 과정이다. 본 논문에서는 딥러닝의 convolutional autoencoder (CAE) 모형에서 기존 컨볼루션 연산 대신 deformable 컨볼루션 연산을 적용한 deformable convolutional autoencoder (DeCAE) 모형을 이용하여 잡음을 제거하고자 한다. 여기서 deformable 컨볼루션 연산은 기존 컨볼루션 연산보다 유연한 영역에서 영상의 특징들을 추출할 수 있다. 제안된 DeCAE 모형은 기존 CAE 모형과 같은 인코더-디코더 구조로 되어있으나 효율적인 잡음제거를 위해 인코더는 deformable 컨볼루션 층으로 구성하고, 디코더는 기존 컨볼루션 층으로 구성하였다. 본 논문에서 제안된 DeCAE 모형의 성능 평가를 위해 다양한 잡음, 즉, 가우시안 잡음, 임펄스 잡음 그리고 포아송 잡음에 의해 훼손된 CT 영상을 대상으로 실험하였다. 성능 실험 결과, DeCAE 모형은 전통적인 필터 즉, Mean 필터, Median 필터와 이를 개선한 Bilateral 필터, NL-means 방법 뿐만 아니라 기존의 CAE 모형보다 정성적이고, 정량적인 척도 즉, MAE (Mean Absolute Error), PSNR (Peak Signal-to-Noise Ratio) 그리고 SSIM (Structural Similarity Index Measure) 면에서 우수한 결과를 보였다.

고성능 HEVC 부호기를 위한 루프 내 필터 하드웨어 설계 (Hardware Design of In-loop Filter for High Performance HEVC Encoder)

  • 박승용;임준성;류광기
    • 한국정보통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.335-342
    • /
    • 2016
  • 본 논문에서는 고성능 HEVC(High Efficiency Video Coding) 부호기를 위한 루프 내 필터의 효율적인 하드웨어 구조를 제안한다. HEVC는 양자화 에러가 발생하는 복원 영상에서 화질을 향상시키기 위해 디블록킹 필터와 SAO(Sample Adaptive Offset)으로 구성된 루프 내 필터를 사용한다. 그러나 루프 내 필터는 추가적인 연산으로 인하여 부호기와 복호기의 복잡도가 증가되는 원인이 된다. 제안하는 루프 내 필터 하드웨어 구조는 수행 사이클 감소를 위해 디블록킹 필터와 SAO를 3단 파이프라인으로 구현되었다. 또한 제안하는 디블록킹 필터는 6단 파이프라인 구조로 구현되었으며, 효율적인 참조 메모리 구조를 위해 새로운 필터링 순서로 수행된다. 제안하는 SAO는 화소들의 처리를 간소화하며 수행 사이클을 감소시키기 위해 한번에 6개의 화소를 병렬 처리된다. 제안하는 루프 내 필터 하드웨어 구조는 Verilog HDL로 설계되었으며, TSMC $0.13{\mu}m$ CMOS 표준 셀 라이브러리를 사용하여 합성한 결과 약 131K개의 게이트로 구현되었다. 또한 164MHz의 동작 주파수에서 4K@60fps의 실시간 처리가 가능하며, 최대 동작 주파수는 416MHz이다.

Bi-GRU 이미지 캡션의 서술 성능 향상을 위한 Parallel Injection 기법 연구 (Parallel Injection Method for Improving Descriptive Performance of Bi-GRU Image Captions)

  • 이준희;이수환;태수호;서동환
    • 한국멀티미디어학회논문지
    • /
    • 제22권11호
    • /
    • pp.1223-1232
    • /
    • 2019
  • The injection is the input method of the image feature vector from the encoder to the decoder. Since the image feature vector contains object details such as color and texture, it is essential to generate image captions. However, the bidirectional decoder model using the existing injection method only inputs the image feature vector in the first step, so image feature vectors of the backward sequence are vanishing. This problem makes it difficult to describe the context in detail. Therefore, in this paper, we propose the parallel injection method to improve the description performance of image captions. The proposed Injection method fuses all embeddings and image vectors to preserve the context. Also, We optimize our image caption model with Bidirectional Gated Recurrent Unit (Bi-GRU) to reduce the amount of computation of the decoder. To validate the proposed model, experiments were conducted with a certified image caption dataset, demonstrating excellence in comparison with the latest models using BLEU and METEOR scores. The proposed model improved the BLEU score up to 20.2 points and the METEOR score up to 3.65 points compared to the existing caption model.

수중통신에서 고 전송률을 위한 효율적인 복호 방법 (An Efficient Decoding Method for High Throughput in Underwater Communication)

  • 백창욱;정지원;천승용;김우식
    • 한국음향학회지
    • /
    • 제34권4호
    • /
    • pp.295-302
    • /
    • 2015
  • 수중에서의 음향 통신의 성능은 신호의 다중 경로 전달과정에 의해 발생하는 지역 확산 현상으로 인하여 인접 심볼간 간섭의 영향을 받는다. 따라서, 인접 심볼 간 간섭을 제거하기 위하여 수중 통신에 적합한 등화기 기술, 채널 부호화 기술이 필요하다. 또한, 수중에서는 시변 채널의 영향으로 인해 긴 사이즈의 데이터 전송 중 채널의 변화에 따라 수신 신호의 높은 오류율을 야기 시킨다. 본 논문에서는 다중 경로 환경에서 원활한 통신과 함께 수신 신호의 성능을 향상시키기 위하여 낮은 SNR(Signal to Noise Ratio)에서 우수한 성능을 보이는 부호화 기법인 BCJR(Bahl, Cocke, Jelinek, Raviv) 기반 컨볼루션 부호와 다중 경로로 인해 왜곡된 데이터를 보상하기 위한 기법인 결정 궤환 등화기가 결합된 터보 등화기를 기반으로 제한된 대역폭 내에서 전송률을 향상시킬 수 있는 큰 사이즈의 데이터를 효율적으로 복호 하는 방법에 대해 경북 문경시 경천호에서의 실제 수중 실험을 통하여 성능을 분석하였다.

4D-8PSK TCM 위성통신 시스템 시뮬레이터 설계 및 구현 (Design and Implementation of 4D-8PSK TCM Simulator for Satellite Communication Systems)

  • 김도욱;김중표;김상구;윤동원
    • 한국정보기술학회논문지
    • /
    • 제17권3호
    • /
    • pp.31-41
    • /
    • 2019
  • 본 논문에서는 CCSDS에서 권고하고 있는 대역폭 효율적인 변조 방식 중 채널당 2.0, 2.25, 2.5, 2.75 bits/symbol의 전송효율을 가지는 4D-8PSK TCM 시스템의 송신부와 수신부를 설계하고 시뮬레이터를 구현하여 AWGN 환경에서 모의시험을 통하여 BER 성능을 분석한다. 송신부는 CCSDS 표준을 준용하여 설계하고, 수신부는 차동 부호화 및 복호화를 일반화하여 차동 복호기를 설계하며, 트렐리스 복호 알고리즘은 보조격자의 정보와 비터비 알고리즘을 적용하여 설계하고, CCSDS 표준에서 주어진 8차원 성상도 맵퍼의 방정식을 가감법으로 풀어 성상도 디맵퍼를 설계한다. 특히, 컴퓨터 모의실험을 통해 비터비 복호기 설계 시 역추적 깊이에 따른 오류 성능을 제시하여 4D-8PSK TCM 시스템의 최적화된 송/수신부를 구현하고 성능을 분석한다.

고해상도 비디오 인코더 IP 설계에 대한 연구 (A Study on the Full-HD HEVC Encoder IP Design)

  • 이석호;조승현;김현미;이제현
    • 전자공학회논문지
    • /
    • 제52권12호
    • /
    • pp.167-173
    • /
    • 2015
  • 본 논문에서는 고해상도(Full-HD)급의 비디오를 처리할 수 있는 고효율 비디오 코딩(HEVC) 표준을 따르는 인코더 IP 설계에 대하여 기술한다. 설계된 IP는 HEVC 메인 프로파일 4.1급에 해당되며, 프레임 레이트는 60 fps 로 실시간 인코딩 가능하다. 하드웨어 및 소프트웨어 IP 설계 전에 C 언어로 전체 참조 모델을 개발하였으며 고속처리를 위한 병렬처리구조와 저 전력을 위한 스킵모드를 제안하였다. 또한 IP 관련 펌웨어 및 드라이버 프로그램을 작성하였다. IP 검증을 위한 플랫폼을 개발하였고 설계된 통합 IP를 FPGA 보드로 구현하여 다양한 영상에 대하여 여러 인코딩 조건에서 기능 및 성능을 검증하였다. HM-13.0대비 동일 PSNR에서 약 35% 정도의 비트율 감소와 저전력 모드에서 약 25% 정도의 전력 소모 감소 효과가 있었다.