• 제목/요약/키워드: encoder-decoder

검색결과 452건 처리시간 0.021초

적응 불규칙 양자화와 반복 복호를 이용한 비디오 코딩 방식에의 응용 (Adaptive Irregular Binning and Its Application to Video Coding Scheme Using Iterative Decoding)

  • 최강선
    • 한국통신학회논문지
    • /
    • 제31권4C호
    • /
    • pp.391-399
    • /
    • 2006
  • 센서 네트워크와 같이 한정된 리소스만을 사용할 수 있는 차세대 소형 무선 비디오 시스템을 위해 움직임 추정(motion estimation)이 필요 없는 저 복잡도의 비디오 인코딩 방식과 이를 효과적으로 디코딩하는 새로운 비디오 코딩 방식을 제안한다. 비디오 프레임을 주기적으로 인트라 코딩(Intra coding)하고 인트라 코딩된 프레임 사이에 있는 프레임에 대해선 제안하는 불규칙 양자화(irregular binning) 방식을 이용하여 효과적으로 코딩한다. 불규칙 양자화 방식은 코딩할 데이터의 Local statistics에 따라 각 구간의 길이를 조절함으로써 적은 수의 불규칙적인 구간으로도 효과적으로 데이터를 표현할 수 있다. 이와 함께, 연속된 프레임 간에 존재하는 높은 상관 관계(correlation)를 활용하기 위해 디코딩 시 불규칙 양자화 정보로 복원된 영상을 기초로 하여, 주변 프레임으로부터 움직임이 보상된 선명한 영상 부분(motion compensated image components)을 가져와 합성함으로써 복원된 프레임의 화질을 향상시키는 방법을 제안한다. 제안된 비디오 코딩 방식은 실험 결과에서 최신의 비디오 압축 방식인 H.264/AVC의 IB 코딩 모드와 유사한 성능을 보여주고 있다. 따라서 제안된 비디오 코딩 방식은 저 복잡도의 인코더가 필요한 응용 분야에 H.264/AVC를 대신하여 사용될 수 있다.

Channel-Adaptive Rate Control for Low Delay Video Coding

  • Lee, Yun-Gu
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권5호
    • /
    • pp.303-309
    • /
    • 2016
  • This paper presents a channel-adaptive rate control algorithm for low delay video coding. The main goal of the proposed method is to adaptively use the unknown available channel bandwidth while reducing the end-to-end delay between encoder and decoder. The key idea of the proposed algorithm is for the status of the encoder buffer to indirectly reflect the mismatch between the available channel bandwidth and the generated bitrate. Hence, the proposed method fully utilizes the unknown available channel bandwidth by monitoring the encoder buffer status. Simulation results show that although the target bitrate mismatches the available channel bandwidth, the encoder efficiently adapts the given available bandwidth to improve the peak signal-to-noise ratio.

딥러닝 기반의 Semantic Segmentation을 위한 DeepLabv3+에서 강조 기법에 관한 연구 (A Study on Attention Mechanism in DeepLabv3+ for Deep Learning-based Semantic Segmentation)

  • 신석용;이상훈;한현호
    • 한국융합학회논문지
    • /
    • 제12권10호
    • /
    • pp.55-61
    • /
    • 2021
  • 본 논문에서는 정밀한 semantic segmentation을 위해 강조 기법을 활용한 DeepLabv3+ 기반의 인코더-디코더 모델을 제안하였다. DeepLabv3+는 딥러닝 기반 semantic segmentation 방법이며 자율주행 자동차, 적외선 이미지 분석 등의 응용 분야에서 주로 사용된다. 기존 DeepLabv3+는 디코더 부분에서 인코더의 중간 특징맵 활용이 적어 복원 과정에서 손실이 발생한다. 이러한 복원 손실은 분할 정확도를 감소시키는 문제를 초래한다. 따라서 제안하는 방법은 하나의 중간 특징맵을 추가로 활용하여 복원 손실을 최소화하였다. 또한, 추가 중간 특징맵을 효과적으로 활용하기 위해 작은 크기의 특징맵부터 계층적으로 융합하였다. 마지막으로, 디코더에 강조 기법을 적용하여 디코더의 중간 특징맵 융합 능력을 극대화하였다. 본 논문은 거리 영상 분할연구에 공통으로 사용되는 Cityscapes 데이터셋에서 제안하는 방법을 평가하였다. 실험 결과는 제안하는 방법이 기존 DeepLabv3+와 비교하여 향상된 분할 결과를 보였다. 이를 통해 제안하는 방법은 높은 정확도가 필요한 응용 분야에서 활용될 수 있다.

사양변수를 이용한 비터비 복호기의 자동설계 (Automated Design of Viterbi Decoder using Specification Parameters)

  • 공명석;배성일;김재석
    • 전자공학회논문지C
    • /
    • 제36C권1호
    • /
    • pp.1-11
    • /
    • 1999
  • 본 논문에서는 이동 통신 시스템에서 많이 사용되는 다양한 사양의 비터비 복호기를 자동으로 생성할 수 있는 가변적 비터비 복호기의 설계방법을 제안한다. 여기서 제안하는 가변적 비터비 복호기는 구속장, 부호율, 생성다항식 등의 길쌈부호기 사양, 프레임당의 비트 수, 전송 속도 등의 데이터 전송 사양, 그리고 복호기의 성능을 위한 연판정 비트수 등을 매개 변수화(parameterization)하여, 사용자가 제공하는 사양변수에 맞는 비터비 복호기를 최적으로 자동 생성하도록 설계되었다. 이를 위해 C 언어로 설계된 사용자 인터페이스 환경 모듈을 구현하였고, 또한 VHDL 언어와 generic 변수를 활용한 비터비 복호기의 기능 블록 모듈이 계층 구조적으로 설계되었다. 설계된 가변적 비터비 복호기의 검증을 위해, IS-95 CDMA 시스템의 규격에 맞는 비터비 복호기를 자동 생성하여 기존의 설계된 내용과 비교 검증하였다. 제안된 방식은 앞으로 사양이 조금씩 바뀔 때마다 비터비 복호기를 새로이 설계할 필요없이, 변경된 사양만 제공함으로써 매우 빠른 시간내에 변경된 하드웨어 설계를 얻을 수 있는 새로운 설계방식이라 할 수 있다.

  • PDF

Multi-Tasking U-net 기반 파프리카 병해충 진단 (Multi-Tasking U-net Based Paprika Disease Diagnosis)

  • 김서정;김형석
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.16-22
    • /
    • 2020
  • 본 연구에서는 Multi-Tasking U-net를 사용하여 영역 세분화 작업(Segmentation) 과 분류 작업(Classification) 이 동시에 수행되게 함으로써 파프리카 병과 충 진단을 수행하였다. 시설 농장의 파프리카에는 병의 종류가 다양하지 않다. 이 연구에서는 비교적 발생빈도가 높은 흰가루병과 응애에 의한 피해, 정상 잎 3개의 클래스에 대해서만 진단 할 수 있도록 하였다. 이를 위한 중추 모델로는 U-net을 사용하였다. 또, 이 모델의 Encoder와 Decoder의 최종 단을 활용하여 분류 작업과 영역 세분화 작업이 각 각 수행되게하여, U-net의 Encoder가 분류작업과 영역 세분화 작업에 공유되도록 하였다. 학습 데이터로는 정상 잎 680장, 응애에 의한 피해 잎 450장, 흰가루병 370장을 사용하였다. 테스트 데이터로는 정상 잎 130장, 응애에 의한 피해 잎 100장, 흰가루병 90장을 사용하였고, 이를 통한 테스트 결과로는 89%의 인식률을 얻었다.

균일 화질 보장을 위한 스트리밍 비디오 시스템 설계에 관한 연구 (A Study on the Design of Uniform Quality Guaranteed Streaming Video System)

  • 박영환;박찬곤
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권8호
    • /
    • pp.53-64
    • /
    • 2013
  • 스트리밍 비디오 시스템(SVS)의 QoS에 관한 기존 연구는 네트워크 관점에서 전송되는 비디오 스트림을 조절하여 데이터의 손실과 지연을 방지하는데 중점을 두고 있다. 반면 비디오 스트림의 화질이 변화되면 균일화질을 원하는 사용자 입장에서의 QoS는 보장 받지 못하는 것이다. 이러한 문제를 해결하기 위하여 본 논문에서는 Encoder에서 프레임 당 발생 비트량이 일정하게 유지되는 CBR 스트리밍 비디오의 장점과 균일한 화질을 보장하는 VBR 스트리밍 비디오의 장점을 적용한 VBR to CBR Encoder와 CBR to VBR Decoder, 비디오 스트림에 대한 재생 제어를 설계하였다. 그리고 이를 기반으로 사용자에게 균일한 화질의 제공을 보장하는 균일 화질 보장 SVS를 설계하고 구현하였다. 본 논문에서 제안한 균일 화질 보장 SVS의 우수성을 입증하기 위하여 여러 특성의 샘플 비디오에 대한 PSNR을 평가하였다. 평가결과 균일 화질 보장 SVS의 성능이 CBW가 ABR 100%부터 85%까지의 환경에서 균일한 화질을 보장하여 우수성을 입증하였다.

도로 노면 파손 인식을 위한 Multi-scale 학습 방식의 암호화 형식 의미론적 분할 알고리즘 (Encoder Type Semantic Segmentation Algorithm Using Multi-scale Learning Type for Road Surface Damage Recognition)

  • 심승보;송영은
    • 한국ITS학회 논문지
    • /
    • 제19권2호
    • /
    • pp.89-103
    • /
    • 2020
  • 고령화 사회에 접어들면서 거동이 어려운 장애인과 고령자의 개인 교통수단에 대한 수요가 증가하고 있다. 실제로 2017년 기준 전국 전동보장구 보급수는 9만여 대로 지속해서 증가하는 추세다. 하지만 장애인 및 고령자의 판단 능력과 조정 능력은 정상인보다 상대적으로 차이가 있는 관계로 주행 중 사고 발생의 가능성이 크다. 다양한 사고의 원인 중 하나는 도로 노면상태의 불균형으로 인해 개인 이동 수단 조향 제어의 간섭이다. 본 논문에서는 이 같은 사고를 예방하고자 도로 노면 상태를 고속으로 인지할 수 있는 암호화 형식 의미론적 분할 알고리즘을 소개한다. 이를 위하여 도로 노면 파손이 포함된 1,500여 장의 학습용 데이터와 150여 장의 테스트용 데이터를 새롭게 구성하였다. 그리고 이를 활용하여 기존의 Encoder와 Decoder 단계로 구성된 Auto-encoder 방식과 달리 Encoder 단계로 이루어진 심층 신경망을 제안하였다. 이 심층 신경망은 기존의 방식과 비교했을 때 평균 정확도(Mean Accuracy)는 4.45% 증가하였고 파라미터는 59.2% 감소하였으며 연산 속도는 11.9% 향상되었다. 이 같은 고속 알고리즘을 활용하여 안전한 개인 이동 수단이 확대 적용되길 기대한다.

네트워크 기반 객체 지향형 영상 처리를 위한 MPEG 디코더 코어 설계 (Design of Core of MPEG Decoder for Object-Oriented Video on Network)

  • 박주현;김영민
    • 한국통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.2120-2130
    • /
    • 1998
  • 본 논문은 네트워크를 기반으로 한 객제 지향형 영상 처리를 하는 프로그램이 가능한 MPEG 디코더 설계를 다룬다. 설계된 MPEG 디코더는 객체 지향형 프로그램을 지원할 수 있도록 스택 버퍼를 이용한 콘트롤러를 내장하고 있어서 객체에 기반한 영상 처리에 효과적이며, 소프트웨어 지향적인 영상 표준에 적용되도록 다양한 포맷의 입력 데이터 처리가 가능하다. 또한 벡터 연산부에서는 MPEG-4의 반화소 단위 처리와 고급 모드 보상(Compensation), 예측(Prediction)이 가능하며, SA(Shape Adaptive)-IDCT 가 가능하다. 또한 벡터 처리기 내에 절대값기, 반감기를 두어 인코더로 확장할 수 있도록 하였다. 설계 및 검증은 $0.6{\mu}{\textrm{m}}$ 5-Volt CMOS TLM(Three Layer Metal) COMPASS 라이브러리를 이용하였다.

  • PDF

Recursive block splitting in feature-driven decoder-side depth estimation

  • Szydelko, Błazej;Dziembowski, Adrian;Mieloch, Dawid;Domanski, Marek;Lee, Gwangsoon
    • ETRI Journal
    • /
    • 제44권1호
    • /
    • pp.38-50
    • /
    • 2022
  • This paper presents a study on the use of encoder-derived features in decoder-side depth estimation. The scheme of multiview video encoding does not require the transmission of depth maps (which carry the geometry of a three-dimensional scene) as only a set of input views and their parameters are compressed and packed into the bitstream, with a set of features that could make it easier to estimate geometry in the decoder. The paper proposes novel recursive block splitting for the feature extraction process and evaluates different scenarios of feature-driven decoder-side depth estimation, performed by assessing their influence on the bitrate of metadata, quality of the reconstructed video, and time of depth estimation. As efficient encoding of multiview sequences became one of the main scopes of the video encoding community, the experimental results are based on the "geometry absent" profile from the incoming MPEG Immersive video standard. The results show that the quality of synthesized views using the proposed recursive block splitting outperforms that of the state-of-the-art approach.

Recursive 구조를 이용한 MPEG-2 AAC 복호화기의 필터뱅크 구현 (Architecture Design for MPEG-2 AAC Filter bank Decoder using Recursive Structure)

  • 박세기;강명수;오신범;이채욱
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.865-873
    • /
    • 2004
  • MPEG-2 Advanced Audio Coding(AAC) is widely used in the multi-channel audio compression standards. And it combines hi인-resolution filter bank prediction techniques, and Huffman coding algorithm to achieve the broadcast-quality audio level at very low data rates. The forward and inverse modified discrete transforms which are operated in the encoder and the decoder of the filter bank need many computations. In this paper, we propose suitable recursive structure at IMDCT processing for MPEG-2 AAC real-time decoder. We confirm the memory, the computation speed and complexity of the proposed structure.