• 제목/요약/키워드: Moving Picture Compression

검색결과 59건 처리시간 0.021초

무반복 프랙탈 영상 압축의 복호 특성 분석에 관한 연구 (A Study on Decoding Characteristic Analysis of Non-iterative Fractal Image Compression)

  • 곽노윤
    • 디지털콘텐츠학회 논문지
    • /
    • 제5권3호
    • /
    • pp.199-204
    • /
    • 2004
  • 저비트율에서도 우수한 화질을 제공하는 프랙탈 영상 압축 기법들이 갖고 있는 하나의 문제점은 복호화가 반복 처리를 통해 구현되며 그 복잡도가 각각의 영상에 따라 상이하다는 것이다. 이러한 문제를 해소하기 위해 본 논문은 복호 시간을 단축시키기 위해 반복 변환이 필요 없는 프랙탈 영상 복호 알고리즘을 제안하고 그 성능을 분석함에 그 목적이 있다. 제안된 프랙탈 복호 알고리즘은 복호기에서 사용할 초기 영상과 동일한 코드북 영상을 부호기에 보유하고 있는 상태에서 부호화 과정에서는 이 코드북 영상과 부호화하려는 영상의 유사성을 찾아 프랙탈 계수를 구한다. 이후, 수신단의 복호화 과정에서는 수신된 프랙탈 계수와 기설정된 초기 영상을 이용하여 반복 변환 없이 한 번에 영상을 복호함으로써 반복 변환 횟수의 역수배만큼 복호 소요 시간을 현저하게 단축시킬 수 있었다. 제안된 방법의 타당성과 보편성을 검증하기 위해 서로 다른 분포 특성을 갖는 복수의 정지 영상과 동영상을 대상으로 복호 소요 시간과 화질 측면에서 그 성능을 평가$\cdot$분석하였다.

  • PDF

피처 프레임 구성 방안에 따른 피처 맵 압축 효율 및 머신 태스크 성능 분석 (Analysis of Feature Map Compression Efficiency and Machine Task Performance According to Feature Frame Configuration Method)

  • 이성배;이민석;김규헌
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.318-331
    • /
    • 2022
  • 최근 하드웨어 연산 장치와 소프트웨어 기반 프레임워크의 발전으로 딥러닝 네트워크를 활용한 머신 태스크가 다양한 산업 분야 및 개인 IoT 장비에서의 활용이 기대되고 있다. 그러나 딥러닝 네트워크를 구동하기 위한 장치의 고비용 문제와 서버에서 머신 태스크 결과만을 전송받을 때 사용자가 요구하는 결과를 받지 못할 수 있다는 제한 사항을 극복하기 위하여 Collaborative Intelligence (CI)에서는 피처 맵의 전송을 그 해결 방법으로 제시하였다. 본 논문에서는 CI 패러다임을 지원하기 위하여 방대한 데이터 크기를 갖는 피처 맵의 효율적인 압축 방법을 실험을 통해 분석 및 제시하였다. 해당 방법은 전통적인 비디오 코덱에서의 압축 효율을 높이기 위하여 피처 맵의 재정렬을 적용하여 중복성을 높였으며, 정지 영상 압축 포맷과 동영상 압축 포맷을 동시에 활용하여 압축 효율을 높이고 머신 태스크의 성능을 유지하는 피처 맵 방법을 제시하였다. 본 논문에서는 이와 같은 방법의 분석을 통해 MPEG-VCM의 피처 압축 앵커 대비 BPP와 mAP의 BD-rate에서 14.29%의 성능이 향상됨을 검증하였다.

PCA 기반 변환을 통한 다해상도 피처 맵 압축 방법 (A Feature Map Compression Method for Multi-resolution Feature Map with PCA-based Transformation)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.56-68
    • /
    • 2022
  • 본 논문에서는 VCM을 위한 다해상도 피처 맵에 대한 압축 방법을 제안한다. 제안하는 압축 방법은 PCA 기반의 변환을 통해 다해상도 피처 맵의 채널 및 해상도 계층 간 중복성을 제거하며 변환에 사용된 기저 벡터와 평균 벡터 그리고 변환을 통해 얻어진 변환 계수를 각각의 특성에 따라 VVC 기반 부호화기와 DeepCABAC을 통하여 압축한다. 제안하는 방법의 성능을 측정하기 위하여 OpenImageV6와 COCO 2017 validation set에 대하여 객체 검출 성능을 평가하며, MPEG-VCM 앵커 및 본 논문에서 제안하는 피처 맵 압축 앵커 대비 bpp와 mAP를 BD-rate 관점에서 비교한다. 실험 결과, 제안하는 방법은 OpenImageV6에서 피처 맵 압축 앵커 대비 25.71%의 BD-rate 성능 향상을 보이며, 특히 COCO 2017 validation set의 크기가 큰 객체들에 대해서 MPEG-VCM 앵커 대비 최대 43.72%의 BD-rate 성능이 향상됨을 보인다.

웨이블렛 변환을 이용한 오디오 코딩 (Audio Signal Coding Using Wavelet Transform)

  • 배석모;김도형;정재호
    • 한국음향학회지
    • /
    • 제16권4호
    • /
    • pp.64-70
    • /
    • 1997
  • 본 논문은 MPEG의 서브밴드 필터링을 웨이블렛 변환으로 대체하였을 때 얼마만큼의 계산량이 감소하는 가를 연구하였다. MPEG 오디오에서는 16비트 PCM 오디오 데이타를 입력으로 받아 서브밴드 필터링후 서브밴드 샘플을 양자화하여 전송하는 것을 기본으로 한다. MPEG의 서브밴드 필터링의 경우 32 대역의 등간격으로 분할한다. 이 경우 32개의 필터가 필요하고 각 필터는 512의 길이를 갖는 필터를 사용한다. 본 연구에서는 분할 대역을 6개로 하고 웨이블렛 필터중 가장 짧은 Haar 필터를 사용하였다. 제안된 시스템은 256kbps 이상의 전송율에서는 MPEG 오디오와 비슷한 수준의 CD 음질을 유지하였으며, 계산량 비교결과 부호화기는 약 40%, 복호화기는 약 70%의 감소를 보였다.

  • PDF

Implementation of MDCT core in Digital-Audio with Micro-program type vector processor

  • Ku Dae Sung;Choi Hyun Yong;Ra Kyung Tae;Hwang Jung Yeun;Kim Jong Bin
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 학술대회지
    • /
    • pp.477-481
    • /
    • 2004
  • High Quality CD, OAT audio requires that large amount of data. Currently, multi channel preference has been rapidly propagated among latest users. The MPEG(Moving Picture Expert Group) is provides data compression technology of sound and image system. The MPEG standard provides multi channel and 5.1 sounds, using the same audio algorithm as MPEG-l. And MPEG-2 audio is forward and backward compatible. The MDCT (Modified Discrete Cosine Transform) is a linear orthogonal lapped transform based on the idea of TDAC(Time Domain Aliasing Cancellation). In this paper, we proposed the micro-program type vector processor architecture a benefit in MDCT/IMDCT of MPEG-II AAC. And it's reduced operating coefficient by overlapped area to bind. To compare original algorithm with optimized algorithm that cosine coefficient reduced $0.5\%$multiply operating $0.098\%$ and add operating 80.58\%$. Algorithm test is used C-language then we designed hardware architecture of micro-programmed method that applied to optimized algorithm. This processor is 20MHz operation 5V.

  • PDF

균일전력 밀도의 엔벨로프 발생기와 변환 부호화 방식의 정보량 축소를 이용한 음원 전용DSP설계에 관한 연구 (A Study on the Design of Digital Sound Processor for Music using Equal Power Density Envelope Generator and Transform Coder)

  • 구재을;방효창;김종한;김원후
    • 한국음향학회지
    • /
    • 제14권3호
    • /
    • pp.14-27
    • /
    • 1995
  • 본 논문은 ADPCM에 MPEG (Moving Picture Expert Group)에서 사용하는 변환 부호화 방식을 이요한 양자화 잡음의 축소와 균등 전력 밀도의 엔벨로프 재생 방식을 이용하여 악기의 특색에 따라 서로 다른 형태의 정보량 축소 방식을 채택한 디지탈 음원 DSP에 관하여 기술한다. 이를 검증하기 위하여 32개의 악기 소리를 동시에 구현할 수 있는 일종의 RISC인 음발생 전용 DSP를 설계하였고 1MByte의 메모리에 200여가지의 악기음을 코딩하여 알고리즘의 정확성을 입증하였다.

  • PDF

변형된 비용 함수를 이용한 움직임 추정 기법 (Motion Estimation Using Modified Cost Functions)

  • 조한욱;서정욱;정제창
    • 방송공학회논문지
    • /
    • 제3권1호
    • /
    • pp.100-109
    • /
    • 1998
  • 최근 HDTV나 화상회의 시스템, VOD(video on demand) 서비스 등에서 쓰이는 영상 신호의 부호화가 주요한 관심사가 되고 있다. 동영상 압축 알고리즘에서 움직임 추정기법은 매우 중요한 역할을 담당하는 반면, 수행시간이나 하드웨어 구현에 어려움이 많아 이를 개선하기 위한 많은 알고리즘들이 개발되어 왔다. 본 논문에서는 적절한 화소 분류를 통해 우수한 화질과 적은 계산량, 간단히 하드웨어 구조를 가지는 효율적인 움직임 추정기법을 제안한다. 기존의 1-비트 화소 분류 방법에서 변형된 새로운 비용 함수를 이용한 2-비트, 3-비트 호소 분류 방법과 2차 비용함수를 이용한 화소 분류 방법을 제안하였다. 또한 여러 고속 움직임 추정 알고리즘과도 쉽게 연결하여 사용할 수 있으며 우수한 성능을 나타내는 것을 모의 실험을 통해 보였다.

  • PDF

화상회의를 위한 웨이브렛 변환 부호화 (Wavelet Transform Coding for Image Conference)

  • 김정일
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권3호
    • /
    • pp.73-77
    • /
    • 1999
  • 본 논문은 화상회의를 위한 웨이브렛 변환 부호화에 관하여 연구한 것이다. 먼저, 원영상을 웨이브렛 변환계수의 대역별 특성을 이용하여 다차원의 계층적 피라미드 영상으로 구성하고. 이웃된 프레임 간의 움직임 정보를 구하였다. 그리고. 구해진 움직임 정보를 이용하여 기준 프레임 영상과 상관관계가 적은 프레임 영상에서는 화질을 보장하고, 상관관계가 많은 프레임 영상에서는 전체 동영상의 비트율을 보장하는 픽쳐 셋 필터를 제안하였다. 실험 결과 제안한 방법은 기존의 전영역 탐색 블럭 정합 알고리즘과 차영상 알고리즘에 비해 좋은 성능을 나타냄을 확인하였다.

H.264/AVC용 면적 효율적인 인트라 프레임 디코더 설계 (Area-efficient Design of Intra Frame Decoder for H.264/AVC)

  • 정덕영;손승일
    • 한국정보통신학회논문지
    • /
    • 제10권11호
    • /
    • pp.2020-2025
    • /
    • 2006
  • H.264/AVC는 ITU-T 비디오 코딩 전문가 그룹과 ISO/IEC MPEG 그룹에 의해 제안된 최신 비디오 코딩 표준안이다. 최근 DMB와 멀티미디어 장비들이 비디오 압축 표준으로 H.264/AVC를 채택하고 있다. 본 논문에서는 메모리 사용을 최소화하고, 칩 면적을 최소화할 수 있는 H.264/AVC의 인트라 프레임 디코더를 제안한다. 제안한 인트라 프레임 디코더는 하드웨어 설계 언어인 VHDL로 기술하여 model_sim을 사용하여 시뮬레이션을 수행하였다. 그리고 FPGA칩인 XCV1000E에 다운로드하여 칩 레벨에서 설계된 H.264/AVC의 인트라 프레임 디코더를 검증하였다.

MMT를 이용한 PCC 데이터 송수신 기술 개발 (Development of PCC data transmission and reception using MMT)

  • 박성환;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.576-578
    • /
    • 2020
  • 최근 사용자에게 더욱 몰입감 있는 콘텐츠를 제공하기 위한 기술에 대한 관심이 증가하고 있으며 기존의 2D 콘텐츠와는 다른 새로운 방식인 3D 콘텐츠에 대한 연구가 활발히 진행되고 있으며 그 중 가장 대표적인 것이 Point Cloud 영상이라고 할 수 있다. Point Cloud의 경우 수많은 3차원 좌표를 가진 점들로 구성되어 있으며 각 점들마다 Attribute 값을 이용하여 색상 등의 표현이 가능한 구조로 이루어져 있다. 이러한 특성 때문에 Point Cloud 데이터는 방대한 용량을 가지고 있으며 기존의 2D 방식과 데이터 구조가 상이하기 때문에 새로운 압축 표준이 요구되었다. 이에 미디어 표준화 단체인 MPEG(Moving Picture Experts Group)에서는 MPEG-I(Immersive) 차세대 프로젝트 그룹을 이용하여 이러한 움직임에 대응하고 있다. MPEG-I의 part 5(Video-based Point Cloud Compression, V-PCC)에서는 객체를 대상으로 하여 기존의 비디오 코덱을 활용한 Point Cloud 압축 표준화를 진행중이다. V-PCC 데이터의 경우 기존의 2D 영상 데이터와 같이 전송을 통해 소비될 가능성이 아주 높기 때문에 이에 대한 고려가 필요하다. 현재 MPEG에서 표준화를 완료한 MMT(MPEG Media Transport)라는 전송 표준이 존재하기 때문에 이 기술을 활용 가능할 것으로 보인다. 따라서 본 논문에서는 Point Cloud 데이터를 압축한 V-PCC 데이터를 전송 표준 방식인 MMT를 이용하여 전송하는 방안에 대하여 제안한다.

  • PDF