• 제목/요약/키워드: video compression.

검색결과 779건 처리시간 0.026초

프레임 분할과 3D 웨이블릿 변환을 이용한 비디오 워터마킹 (Digital Video Watermarking Using Frame Division And 3D Wavelet Transform)

  • 김광일;최기철;김종원;최종욱
    • 정보보호학회논문지
    • /
    • 제18권3호
    • /
    • pp.155-162
    • /
    • 2008
  • 본 논문에서는 동영상 콘텐츠의 저작권 보호를 위해 3D 웨이블릿 변환과 대역확산방법(direct spread spectrum)을 이용한 비디오 워터마킹 알고리즘을 제안하였다. 제안한 방법은 동기 워터마크를 삽입한 다음 사용자 정보를 갖는 워터마크를 삽입하게 된다. 입력된 프레임을 분할하고, 다시 홀수행과 짝수행으로 정렬하여 각각 3D 웨이블릿 변환을 수행한 다음 대역확산 방법으로 워터마크를 삽입한다. 기존의 3D 웨이블릿을 이용한 비디오 워터마킹 알고리즘과는 달리 제안한 방법은 blind 방식으로써 원본 영상 없이 워터마크 검출이 가능하다. 실험결과 PSNR은 평균 40 dB 이상으로써 높은 비가시성을 만족하는 동시에 프레임 절삭, 잡음 첨가, 압축 등의 공격에서도 10% 이하의 BER을 기록하여 공격에 강인한 것으로 확인되었다.

다시점 비디오의 휘도 및 색차 성분 불일치 보상을 위한 히스토그램 매칭 기반의 전처리 기법 (New Prefiltering Methods based on a Histogram Matching to Compensate Luminance and Chrominance Mismatch for Multi-view Video)

  • 이동석;유지상
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.127-136
    • /
    • 2010
  • 다시점 비디오는 카메라간의 다른 위치와 불완전한 카메라 보정(calibration)으로 인접한 시점의 영상 내에 존재하는 동일물체 간에 색상 차이가 발생할 수 있다. 이러한 색상 불일치(color mismatch)는 시점 간 움직임 예측(inter-view prediction) 수행 시, 오정합을 발생시켜 다시점 비디오 부호화(Multi-view Video Coding : MVC) 성능을 저하시키는 원인이 된다. 본 논문에서는 이웃하는 영상 간에 존재하는 휘도 및 색차 성분 불일치를 보상하여 다시점 비디오 부호화의 압축률을 향상시키는 전처리 기법을 제안한다. 제안된 기법에서는 모든 시점의 영상을 히스토그램 매칭 기법에 의해 정해진 참조 시점 영상의 색상을 기준으로 보정된다. 또한 히스토그램 매칭 수행 전에 YCbCr 색상공간 변경 시에 색차 성분의 대표 값 추출(chrominance subsampling)에 사용되는 Cosited filter를 영상의 각 색상성분에 적용하여 성능을 더욱 높일 수 있다. 히스토그램 매칭은 YCbCr 색상공간에서 RGB 색상공간으로 변환하여 각 색상성분에 적용한다. 이 과정에서 영상에 존재하는 에지의 방향성과 화소 값의 존재 범위를 고려한 효과적인 색상 변환 기법이 사용된다. 실험을 통해 제안하는 전처리 기법이 다른 기법들에 비해 향상된 부호화 효율을 가지는 것을 확인하였다.

디지털 비디오 보호를 위한 카오스 사상 기반의 암호화 방법 (Encryption Method Based on Chaos Map for Protection of Digital Video)

  • 윤병춘;김덕환
    • 전자공학회논문지CI
    • /
    • 제49권1호
    • /
    • pp.29-38
    • /
    • 2012
  • 네트워크 환경과 유무선 통신 기술의 급속한 발달로 인해 비디오 콘텐츠의 배포가 손쉽게 이루어짐에 따라 비디오 콘텐츠에 대한 보안은 매우 중요시 되고 있다. 따라서 본 논문에서는 MPEG-2 비디오 인코딩 과정 내에 복수의 카오스 사상 기반의 디지털 비디오 암호화 방법을 제안한다. 제안방법은 카오스 사상인 텐트 사상(Tent map)을 기본블록으로 하는 해시체인으로부터 128-bit의 난수특성이 우수한 비밀 해시 키를 생성하고 이를 로지스틱 사상(Logistic Map)과 헤논 사상(Henon map)에 적용하여 64개의 난수로 이루어진 $8{\times}8$ 난수블록을 생성한다. 제안한 방법은 $8{\times}8$ 난수 블록과 DCT 블록 내 영상정보에 대한 파급효과가 큰 저주파 계수들에 대해 선택적으로 XOR 암호화 연산을 수행함으로써 암호화 처리에 따른 오버헤드를 줄일 수 있으며, 복수의 카오스 사상을 결합한 구조를 사용하여 비교적 간단하면서 우수한 난수특성을 제공한다. 실험 결과를 통해 제안 방법은 암호화된 영상에 대해 PSNR이 12dB 이하로 좋은 시각적 암호화 성능을 나타냈으며, 압축 효율성 측면의 시간변화율과 압축 변화율은 각각 2%와 0.4% 이내의 실시간성에 적용 가능한 성능을 나타냈다.

부분 선형 근사 모델을 이용한 적응적 비트율 제어 (An Adaptive Rate Control Using Piecewise Linear Approximation Model)

  • 조창형;정제창;최병욱
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.194-205
    • /
    • 1997
  • 동영상 압축 표준인 MPEG이나 저속 통신용 비디오 부호화 표준인 H.263등과 같은 DPCM/DCT 복합 부호화기에서 비트율 제어는 매우 중요한 요소이다. 본 논문에서는 전송매체에서의 실시간 비디오 부호화나 저장 미디어 응용을 위하여 부분 선형 근사 모델을 이용한 간단한 적응적 비트율 제어 방법을 제안한다. 선형 모델에 기반한 기존의 버퍼 제어 기법은 버퍼 충만도에 따라서 선형적으로 양자화매개변수를 제어하지만 제안된 방법은 영상 부호화에서 logarithmic관계라고 알려진 양자화 매개변수와 비트량의 비선형적인 관계를 부분적으로 선형 근사화 시킨 모델을 이용한다. 또한 보다 좋은 화질을 얻기 위하여 I 화면마다 공간영역에서 영상의 복잡도를 해석하여 적응적으로 제어한다. 실험적으로 기존의 선형 모델 방법과 비교하여 제안된 방법이 화질의 변화가 심하지 않으면 전체적으로 안정된 복원 영상을 얻었다.

  • PDF

SIFT를 이용한 장면전환 검출 및 필터링 기술 (Scene Change Detection and Filtering Technology Using SIFT)

  • 문원준;유인재;이재청;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.939-947
    • /
    • 2019
  • 미디어 시장의 활성화로 영상의 압축, 검색, 편집, 저작권 보호등의 필요성이 높아지고 있다. 본 논문에서는 이 모든 분야에 사용되는 영상의 장면 전환을 검출하는 방법을 제안한다. 유통 과정에서 발생 가능한 해상도 변환, 자막 삽입, 압축, 영상 반전등의 변형이 추가되더라도 동일하게 장면 전환을 검출하기 위해 전처리 과정과 SIFT를 이용한 특징점 추출, 변형을 고려한 매칭 알고리즘을 제시한다. 또한 이를 필터링 기술에 적용하여 알고리즘에서 고려한 변형 이외의 변형에도 유효함을 확인한다.

클러스터환경에서 MPI를 이용한 병렬 MPEG인코더의 설계 및 구현 (Design and Implementation of Parallel MPEG Encoder with MPI on Cluster System)

  • 이좌형;정인범
    • 한국정보통신학회논문지
    • /
    • 제12권10호
    • /
    • pp.1744-1750
    • /
    • 2008
  • 최근 컴퓨터와 네트워크 기술이 빠르게 발전하고 널리 보급되면서 텍스트 위주로 작업을 하던 어플리케이션들의 비중이 낮아지고 멀티미디어 데이터를 처리하는 어플리케이션들의 비중이 점차 증가하고 있는 추세이다. 다양한 멀티미디어들 중에서 동영상 멀티미디어를 다루는 프로그램들은 멀티미디어 응용 어플리케이션들 중에서 큰 비중을 차지하고 있으며 실생활에서 널리 사용되고 있다. 대표적 인 동영상 압축 표준인 MPEG의 경우 매우 높은 압축률을 제공하여 일반 사용자들도 손쉽게 동영상 데이터를 접하고 사용할 수 있는 기회를 제공한다. 하지만 MPEG 인코딩은 매우 많은 컴퓨팅 자원과 시간을 요하는 작업이다. 본 연구에서는 동영상 데이터를 인코딩하는데 소요되는 시간을 줄이기 위해 클러스터 환경에서 MPI를 이용하여 동영상 압축 표준인 MPEG 기반의 병렬 인코더를 설계 및 구현하였다.

강화학습 기반 비활성 영역 패딩 기술 (Reinforcement Learning based Inactive Region Padding Method)

  • 김동신;우딘 쿠툽;오병태
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.599-607
    • /
    • 2021
  • 비활성 영역이란 특정 영상을 표현하기 위해 유효하지 않은 화소 값으로 채워지는 영역을 의미한다. 일반적으로 원본 영상의 형태가 사각형 형태가 아닌 경우 이를 사각형 형태로 변환하는 과정에서 주로 발생하며, 특히 3D 영상을 2D로 표현할 때 자주 발생한다. 이러한 비활성 영역은 압축 효율을 크게 저하시키기 때문에, 활성 영역과 비활성 영역의 경계 부분에 필터링 기술 등을 적용해 해결해 왔다. 하지만 일반적인 필터링 적용 기술은 영상의 특성을 적절하게 반영하지 못할 가능성이 크다. 제안하는 기법에서는 영상의 특성과 압축 과정을 고려한 강화학습을 통한 패딩을 진행하였다. 실험결과 제안한 기법이 기존 기법보다 평균 3.4% 성능이 향상됨을 확인할 수 있다.

Experiment on Intermediate Feature Coding for Object Detection and Segmentation

  • Jeong, Min Hyuk;Jin, Hoe-Yong;Kim, Sang-Kyun;Lee, Heekyung;Choo, Hyon-Gon;Lim, Hanshin;Seo, Jeongil
    • 방송공학회논문지
    • /
    • 제25권7호
    • /
    • pp.1081-1094
    • /
    • 2020
  • With the recent development of deep learning, most computer vision-related tasks are being solved with deep learning-based network technologies such as CNN and RNN. Computer vision tasks such as object detection or object segmentation use intermediate features extracted from the same backbone such as Resnet or FPN for training and inference for object detection and segmentation. In this paper, an experiment was conducted to find out the compression efficiency and the effect of encoding on task inference performance when the features extracted in the intermediate stage of CNN are encoded. The feature map that combines the features of 256 channels into one image and the original image were encoded in HEVC to compare and analyze the inference performance for object detection and segmentation. Since the intermediate feature map encodes the five levels of feature maps (P2 to P6), the image size and resolution are increased compared to the original image. However, when the degree of compression is weakened, the use of feature maps yields similar or better inference results to the inference performance of the original image.

VCM 의 MSFC 기반 특징 압축을 위한 Min-Max 시그널링을 제외한 특징맵 생성 기법 (A Feature Map Generation Method for MSFC-Based Feature Compression without Min-Max Signaling in VCM)

  • 김동하;윤용욱;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.79-81
    • /
    • 2022
  • MPEG-VCM(Video Coding for Machines)에서는 머신비전(machine vision) 네트워크의 백본(backbone)에서 추출된 이미지/비디오 특징 압축을 위한 표준화를 진행하고 있다. 현재 VCM 표준기술 탐색 과정에서 가장 좋은 압축 성능을 보이는 MSFC(Multi-Scale Feature compression) 기반 압축 네트워크 모델은 추출된 멀티-스케일 특징을 단일-스케일 특징으로 변환하여 특징맵으로 구성하고 이를 VVC 로 압축한다. 본 논문에서는 MSFC 기반 압축 모델에서 Min-Max 값 시그널링을 제외한 최소-최대(Min-Max) 정규화를 포함한 개선된 특징맵 생성 기법을 제시한다. 즉, 제안기법은 VCM 디코더에서의 특징맵 복원을 위한 Min-Max 값을 학습 기반으로 생성함으로써 Min-Max 시그널링의 비트 오버헤드 절감뿐만 아니라 별도의 시그널링 기제를 생략한 보다 단순한 전송 비트스트림 구성을 가능하게 한다. 실험결과 제안기법은 이미지 앵커(Anchor) 대비 BPP-mAP 성능에서 83.24% BD-rate 이득을 보이며, 이는 기존 MSFC 보다 1.74%정도 다소 떨어지지만 별도의 Min-Max 시그널링 없이도 기존의 성능을 유지할 수 있음을 보인다.

  • PDF

공간 도메인 기반 캡슐화 방안 (Spatial domain-based encapsulation scheme)

  • 이상민;남귀중;이성배;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.818-820
    • /
    • 2022
  • 포인트 클라우드 데이터는 자율 주행 기술, 가상 현실 및 증강 현실에서 사용될 3차원 미디어 중 하나로 각광 받고 있다. 국제 표준화 기구인 MPEG(Moving Picture Expert Group)에서는 포인트 클라우드 데이터의 효율적인 압축을 위해 G-PCC(Geometry-based Point Cloud Compression) 및 V-PCC(Video-based Point Cloud Compression)의 표준화를 진행 중에 있다. 그 중, G-PCC는 본래 단일 프레임의 압축을 수행하는 정지 영상 압축 방식이지만, LiDAR(Light Detection And Ranging) 센서를 통해 획득된 동적 포인트 클라우드 프레임에 대한 압축의 필요성이 대두됨에 따라 G-PCC 그룹에서는 Inter-EM(Exploratory Model)을 신설하여 LiDAR 포인트 클라우드 프레임의 압축에 관한 연구를 시작하였다. Inter-EM의 압축 비트스트림은 G-PCC 비트스트림과 마찬가지로 효과적인 전송 및 소비를 위해 미디어 저장 포맷인 ISOBMFF(ISO-based Media File Format)으로 캡슐화될 수 있다. 이때, 포인트 클라우드 프레임들은 자율 주행 등의 서비스에 사용하기 위해 시간 도메인뿐만 아니라 공간 도메인을 기반으로도 소비될 수 있어야 하지만, 공간 도메인을 기반으로 콘텐츠를 임의 접근하여 소비하는 방식은 기존 2D 영상의 시간 도메인 기반 소비방식과 차이로 인해 기존에 논의된 G-PCC 캡슐화 방안만으로는 지원이 제한된다. 이에, 본 논문에서는 G-PCC 콘텐츠를 공간 도메인에 따라 소비하기 위한 ISOBMFF 캡슐화 방안에 대한 파일 포맷을 제안하고자 한다.

  • PDF