• 제목/요약/키워드: Peak signal to noise ratio

검색결과 490건 처리시간 0.029초

디지털 방송 서비스를 위한 MPEG-2 비디오 프로그램들의 결합 화질 제어 (Joint Quality Control of MPEG-2 Video Programs for Digital Broadcasting Services)

  • 홍성훈;김성대
    • 방송공학회논문지
    • /
    • 제3권1호
    • /
    • pp.69-84
    • /
    • 1998
  • 현재 디지털 위성 TV, CATV, 디지털 지상 TV와 같은 디지털 방송 서비스에서는 MPEG-2로 압축된 다수의 비디오 프로그램들을 일정 비트율을 갖는 하나의 기존 방송 채널을 통하여 동시에 전송한다. 본 논문에서는 이러한 환경에서 각 프로그램을 VBR (Variable Bit Rate) 압축 부호화하는 부호화기들을 동시에 제어함으로써 프로그램들간의 상대적 화질을 정확하게 제어할 수 있는 결합 화질 제어 방식을 제안한다. 제안된 방식은 결합 화질 제어되는 모든 프로그램의 영상들에 대한 전체 목표 비트 할당과정에서 비디오 버퍼의 넘침과 고갈을 방지하고, 비트율-왜곡 곡선의 변형처리에 의하여 고화질을 요구하는 프로그램들과 나머지 프로그램들의 상대적인 화질을 PSNR 관점에서 정확하게 제어한다. 한편 본 논문에서는 결합 화질 제어의 기반이 되는 MPEG-2 비디오에 대한 비트율-왜곡 추정 방식을 제시하고 시험을 통하여 성능을 평가한다. 제안된 비트율-왜곡 추정의 장점은 추정을 위한 주 연산이 양자화기에 입력되는 DCT 계수의 히스토그램을 구하는 것이므로 계산량이 매우 적고, 추정 결과가 실제의 MPEG-2 비디오 응용에 적용할 수 있을 만큼 정확하다는 것이다. 실험 결과 제안된 화질 제어 방식을 한 채널을 통해 전송되는 비디오 프로그램들간의 상대적인 화질을 매우 정확하게 제어할 뿔만 아니라 각 프로그램을 독립적으로 부호화하는 방식에 비하여 보다 일관된 화질과 향상된 화질을 제공함을 확인하였다.

  • PDF

적대적생성신경망을 이용한 연안 파랑 비디오 영상에서의 빗방울 제거 및 배경 정보 복원 (Raindrop Removal and Background Information Recovery in Coastal Wave Video Imagery using Generative Adversarial Networks)

  • 허동;김재일;김진아
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권5호
    • /
    • pp.1-9
    • /
    • 2019
  • 본 논문에서는 강우시 빗방울로 인해 왜곡된 연안 파랑 비디오 영상에서 빗방울 제거와 제거된 영역에 대한 배경 정보를 복원하기 위한 적대적생성신경망을 이용한 영상 강화 방법을 제안하고자 한다. 영상 변환에 널리 사용되는 Pix2Pix 네트워크와 현재 단일 이미지에 대한 빗방울 제거에 좋은 성능을 보여주고 있는 Attentive GAN을 실험 대상 모델로 구현하고, 빗방울 제거를 위한 공개 데이터 셋을 이용하여 두 모델을 학습한 후 빗방울 왜곡 연안 파랑 영상의 빗방울 제거 및 배경 정보 복원 성능을 평가하였다. 연안 파랑 비디오에 영상에 대한 빗방울 왜곡 보정 성능을 향상시키기 위해 실제 연안에서 빗방울 유무가 짝을 이룬 데이터 셋을 직접 획득한 후 사전 학습된 모델에 대하여 전이 학습에 사용하여 빗방울 왜곡 보정에 대한 성능 향상을 확인하였다. 모델의 성능은 빗방울 왜곡 영상으로부터 파랑 정보 복원 성능을 최대 신호 대 잡음비와 구조적 유사도를 이용하여 평가하였으며, 전이 학습을 통해 파인 튜닝된 Pix2Pix 모델이 연안 파랑 비디오 영상의 빗방울 왜곡에 대한 가장 우수한 복원 성능을 보였다.

6 자유도 전방위 몰입형 비디오의 압축 코덱 개발 및 성능 분석 (Toward 6 Degree-of-Freedom Video Coding Technique and Performance Analysis)

  • 박현수;박상효;강제원
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1035-1052
    • /
    • 2019
  • 최근 몰입형 비디오의 수요가 점차 늘어남에 따라 국제 표준 단체인 MPEG-I에서 전방위 몰입형 비디오의 처리 기술이 활발하게 개발 중이다. 전방위 몰입형 비디오는 사용자 시점의 자유도가 증가함에 따라 비디오 신호의 크기가 급격히 증가하여 효과적인 압축 기술이 필수적이다. 더욱이 사용자의 움직임에 따른 보다 자유로운 시점 변환을 지원하는 6 자유도 (6-Degree-of_Freedom, 6DoF) 비디오의 압축을 위해서는 보다 우수한 부호화 효율을 제공하는 코덱의 개발이 필요하다. 본 논문에서는 ISO/IEC 23090 Part 7 (Metadata for Immersive Media (Video))에서 진행 중인 몰입형 비디오의 압축 표준 프로젝트의 테스트 모델인 TMIV (Test Model for Immersive Video)에 기존 적용된 High Efficiency Video Coding (HEVC)를 최근 차세대 비디오 압축 표준 개발 중인 Versatile Video Coding (VVC)로 대체하여 성능 분석을 수행하고, VVC의 툴 분석으로부터 디블로킹 필터를 TMIV의 패치 아틀라스에 선택적으로 적용하는 것이 부호화 효율을 증대시킬 수 있음을 보인다. VVC 기반의 6 DoF 비디오 코덱의 성능 평가는 본 논문이 최초로 그에 따른 향후 6DoF지원 몰입형 비디오 표준 개발 방향을 제시한다. TMIV의 두 가지 작동 모드인 MIV (Metadata for Immersive Video) 모드와 MIV 시점 모드에서 공통 실험 조건에 명시된 일곱 가지 시퀀스에 대해 전체적으로 실험을 진행하였다. 기존 HEVC를 VVC로 대체함으로써 MIV 모드 방식에서 33.8%, MIV 시점 모드에서 30.2%의 Peak Signal-to-Noise Ratio (PSNR) 관점에서의 부호화 성능 향상을 제공하였다. 이외에도 3차원 비디오의 인지 화질 평가를 위하여 사용하는 평가 지표로 IV-PSNR (Immersive Video PSNR)와 MSSIM (Mean Structural Similarity)를 이용하여 성능을 평가하였다.

생성적 적대 신경망(Generative Adversarial Network)을 이용하여 획득한 18F-FDG Brain PET/CT 인공지능 영상의 비교평가 (Comparative Evaluation of 18F-FDG Brain PET/CT AI Images Obtained Using Generative Adversarial Network)

  • 김종완;김정열;임한상;김재삼
    • 핵의학기술
    • /
    • 제24권1호
    • /
    • pp.15-19
    • /
    • 2020
  • 본 연구는 최근에 활발히 연구되고 있는 딥러닝 기술인 생성적 적대 신경망(GAN)을 핵의학 영상에 적용하여 잠재적으로 유용성이 있는지 확인해보고자 하였다. 본원에서 18F-FDG Brain PET/CT검사를 진행한 30명의 환자를 대상으로 하였고 List모드로 15분 검사한 후 이를 1, 2, 3, 4, 5분 초기획득시간 이미지로 재구성하였다. 이 중 25명의 환자를 GAN모델의 학습을 위한 트레이닝 이미지로 사용하고 5명의 환자를 학습된 GAN모델의 검증을 위한 테스트 이미지로 사용하였다. 학습된 GAN모델에 입력으로 1, 2, 3, 4, 5분의 초기획득 이미지를 넣고 출력으로 15분 인공지능 표준획득 이미지를 획득한 후 이를 기존의 15분 표준획득시간 검사 이미지와 비교 평가하였다. 평가에는 정량화된 이미지 평가방법인 평균제곱오차, 최대신호 대 잡음비, 구조적 유사도 지수를 이용하였다. 평가 결과 초기획득시간 이미지에서 1에서 5분으로 갈수록 실제 표준획득시간 이미지에 가까운 평균제곱오차, 최대신호 대 잡음비, 구조적 유사도 지수 수치를 나타내었다. 이러한 연구를 통해 앞으로 인공지능 기술이 핵의학 분야에서 의료영상의 획득시간 단축과 관련하여 중요한 영향을 미칠 수 있을 것으로 사료된다.

윤곽선 기반 메쉬 최적화를 이용한 효율적인 스테레오 영상 데이터 표현 (Efficient Data Representation of Stereo Images Using Edge-based Mesh Optimization)

  • 박일권;변혜란
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.322-331
    • /
    • 2009
  • 본 논문은 윤곽선 기반 메쉬 최적화를 이용한 스테레오 영상의 효율적인 데이터 표현 방법을 제안한다. 스테레오 영상에 대한 메쉬 기반 2차원 워핑은 주로 제어점 선택과 선택된 제어점들의 시차 정보 추정 성능에 의존한다. 따라서 제안된 방법은 제어점 선택을 위하여 강한 윤곽선과 객체의 경계선만으로 구성된 특징 지도를 생성하고 이를 기반으로 격자형 메쉬를 생성한다. 또한, 지역단위로 2차원 워핑을 수행하며 목적영상과의 오차를 최소로 하는 제어점의 위치를 반복적으로 추정하게 된다. 최적화된 제어점 위치를 찾기 위한 반복적 2차원 워핑 과정은 많은 계산 시간을 요구하기 때문에 이를 개선하기 위하여 입력된 스테레오 영상은 수평 시차만 존재하고 최적의 제어점 위치는 객체의 경계선을 포함한 윤곽선 위에 존재함을 가정한다. 따라서 제안한 윤곽선 기반 워핑 방법은 수평선 위에 윤곽선만을 따라 반복적으로 최적화된 제어점 위치를 탐색한다. 본 논문의 실험에서는 스테레오 영상에 대하여 제어점 수에 따른 신호에 대한 잡음비(PSNR)를 측정하여 기존 방법과 제안한 방법의 품질을 비교 하였다. 뿐만 아니라 최적의 메쉬 생성을 위한 수행시간을 비교하여 평가하였다. 실험 결과를 통하여 제안한 방법은 적은 수의 제어점을 이용하여 품질의 저하를 줄이고 빠르게 최적의 메쉬를 생성함으로써 효율적인 스테레오 영상 표현 방법을 제공하였다.

새로운 광적응 효과 모델을 이용한 정교한 영상 화질 측정 (Elaborate Image Quality Assessment with a Novel Luminance Adaptation Effect Model)

  • 배성호;김문철
    • 방송공학회논문지
    • /
    • 제20권6호
    • /
    • pp.818-826
    • /
    • 2015
  • 인간 시각 체계(Human Visual System: HVS)의 영상 화질 인지 특성을 정교하게 반영하는 객관적 영상 화질 측정(Image Quality Assessment: IQA)방법들이 최근 활발히 연구되어 왔다. 이와 관련된 HVS의 특성 중, 광적응(Luminance Adaptation: LA)효과는 HVS의 왜곡에 대한 민감도가 영상 배경 밝기에 따라 달라지는 특성을 가리키며, 이 효과는 베버의 법칙(Weber's law) 모델을 통해 많은 IQA 방법들에 반영되어져 왔다. 본 논문에서는 처음으로 이러한 베버의 법칙 모델을 기반으로 하는 기존 IQA 방법들이 LA 효과를 부정확하게 반영해 왔다는 점을 수학적/정신물리학적 분석을 통해 밝힌다. 이러한 분석을 기반으로 우리는 IQA 방법에 LA 효과가 정교하게 적용될 수 있는 새로운 LA 효과 기반 국부 가중치 함수(LA effect-based Local weight Function: LALF)를 제안한다. 우리는 제안 LALF를 SSIM(Structural SIMilarity) 및 PSNR 척도(metric)에 적용하여 제안 방법의 효과를 검증하였다. 실험 결과, LALF가 적용된 SSIM은 기존 SSIM 대비 측정된 주관적 화질 점수와의 스피어 랭크 순위 상관계수 기준 약 5% 포인트가 향상될 정도로 제안 방법의 큰 효과성을 입증하였다. 또한, 제안한 LALF는 PSNR에 적용된 경우에도 기존 PSNR 대비 약 2.5% 포인트의 성능 향상을 보였다.

이전 프레임의 시공간 모션 정보에 의한 예측 탐색 알고리즘 (A Prediction Search Algorithm by using Temporal and Spatial Motion Information from the Previous Frame)

  • 곽성근;위영철;김하진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제9권3호
    • /
    • pp.23-29
    • /
    • 2003
  • 비디오 시퀀스의 현재 블록의 모션 벡터와 이전 블록의 모션 백터는 시간적 상관성을 갖고 있다. 따라서 이전 프레임 블록들로부터 많은 정보를 얻을 수 있다면 현재 블록의 오션 추정에 대한 성능을 높일 수 있고 또한 탐색 횟수를 줄임으로써 계산 복잡도를 크게 줄일 수 있다. 본 논문에서는 이전 프레임 블록과 주위 블록들의 모션 벡터로부터 예측된 모션 정보를 구하여, 이를 탐색 원점으로 사용하지 않고, 탐색 구간에 따라 적응적으로 해당 초기점으로 탐색 원점을 이동시켜 고속 탐색 패턴을 이용하여 블록 정합을 수행하는 블록 정합 모션 추정 방식을 제안한다. 실험 결과 제안된 방식은 기존의 예측 탐색 방식들에 비해 PSNR 값에 있어서 평균적으로 0.33~0.37[dB] 개선되고 영상에 따라 최고 1.05[dB] 정도 우수한 결과를 나타내었다. 또한 탐색 횟수에서는 기존의 탐색 알고리즘보다 29~97%를 줄일 수 있었고, 정확한 모션 벡터를 찾는 비교에 있어서도 월등히 우수한 결과를 나타내었다. 제안된 방식은 정량적인 결과뿐만 아니라 부호화후 복호화한 영상의 화질에 있어서도 다른 고속 탐색 알고리즘보다 월등히 우수한 화질을 제공한다.

  • PDF

무선 애드 혹 네트워크에서 잔여 에너지를 고려한 다중 트리 비디오 멀티캐스트 기법 (An Energy-Aware Multi-tree Video Multicast Scheme in Wireless Ad Hoc Networks)

  • 박재영;강경란;조영종
    • 한국통신학회논문지
    • /
    • 제34권12B호
    • /
    • pp.1336-1348
    • /
    • 2009
  • 본 논문에서는 무선 애드 혹 네트워크에서 비디오 스트리밍 세션을 위한 무선 단말의 에너지를 고려한 다중 트리 멀티캐스트 기법인 MVM-MAODV를 제안한다. 기존의 단일 트리 멀티캐스트 기법인 MAODV를 기반으로 하여 무선 단말의 잔여 에너지와 사용자의 요구에 따라 차등화된 품질의 비디오를 전달하는 다중 멀티캐스트 트리를 구성한다. 데이터 송신자는 MDC (Multiple Description Coding)로 비디오 데이터를 인코딩하여 두 개 이상의 서브 스트림을 생성한다. 각 멤버 단말은 예상되는 스트림별 패킷 수에 근거하여 자신의 잔여 에너지로 수신 할 수 있는 서브 스트림의 개수를 결정한다. 중간 전달자 역할을 담당하는 무선 단말들도 자신의 잔여 에너지를 고려하여 전송을 지원할 수 있는 서브 스트림을 선택한다. 결과적으로 서브 스트림 별로 멀티캐스트 트리가 구성되게 되고, 데이터 송신자는 이 트리들을 사용해서 서브 스트림들을 분리하여 전송한다. 각 멤버 단말은 참여한 트리의 개수에 따라 다른 품질의 비디오를 수신하게 된다. 시뮬레이션을 통한 성능 분석에서, 단일 멀티캐스트 기법인 MAODV, 기존의 다중 멀티캐스트 트리 기법인 MT-MAODV에 비해 보다 우수한 비디오 품질을 제공할 수 있으며 네트워크 내의 무선 단말들의 에너지를 보존할 수 있음을 보였다.

깊이맵 업샘플링을 이용한 객관적 메트릭과 3D 평가의 비교 (Comparison of Objective Metrics and 3D Evaluation Using Upsampled Depth Map)

  • 사이드 마흐모드포어;최창열;김만배
    • 방송공학회논문지
    • /
    • 제20권2호
    • /
    • pp.204-214
    • /
    • 2015
  • 업샘플링 깊이맵은 깊이 카메라로부터 획득된 깊이맵의 공간 해상도를 증가시키는 방법이다. 깊이맵의 성능은 입체영상, 멀티뷰의 3D 입체감과 밀접한 관계가 있다. PSNR 등의 객관적 메트릭으로 깊이맵의 업샘플링 성능을 평가하고, 생성된 입체영상은 주관적 평가를 통해서 입체감 및 시각적 피로도를 조사한다. 후자의 주관적 평가는 인적 물적 자원을 필요로 하는 반면에, 전자의 객관적 메트릭은 수학적 표현으로 정량적 수치값을 알려준다. 따라서 주관적 평가와 높은 상관관계를 가지는 객관적 메트릭이 주관적 평가를 대체할 수 있다면 많이 시간을 필요로 하는 주관적 평가가 불필요하다. 이를 위해 본 논문에서는 다양한 객관적 메트릭과 3D 주관적 평가 사이의 관계를 조사한 후에, 이용한 메트릭에 기반한 주관평가와 상관관계가 높은 객관적 메트릭을 제안한다. 업샘플링된 깊이맵의 성능을 측정하기 위해 다양한 참조영상 및 무참조영상 평가 메트릭들을 이용하였다. 주관적 평가는 DSCQS 입체영상 테스트로 수행되었다. 세 종류의 상관관계의 활용 및 분석을 통해서, SSIM과 Edge-PSNR이 주관적 평가를 대체할 수 있는 적합한 객관적 메트릭임을 실험을 통해서 검증하였다.

객체지향 분석-함성 부호화를 위한 효율적 움직임 파라미터 추정 알고리듬 (Efficient Algorithms for Motion Parameter Estimation in Object-Oriented Analysis-Synthesis Coding)

  • 이창범;박래홍
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.653-660
    • /
    • 2004
  • 객체지향 분석-합성 부호화는 일련의 영상들을 여러 개의 동 객체로 분할한 후 각 객체의 움직임을 추정하고 보상한다. 그것은 각 객체에 있는 움직임 정보를 추정하기 위해 변환 파라미터 기법을 적용하는데 이때 변환 파라미터 기법은 그레디언트 연산자를 사용하기 때문에 매우 복잡한 계산이 요구된다. 본 논문의 목적은 객체지향 분석-합성 부호화에서 계층적 구조를 사용한 효율적인 변환파라미터 기법을 개발하는 것이다. 이러한 목표를 달성하기 위해 본 논문은 계층적 구조를 사용한 하이브리드 변환파라미터 추정 방법과 적응형 변환 파라미터 방법의 두 가지 알고리듬을 제안한다. 전자는 파라미터 검증 방법을 사용하는데 원 영상을 1/4로 축소한 저해상도 영상에서 파라미터 검증 처리 방법에 의해 6-파라미터 또는 8-파라미터로 추정한다. 후자는 동일한 계층적 방법을 적용한 다음 변환 파라미터를 적응적으로 추정하기 위해 temporal co-occurrence 행렬에 기반 한 움직임 량을 측정하는 움직임 판단기준을 사용한다. 이러한 방법은 고속이며, 병렬처리 기법을 사용할 경우 쉽게 하드웨어로 구현할 수 있는 이점이 있다. 이론 분석 및 모의시험 결과 제안한 방법이 기존 방법에 비해 약 1/4 정도로 월등한 계산량 감축을 얻을 수 있었으며, 아울러 제안한 방법들에 의해 복원된 신호대 잡음비는 6-파라미터와 8-파라미터 추정 방법에 의해 복원된 결과들 사이에 있음을 보여 준다.