• 제목/요약/키워드: PSNR estimation

검색결과 250건 처리시간 0.026초

다중 참조 영상을 이용한 고속 H.264의 움직임 예측 모드 선택 기법 (Spatio-temporal Mode Selection Methods of Fast H.264 Using Multiple Reference Frames)

  • 권재현;강민정;류철
    • 한국통신학회논문지
    • /
    • 제33권3C호
    • /
    • pp.247-254
    • /
    • 2008
  • ITU-T와 MPEG에 의해 최근 표준화가 완성된 H.264는 가변 블록 크기 움직임 예측, 다중 참조 영상, 1/4화소단위 움직임 예측 및 보상, $4{\times}4$ 정수 단위 DCT, 비트율-왜곡 최적화(Rate-Distortion Optimization)등의 새로운 부호화 기술로 H.263, MPEG-4 등 기존 비디오 표준에 비해 더 좋은 부호화 효율을 제공하고 있다. 그러나 새로운 부호화 기술들은 H.264의 전반적인 복잡도를 심화시키는 주된 요인이므로, H.264의 실제 응용을 용이하게 하기 위해서는 이러한 기술에 대한 고속 알고리즘이 요구된다. 제안하는 방식은 부호화기의 복잡도에서 가장 큰 비중을 차지하는 가변 블록 크기 움직임 예측 부호화에서 부호화 모드를 효율적으로 생략함으로써 모드 결정을 빠르게 수행하는 고속 모드 결정법으로, 참조 영상의 수를 줄이는 방법과 예측 모드를 생략하는 방법으로 구분될 수 있다. 참조 영상의 수를 줄이는 방법의 경우 상위 $16{\times}16$ 매크로블록에서 최소의 SAD를 갖는 참조 영상을 선택하여 $16{\times}8$$8{\times}16$ 모드의 움직임을 예측하고, 이 중 다시 최적의 참조 영상을 선택하여 하위 모드의 움직임을 예측한다. 예측 모드를 생략하는 방법에서는 매크로블록의 가로와 세로 세분화 방향성을 이용하여 만약 $16{\times}16$ 모드가 선택될 경우, $8{\times}8$$4{\times}4$ 하위 모드만 수행하고, $16{\times}8$ 모드가 선택되면 $8{\times}4$, $8{\times}16$ 모드가 선택되면 $4{\times}8$ 모드에서만 움직임 예측을 수행할 수 있다. 실험 결과 모든 참조 영상을 사용하는 방식에 비해 평균 65%가량 속도가 향상된 반면 영상의 화질은 H.264 표준 및 기존 방식과 유사함을 PSNR을 통하여 증명한다.

흉부 CR영상에 대한 위너필터의 적용 (Application of Wiener filter to Chest CR images)

  • 최석윤
    • 한국방사선학회논문지
    • /
    • 제12권4호
    • /
    • pp.519-524
    • /
    • 2018
  • CR시스템을 이용한 흉부검사 및 집단 흉부검사는 임상에서 자주 이용되고 있다. 흉부영상 획득과정에서 영상의 품질을 저하시키는 요인은 노후된 IP의 사용과 장시간 방치된 IP를 사용할 때이고 보관 시간에 노이즈가 대량 발생한다. 연구에서는 화질의 복원을 위해서 본 연구에서는 직접적인 계산방법인 위너필터와 개선된 위너필터를 적용하고 평가하였다. 실험결과 잡음의 변동이 작은 곳에서는 wiener의 방법이 우수하였고 잡음의 변동이 큰 곳에서는 개선된 방법이 우수하였다. 3일간 CR판독기로 잠상처리 않은 IP를 사용시 흉부CR 영상에 대해서 알고리즘 적용한 결과 잡음은 효과적으로 제거되었다 개선된 방법보다 고전적인 위너필터의 결과가 좋았다. CR영상 프로세스 과정에서 잠상처리를 하지 않고 다수의 환자를 검사했을 경우 제안한 알고리즘은 좋은 화질의 영상으로 복원가능하고 영상판독에 도움을 줄 것으로 판단한다.

Lapped Transform을 이용한 효율적인 분산 동영상 부호화 시스템 및 성능해석 (Efficient Distributed Video Coding System and Performance Analysis Using Lapped Transform)

  • 강수경;이창우
    • 한국통신학회논문지
    • /
    • 제36권9C호
    • /
    • pp.564-572
    • /
    • 2011
  • 동영상 신호의 각 프레임 간의 상관성을 복호기에서 이용하여 부호기의 복잡도를 줄이는 분산 동영상 부호화(distributed video coding : DVC) 시스템이 제안되었다. DVC 시스템에서는 부호기에서 블록 단위의 움직임 추정 및 보상을 수행하지 않기 때문에 블록 단위의 변환기법인 DCT(discrete cosine transform)를 대신해서 부호화 이득이 큰 중첩된 블록 단위의 변환인 lapped transform의 적용이 가능하다. 본 논문에서는 lapped transform을 사용한 효율적인 DVC 시스템을 제안한다. 제안하는 시스템의 성능을 높이기 위하여 복호기에서 중첩된 블록을 사용하는 OBMCI(overlapped block motion compensated interpolation)을 사용하여 부가 정보를 생성하고 적절한 상관잡음 모델링을 사용하여 전체 부호화 성능을 향상시킨다. 표준 동영상을 사용하여 모의 실험을 하고 제안하는 시스템의 성능을 기존의 DVC 부호화 시스템과 비교한 결과 우수한 PSNR 성능과 저전송률에서 블록 현상이 크게 감소하는 것을 확인하였다.

개선된 네이버 임베딩에 의한 초해상도 기법 (Super Resolution Technique Through Improved Neighbor Embedding)

  • 엄경배
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권6호
    • /
    • pp.737-743
    • /
    • 2014
  • 단일 영상 초해상도 기법에는 보간 기반 방법과 표본 기반 방법 등이 있다. 보간 기반 방법들은 간결성에 강점을 가지고 있으나, 이들 방법들은 선지식을 이용할 수 없기 때문에 톱니 모양의 윤곽선을 가진 고해상도 영상을 생성하는 경향이 있다. 표본 기반 초해상도 기법에서는 최근방 기반 알고리즘들이 널리 이용되어 지고 있다. 그들 중, 네이버 임베딩은 지역적 선형 임베딩이라는 매니폴드 학습 방법의 개념과 같다. 그러나, 네이버 임베딩은 국부 학습 데이터 집합의 크기가 너무 작은데에 따른 빈약한 일반화 능력으로 인하여, 시각적으로나 정량적인 척도에 의해 취약한 성능을 보인다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 개선된 네이버 임베딩 알고리즘을 제안하였다. 저해상도 입력 영상이 주어지면 고해상도 버전의 화소 값들은 개선된 네이버 임베딩 알고리즘에 의해 구해진다. 실험 결과 제안된 방법이 바이큐빅 보간법이나 네이버 임베딩에 비해 정량적인 척도 및 시각적으로도 우수한 결과를 보였다.

H.264에서 화소 변화량을 이용한 빠른 인트라 예측 (Fast Intra Prediction using Pixel Variation in H.264)

  • 이탁기;김성민;신광무;정기동
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.956-965
    • /
    • 2008
  • H.264는 가장 최근에 제정된 동영상 압축 표준으로 다양한 기법 등을 도입하여 기존의 표준들에 비해 동일한 화질을 유지하면서도 높은 압축 효율을 보여준다. 하지만 이러한 기법들은 처리과정이 복잡해, 계산 과정을 간소화시킨 효율적인 기법들이 요구된다. 따라서 본 논문에서는 새롭게 도입된 기법 중에서 복잡한 처리가 요구되는 인트라 예측의 효율적인 처리를 위한 2단계의 빠른 인트라 예측 방법을 제안한다. 1단계에서는 매크로블록 내 작은 블록들($4{\times}4,\;8{\times}8,\;12{\times}12$ 크기)의 경계 부분의 화소 변화량을 조사하고, 이를 통해서 매크로블록의 평탄 여부를 판단하여 인트라 예측을 위한 블록 크기를 빠르게 선택한다. 2단계에서는 매크로 블록 내부의 대표성을 띄는 화소들을 이용하여 1단계에서 선택된 블록 크기의 여러 모드 중에서 최종 모드를 빠르게 결정한다. 제안한 인트라 예측 기법의 성능측정을 위해 다양한 테스트 동영상으로 화질, 비트율 및 처리시간을 확인한 결과, 관련기법 및 표준과 비교해서 동일한 화질과 비트율을 유지하면서 표준과 비교하여 41.5%, 관련기법과 비교하여 24.7%의 인트라 예측 처리 시간을 감소시켰다.

  • PDF

AWGN 환경에서 표준편차 및 추정치를 통한 잡음 제거 알고리즘 (Noise Removal Algorithm using Standard Deviation and Estimation in AWGN Environment)

  • 천봉원;김남호
    • 한국정보통신학회논문지
    • /
    • 제22권11호
    • /
    • pp.1468-1473
    • /
    • 2018
  • 4차 산업혁명의 발전에 따라 통신 및 데이터 처리의 중요성이 높아지고 있으며, 이에 따라 장비의 정확성과 신뢰성에 직접적인 영향을 미치는 영상 및 데이터 처리의 중요성 또한 증가하고 있다. 본 논문에서는 영상의 주파수 성분의 변화에 적응하며 AWGN을 제거하기 위해 표준편차와 추정치의 유추를 통해 최종 출력을 산출하는 알고리즘을 제안하였다. 제안한 알고리즘은 마스크 성분의 표준편차를 통해 유효 화소 범위를 설정하여 추정치를 구하며, 가중치를 적용한 후 필터의 출력에 가감하여 최종 출력을 계산한다. 그리고 제안하는 알고리즘의 성능 평가를 위해 시뮬레이션을 통해 기존 방법과 비교 분석하였으며, 시뮬레이션 결과 영상의 중요 특성을 보존하며 효율적인 잡음 제거 성능을 보였다.

Lightweight Attention-Guided Network with Frequency Domain Reconstruction for High Dynamic Range Image Fusion

  • 박재현;이근택;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.205-208
    • /
    • 2022
  • Multi-exposure high dynamic range (HDR) image reconstruction, the task of reconstructing an HDR image from multiple low dynamic range (LDR) images in a dynamic scene, often produces ghosting artifacts caused by camera motion and moving objects and also cannot deal with washed-out regions due to over or under-exposures. While there has been many deep-learning-based methods with motion estimation to alleviate these problems, they still have limitations for severely moving scenes. They also require large parameter counts, especially in the case of state-of-the-art methods that employ attention modules. To address these issues, we propose a frequency domain approach based on the idea that the transform domain coefficients inherently involve the global information from whole image pixels to cope with large motions. Specifically we adopt Residual Fast Fourier Transform (RFFT) blocks, which allows for global interactions of pixels. Moreover, we also employ Depthwise Overparametrized convolution (DO-conv) blocks, a convolution in which each input channel is convolved with its own 2D kernel, for faster convergence and performance gains. We call this LFFNet (Lightweight Frequency Fusion Network), and experiments on the benchmarks show reduced ghosting artifacts and improved performance up to 0.6dB tonemapped PSNR compared to recent state-of-the-art methods. Our architecture also requires fewer parameters and converges faster in training.

  • PDF

초저복잡도 H.264 부호기의 움직임 추정 및 모드 결정 알고리즘 (Motion Estimation and Mode Decision Algorithm for Very Low-complexity H.264/AVC Video Encoder)

  • 유영일;김용태;이승준;강동욱;김기두
    • 방송공학회논문지
    • /
    • 제10권4호통권29호
    • /
    • pp.528-539
    • /
    • 2005
  • H.264는 우수한 부호화 성능으로 말미암아 DMB 차세대 DVD 등 새로운 멀티미디어 서비스를 위한 비디오 코덱으로 채택되어 왔다. 그러나 이 표준의 표준 코덱인 Joint Model(JM)은 연산 자원이 한정된 임베디드 환경에서 사용되기에는 너무 복잡한 다수의 알고리즘을 포함하고 있다. 본 논문은 임베디드 환경에서 사용할 수 있도록 설계된 초저복잡도 H.264 부호화 알고리즘을 제시한다. 제안하는 알고리즘은 압축 성능의 급격한 악화를 가져오지 않는 범위 내에서 몇 가지 부호화 도구의 사용을 제한하고, 또 움직임 추정과 모드 결정 과정에 몇 가지의 조기 종료 조건과 우회 조건을 추가하는 방법으로 구현하였다. 제안하는 알고리즘을 사용하여 7.5fps QCIF 영상을 64kbps로 부호화하는 경우, 표준 JM에 비해서 평균적으로 0.4 dB 정도의 미약한 PSNR 열화를 나타냄에도 불구하고, 단지 $15\%$의 계산량만을 필요로 할 뿐만 아니라, 필요한 메모리의 양과 전력 사용률을 획기적으로 낮추는 것이 가능하다. 제안하는 알고리즘의 H.264 부호기를 Intel PXA255 Processor를 사용하는 PDA에 이식하는 실험을 통하여 PDA에서 H.264 기반의 MMS(Multimedia Messaging Service)의 실현 가능성을 검증하였다.

웨이블릿 변환과 적응적 변이 추정을 이용한 스테레오 영상 블라인드 워터마킹 (Stereo Image Blind Watermarking Scheme based-on Discrete Wavelet Transform and adaptive Disparity Estimation)

  • 고정환;김성일;김은수
    • 한국통신학회논문지
    • /
    • 제31권2C호
    • /
    • pp.130-138
    • /
    • 2006
  • 본 논문에서는 웨이블릿 변환과 적응적 변이 추정 알고리즘을 이용한 새로운 스테레오 입체영상 블라인드 워터마킹 기법을 제시하였다. 즉, 좌, 우 스테레오 영상 중 우 영상에 이산 웨이블릿 변환을 이용하여 워터마크 영상을 삽입하고 워터마킹된 우영상과 좌 영상으로부터 변이정보를 추출한 다음 추춘된 변이정보는 좌영상과 함께 채널을 통해 전송된다. 그리고, 수신단에서는 전송되어온 변이정보와 좌 영상으로부터 적응적 정합 기법을 이용하여 워터마킹된 우 영상을 복원하게 되며, 최종적인 워터마크 추출과정에서는 복원된 우 영상으로부터 원 영상을 사용하지 않고 워터마크 영상을 추출하는 블라인드 방식을 사용하였다. CCETT의 'Manege'와 실제로 획득한 영상 'Friends', 그리고 영문 알파벳 '3DRC'를 스테레오 및 워터마크 영상으로 사용한 실험결과, 복원 영상으로부터 추출된 워터마크 영상에 대한 PSNR 측정의 경우, 2.64dB, 3.03dB가 향상되었으며 본 논문에서 제안한 알고리즘의 성능 분석을 위한 다양한 공격 실험에서도 강건한 실험결과를 얻을 수 있었으며, 이를 통해 본 논문에서 새로이 제안한 적응적 변이추정 기반의 스테레오 입체영상 워터마킹 기법의 실질적 응용 가능성을 제시하였다.

H.264/AVC 표준에서 역트리 구조를 이용하여 고속으로 화면내 모드를 결정하는 방법 (Fast Intra-Mode Decision for H.264/AVC using Inverse Tree-Structure)

  • 고현석;유기원;서정동;손광훈
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.310-318
    • /
    • 2008
  • H.264/AVC는 각 매크로블록에 대해서 최적의 부호화 모드와 참조 프레임을 결정해 주는 RDO (Rate-Distortion Optimization) 기법을 사용하여 기존의 비디오 압축 표준보다 더 좋은 부호화 효율을 얻고 있다. 하지만, RDO 기법은 하나의 매크로블록 모드를 결정할 때마다, 다양한 블록 타입의 화면내 (Intra) 예측을 수행하고 화면간 (Inter) 예측에 대해서도 1/4 화소까지 고려하는 움직임 추정(Motion Estimation)을 수행한 후 발생되는 비트까지 고려하여 최적의 모드를 결정하기 때문에 부호화기의 복잡도가 매우 큰 문제점이 있다. 따라서 영상의 객관적 화질은 유지하면서 부호화기의 복잡도를 낮추기 위한 많은 고속 알고리즘들이 제안되었고 연구 중에 있다. 본 논문에서는, 역 트리 구조의 경계 방향 예측 알고리즘을 이용한 고속 화면내 모드 결정 기법을 제안한다. 제안된 방법은 $4{\times}4$ 블록의 지역 경계 정보를 이용하여 해당 블록의 DE (Dominant Edge)를 찾아내고 DE에 상응하는 화면내 모드를 이용하여 RDO를 수행한다 $8{\times}8$ 블록 (또는 $16{\times}16$ 블록)의 DE는 이전 단계 4개의 $4{\times}4$ 블록 (또는 $8{\times}8$ 블록) DE들로부터 계산되고, 이 단계에서의 RDO 또한 DE에 상응하는 화면내 모드를 이용한다. 실험결과 제안 방법은 화면내 부호화에 사용되는 후보 모드의 수를 줄임으로써 JM12.2와 비교하여 화면내 부호화 시간을 평균 64% 단축시킬 수 있었다.