• Title/Summary/Keyword: 추정에러

Search Result 247, Processing Time 0.029 seconds

Selective temporal error concealment method for H.264/AVC (H.264/AVC를 위한 선택적 시간축 에러 은닉 방법)

  • Jung Bongsoo;Choi Woongil;Jeon Byeungwoo;Kim Myung-Don;Choi Song-In
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.42 no.2 s.302
    • /
    • pp.87-100
    • /
    • 2005
  • In this paper, we propose a new selective temporal error concealment algerian best suited for H.264/AVC. The proposed algorithm performs selective temporal error concealment depending on whether the lost block is at background or foreground. It the corrupted macroblock is decided as at background, then the simple temporal replacement is performed. Also we propose replacing a lost block at foreground with the selective average of respectively estimated blocks from the multiple reference frames. This paper supposes error-corrupted H.264/AVC video bitstreams over CDMA2000 (or UMTS) air interface. It is shown that under Flexible Macroblock Ordering (FMO) coding of H.264/AVC, the proposed algorithm provides PSNR gain up to 1.18dB compared to built-in algorithm in the K264/AVC test model. In addition, the proposed error concealment method has average PSNR improvement of 0.33dB compared with that under N-slice coding mode. The proposed algorithm also provides better subjective video quality than other conventional error concealment algorithms.

1BT Motion Estimation using Adaptive Kernels (다양한 커널을 이용한 이진 블록 정합 움직임 추정)

  • Shin, Wook-Jin;Lee, Hyuk;Jeong, Jechang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.244-247
    • /
    • 2010
  • 현대 사회에서 영상 콘텐츠 (contents)의 사용량이 급증함에 따라 영상압축 기술은 이동통신이나 DMB 등의 시스템에 필수적인 기술이 되었으며 이에 따라 MPEG-x와 H.26x 등 국제적인 표준들이 존재한다. 전역 탐색 알고리듬은 주어진 검색 범위(search range) 내에서 모든 후보들의 변위의 에러 기준에 따라 최솟값을 이용해 위치를 검색하는 알고리듬이다. 그러나 전역 탐색 알고리듬은 각 화소에 대해 엄청난 양의 계산 로드를 가지며 이로 인해 심각한 문제를 발생시키는 단점이 있다. 1비트 변환 (one-bit transform) 을 이용한 고속 움직임 추정 알고리듬은 참조 프레임과 현재 프레임을 1비트, 즉 0 또는 1만 갖는 값으로 변환하는데, 이에는 exclusive-OR 연산을 통해 블록 매칭 에러 (block matching error)를 계산하는 과정과 변환하는 과정이 포함된다. 본 논문에서는 다양한 커널 (kernel)들을 이용한 1비트 변환과 움직임 추정에 대해 다루었으며, 기존에 있었던 1비트 변환에 이용된 커널과는 다른 다양한 커널을 이용한 움직임 추정 결과들을 비교해봄으로써 화질열화를 최소로 하는 커널을 찾는 것에 대해 연구했다.

  • PDF

Performance Evaluation of Variable-Vocabulary Isolated Word Speech Recognizers with Maximum a Posteriori (MAP) Estimation-Based Speaker Adaptation in an Office Environment (최대 사후 추정 화자 적응을 이용한 가변어휘 고립단어 음성인식기의 사무실 환경에서의 성능 평가)

  • 권오욱
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.2
    • /
    • pp.84-89
    • /
    • 1998
  • 본 논문에서는 임의의 단어를 인식하기 위하여 음성학적으로 최적화된 (phonetically-optimized word) 음성 데이터베이스를 사용하여 훈련된 가변어휘 고립단위 음 성인식기의 실제 인식기 사용 환경에서의 성능을 평가하였다. 이를 위하여, 훈련 데이터베이 스에서와 상이한 환경에서 수집된 음성학적으로 균형 잡힌(phonetically-balanced word) 고 립 단어 음성을 테스트 데이터로 사용하였다. 테스트 데이터는 일반적인 사무실에서 작동하 는 노트북 PC에서 내장 마이크를 사용하여 녹음되었다. 이렇게 녹음된 음성을 사용하여 고 립단어 인식기의 인식률을 측정하였다. 이 인식기는 최대 사후(maximum a posteriori) 추정 알고리듬을 사용하여 화자의 변화에 적응하였다. 컴퓨터 모의실험 결과에 의하면 화자 적응 을 하지 않은 기본 시스템은 깨끗한 음성에 대하여 81.3%에서 사무실 환경 음성에 대하여 69.8%로 인식률이 저하되었다. 사무실 환경 음성에 대하여, 비교사 점진(unsupervised incremental) 모드에서 최대 사후 추정 화자 적응 알고리듬을 적용하였을 경우에는 화자적 응을 하지 않은 경우에 비하여 9%의 에러를 감소시키며, 50단어의 적응 단어를 사용하여 교사 묶음(supervised batch) 모드에서 최대 사후 추정 화자 적응 알고리듬을 적용하였을 경우에는 16%의 에러를 감소시켰다.

  • PDF

Resolution Enhancement of Surveillance Camera Image Using Error Estimation (에러 추정을 이용한 감시 카메라 영상의 해상도 향상)

  • Kim, Won-Hee;Park, Sung-Mo;Kim, Jong-Nam
    • Annual Conference of KIPS
    • /
    • 2009.04a
    • /
    • pp.169-170
    • /
    • 2009
  • 영상 해상도 향상 기술은 영상 처리의 많은 분야에서 사용되는 전처리 기술로서, 최근들어 감시 카메라 시스템에서의 영상 해상도 향상을 위한 연구가 진행되고 있다. 보간 과정에서의 블러링으로 인한 화질 저하를 해결하기 위해서, 본 논문에서는 하위 레벨 보간을 이용한 에러 추정과 영상 해상도 향상방법을 제안한다. 제안하는 방법에서는 하위 레벨 보간을 통해서 보간 과정에서 발생하는 손실 정보를 추정하고, 추정한 손실 정보를 보간 결과에 적용하여 영상 복원의 결과를 향상시킨다. 동일한 영상을 이용한 실험을 통해서 기존의 방법들보다 0.38~1.75dB의 객관적 화질의 개선을 확인하였고 주관적 화질 비교에서도 향상되었음을 확인하였다. 제안하는 방법은 감시 카메라 시스템을 비롯한 영상 확대를 위한 응용 환경에서 활용될 수 있다.

An Image Resolution Enhancement Algorithm Using Low Level Interpolation (하위 레벨 보간을 이용한 영상 해상도 향상 기술)

  • Kim, Won-Hee;Kim, Jong-Nam
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2009.05a
    • /
    • pp.865-869
    • /
    • 2009
  • An image resolution enhancement is mainly utilized as pre-processing technique for various image processing application. It requires to decrease image quality deterioration such as blurring. In this paper, we propose an image resolution enhancement algorithm using low level interpolation. In the proposed algorithm, we calculate an error using low level interpolation, estimate an error image from the calculated error. The estimated error image is added interpolated high resolution image, it become lastly reconstruction image. Our experiments obtained the average PSNR about 1dB which is improved results better than conventional method for sensitive image quality. Also, subjective image quality with edge region is more clearness. The proposed method may be helpful for applications in various multimedia systems such as image restoration.

  • PDF

A Gaze Detection Technique Using a Monocular Camera System (단안 카메라 환경에서의 시선 위치 추적)

  • 박강령;김재희
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.10B
    • /
    • pp.1390-1398
    • /
    • 2001
  • 시선 위치 추적이란 사용자가 모니터 상의 어느 지점을 쳐다보고 있는 지를 파악해 내는 기술이다. 시선 위치를 파악하기 위해 본 논문에서는 2차원 카메라 영상으로부터 얼굴 영역 및 얼굴 특징점을 추출한다. 초기에 모니터상의 3 지점을 쳐다볼 때 얼굴 특징점들은 움직임의 변화를 나타내며, 이로부터 카메라 보정 및 매개변수 추정 방법을 이용하여 얼굴특징점의 3차원 위치를 추정한다. 이후 사용자가 모니터 상의 또 다른 지점을 쳐다볼 때 얼굴 특징점의 변화된 3차원 위치는 3차원 움직임 추정방법 및 아핀변환을 이용하여 구해낸다. 이로부터 변화된 얼굴 특징점 및 이러한 얼굴 특징점으로 구성된 얼굴평면이 구해지며, 이러한 평면의 법선으로부터 모니터 상의 시선위치를 구할 수 있다. 실험 결과 19인치 모니터를 사용하여 모니터와 사용자까지의 거리를 50∼70cm정도 유지하였을 때 약 2.08인치의 시선위치에러 성능을 얻었다. 이 결과는 Rikert의 논문에서 나타낸 시선위치추적 성능(5.08cm 에러)과 비슷한 결과를 나타낸다. 그러나 Rikert의 방법은 모니터와 사용자 얼굴까지의 거리는 항상 고정시켜야 한다는 단점이 있으며, 얼굴의 자연스러운 움직임(회전 및 이동)이 발생하는 경우 시선위치추적 에러가 증가되는 문제점이 있다. 동시에 그들의 방법은 사용자 얼굴의 뒤 배경에 복잡한 물체가 없는 것으로 제한조건을 두고 있으며 처리 시간이 상당히 오래 걸리는 문제점이 있다. 그러나 본 논문에서 제안하는 시선 위치 추적 방법은 배경이 복잡한 사무실 환경에서도 사용가능하며, 약 3초 이내의 처리 시간(200MHz Pentium PC)이 소요됨을 알 수 있었다.

  • PDF

A Temporal Error Concealment Algorithm for H.264/AVC based on OBMA (H.264/AVC에서 OBMA 기반의 시방향 에러 은닉 기법)

  • Kim Deonghyung;Jeong Jechang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2004.11a
    • /
    • pp.75-78
    • /
    • 2004
  • H.264/AVC 동영상 부호화 표준은 이전의 여러 동영상 부호화 표준에는 없던 새로운 부호화 도구들이 추가되었으며 이를 통하여 보다 높은 압축 효율을 보인다. 추가된 부호화 도구들로 인하여 H.264내의 매크로블록은 이전의 부호화 표준에서 보다 많은 정보를 포함한다. 하나의 매크로블록에 대해서 최대 16개까지의 서로 다른 움직임벡터를 가질 수 있으며 최대 4개의 서로 다른 참조프레임을 가질 수 있다. 또한 다양한 블록크기로의 움직임 추정하며 이는 매크로블록의 모드로서 정의된다. 따라서 H.264내의 매크로블록은 기존보다 많은 움직임벡터를 가질 뿐만 아니라 기존에는 없던 참조 프레임과 매크로블록모드의 정보를 새로이 포함하고 있다. 반면 현재의 H.264내의 시방향 에러은닉기법은 이전 부호화 표준에서 사용하던 방법과 유사한 방법으로 에러가 발생한 블록의 주변 매크로블록의 움직임 벡터만을 고려하여 에러를 은닉한다. 본 논문은 H.264 부호화 표준의 특성을 고려하여 매크로블록이 포함하고 있는 다양한 의기의 움직임벡터 및 참조 프레임 뿐 아니라 주변 매크로블록들의 모드를 이용하여 서로 다른 블록 크기로 에러를 은닉함으로써 매크로블록이 포함하고 있는 정보를 최대한 활용하고 이를 통한 효율적인 에러은닉 알고리듬을 제안한다. 제안하는 알고리듬은 기존의 H.264에서의 시방향 에러은닉 기법과 비교하여 적은 연산량만을 가지면서도 최대 2.17dB까지의 향상된 화질을 나타낸다.

  • PDF

Error Estimation Based on the Bhattacharyya Distance for Classifying Multimodal Data (Multimodal 데이터에 대한 분류 에러 예측 기법)

  • Choe, Ui-Seon;Kim, Jae-Hui;Lee, Cheol-Hui
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.39 no.2
    • /
    • pp.147-154
    • /
    • 2002
  • In this paper, we propose an error estimation method based on the Bhattacharyya distance for multimodal data. First, we try to find the empirical relationship between the classification error and the Bhattacharyya distance. Then, we investigate the possibility to derive the error estimation equation based on the Bhattacharyya distance for multimodal data. We assume that the distribution of multimodal data can be approximated as a mixture of several Gaussian distributions. Experimental results with remotely sensed data showed that there exist strong relationships between the Bhattacharyya distance and the classification error and that it is possible to predict the classification error using the Bhattacharyya distance for multimodal data.

Block Histogram Compression Method for Selectivity Estimation in High-dimensions (고차원에서 선택율 추정을 위한 블록 히스토그램 압축방법)

  • Lee, Ju-Hong;Jeon, Seok-Ju;Park, Seon
    • The KIPS Transactions:PartD
    • /
    • v.10D no.6
    • /
    • pp.927-934
    • /
    • 2003
  • Database query optimates the selectivety of a query to find the most efficient access plan. Multi-dimensional selectivity estimation technique is required for a query with multiple attributes because the attributes are not independent each other. Histogram is practically used in most commercial database products because it approximates data distributions with small overhead and small error rates. However, histogram is inadequate for a query with multiple attributes because it incurs high storage overhead and high error rates. In this paper, we propose a novel method for multi-dimentional selectivity estimation. Compressed information from a large number of small-sized histogram buckets is maintained using the discrete cosine transform. This enables low error rates and low storage overheads even in high dimensions. Extensive experimental results show adventages of the proposed approach.

SURE-based-Trous Wavelet Filter for Interactive Monte Carlo Rendering (몬테카를로 렌더링을 위한 슈어기반 실시간 에이트러스 웨이블릿 필터)

  • Kim, Soomin;Moon, Bochang;Yoon, Sung-Eui
    • Journal of KIISE
    • /
    • v.43 no.8
    • /
    • pp.835-840
    • /
    • 2016
  • Monte Carlo ray tracing has been widely used for simulating a diverse set of photo-realistic effects. However, this technique typically produces noise when insufficient numbers of samples are used. As the number of samples allocated per pixel is increased, the rendered images converge. However, this approach of generating sufficient numbers of samples, requires prohibitive rendering time. To solve this problem, image filtering can be applied to rendered images, by filtering the noisy image rendered using low sample counts and acquiring smoothed images, instead of naively generating additional rays. In this paper, we proposed a Stein's Unbiased Risk Estimator (SURE) based $\grave{A}$-Trous wavelet to filter the noise in rendered images in a near-interactive rate. Based on SURE, we can estimate filtering errors associated with $\grave{A}$-Trous wavelet, and identify wavelet coefficients reducing filtering errors. Our approach showed improvement, up to 6:1, over the original $\grave{A}$-Trous filter on various regions in the image, while maintaining a minor computational overhead. We have integrated our propsed filtering method with the recent interactive ray tracing system, Embree, and demonstrated its benefits.