• Title/Summary/Keyword: Perceptual quality

검색결과 344건 처리시간 0.027초

디지털 영상의 인지적 무참조 화질 평가 방법 (No-reference Perceptual Quality Assessment of Digital Image)

  • 임진영;장호석;강동욱;김기두;정경훈
    • 방송공학회논문지
    • /
    • 제13권6호
    • /
    • pp.849-858
    • /
    • 2008
  • 본 논문에서는 열화된 영상의 화질을 평가함에 있어서 원본 영상을 참조할 필요가 없는 객관적인 평가 방법을 제안한다. 제안하는 알고리듬은 블록 기반의 손실 부호화 과정에서 발생 가능한 블록형 잡음 및 뭉개짐 현상의 정도를 정량화하며, 이와 함께 강한 에지 주변에서 특징적으로 나타나는 물결형 떨림, 계단형 떨림 및 모자이크 잡음 등을 정량화한다. 그리고 퍼지 적분을 이용하여 각각의 잡음의 정도를 통합하여 최종적인 점수를 계산함으로써 주어진 영상의 화질을 평가한다. 제안 알고리듬에 따라 얻어진 화질 평가 결과는 전문가 집단에 의한 주관적 화질 평가 결과와 높은 유사성을 보인다.

Analysis of Image Quality Based on Perceptual Vision

  • Xue, Liqin;Hua, Yuning;Qi, Yaping
    • 한국정보디스플레이학회:학술대회논문집
    • /
    • 한국정보디스플레이학회 2007년도 7th International Meeting on Information Display 제7권2호
    • /
    • pp.1494-1496
    • /
    • 2007
  • This paper deals with image quality analysis considering the impact of psychological factors involved in assessment. The attributes of image quality requirement were partitioned according to the visual perception characteristics and the preference of image quality were obtained by the factor analysis method. The features of image quality which support the subjective preference were identified, The adequacy of image is evidenced to be the top requirement issues to the display image quality improvement.

  • PDF

GAN 신경망을 통한 자각적 사진 향상 (Perceptual Photo Enhancement with Generative Adversarial Networks)

  • 궐월;이효종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.522-524
    • /
    • 2019
  • In spite of a rapid development in the quality of built-in mobile cameras, their some physical restrictions hinder them to achieve the satisfactory results of digital single lens reflex (DSLR) cameras. In this work we propose an end-to-end deep learning method to translate ordinary images by mobile cameras into DSLR-quality photos. The method is based on the framework of generative adversarial networks (GANs) with several improvements. First, we combined the U-Net with DenseNet and connected dense block (DB) in terms of U-Net. The Dense U-Net acts as the generator in our GAN model. Then, we improved the perceptual loss by using the VGG features and pixel-wise content, which could provide stronger supervision for contrast enhancement and texture recovery.

S-JND 모델을 사용한 주관적인 율 제어 알고리즘 기반의 HEVC 부호화 방법 (A Perceptual Rate Control Algorithm with S-JND Model for HEVC Encoder)

  • 김재련;안용조;임웅;심동규
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.929-943
    • /
    • 2016
  • 본 논문에서는 인지 화질을 고려하기 위해 S-JND 모델 기반의 율 제어 알고리즘을 제안한다. 제안하는 율 제어 알고리즘은 인간이 가지는 시각 시스템의 특징을 반영하기 위하여 시각적 민감도와 시각적 관심도를 동시에 반영할 수 있도록 제작된 S-JND (Saliency-Just Noticeable Difference) 모델을 사용한다. 율 제어 알고리즘을 통해 비트를 분배하는 과정에서 픽쳐 내에 존재하는 각 CTU (Coding Tree Unit)가 가지는 S-JND threshold를 구한다. 각 CTU의 threshold는 적응적으로 적절한 비트를 분배하는데 사용되고, 따라서 제안하는 비트 분배 모델은 인지 화질을 향상 시킬 수 있다. 제안하는 방법의 성능 검증을 위해서 제안하는 방법을 HM 16.9에 구현하였으며, CTC (Common Test Condition) RA (Random Access), Low-delay B와 Low-delay P의 경우에 Class B와 Class C 영상들에 대해 실험 하였다. 실험 결과, 제안하는 방법은 기존 율 제어 알고리즘 대비 평균 2.3%의 비트율이 감소했고 BD-PSNR은 약 0.07dB 향상이 있었으며 비트 정확도 또한 0.06% 정도 증가하였다. DSCQS (Double Stimulus Continuous Quality Scale) 방법으로 측정한 결과, 제안하는 방법은 기존 방법 대비 0.03 MOS (Mean Opinion Score) 향상을 보였다.

일측 성대마비 환자에서 성대내전술 후 성대접촉율의 증가가 음질 개선에 미치는 영향 (The Effect of An Increase of Closed Quotient on Improvement of Voice Quality after Type I Thyroplasty in Patients with Unilateral Vocal Cord Paralysis)

  • 김한수;최성희;임재열;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제15권1호
    • /
    • pp.16-20
    • /
    • 2004
  • Purpose : To assess perceptual, acoustic and aerodynamic measure of voice quality in patients with unilateral vocal cord paralysis before and after type I thyroplasty. Methods : The clinical records of patients operated type I thyroplasty in the Departement of otorhinoalryngolgy, Yongdong Severance hospital from November 2001 to November 2003 were reviewed. All patients uderwent a vocal function evaluation including perceptual, acoustic and aerodynamic measures of voice preoperative and on $60^{th}$ postoperative day. The perceptual and acoustic measures were obtained from recording of patients' reading a 'Sanchak' passage. The perceptual evaluation was performed by 2 speech pathologist using a 4-point rating scale. Acoustic parameters(voice range profile low(RAL), voice range profile high(RAH), average fundamental frequency(AFX), closed quotient, harmonic to noise ratio, jitter and shimmer) were investigated by Lx speech studio. Mean flow rate(MFR), subglottic pressure(Psub) and intensity were measured using the Phonatory function analyzer. The maximum phonation time was also measured. The data were statistically analyzed. A paired t-test (p<0.1) was used to compare preoperative and postoperative results. And multiple regression test was used to find which parameter was most correlated to improvement of postoperative voice quality. Results : Among aerodynamic parameters, Psub $(88.11mmH_2O{\rightarrow}58.7mmH_2O)$, MPT(7.87sec${\rightarrow}$12.53sec), MFR (359.8ml/sec${\rightarrow}$161.06ml/sec) were statistically improved. AFx(205.5Hz${\rightarrow}$163.27Hz), AQx(23.9%${\rightarrow}$48.3%), RAL, RAH. Jotter and shimmer were improved. In multiple regression test, AFx and AQx was noted as the two meost correlated parameters to improvement of postoperative breathiness. But general grade of voice quality was more correlated to Psub and shimmer. Conclusion : Vocal fold medialization procedures effectively reduce glottic gap. Increasing of contact area of both vocal folds induced improvement in aerodynamic parameters and leaded stabilizing of vocal fold vibration. That effect results in improvement in acoustic parameters (shimmer, jitter, signal-to-noise ratio, voice range profile) and voice quality.

  • PDF

편도적출술로 음성변화가 올 수 있는 편도 상태에 관한 연구 (The Study of Tonsil Affected Voice Quality after Tonsillectomy)

  • 안철민;정덕희
    • 대한후두음성언어의학회지
    • /
    • 제9권1호
    • /
    • pp.32-37
    • /
    • 1998
  • Tonsillectomy is the one of operation that is performed the most commonly in otolaryngology field. Many changes that include range of voice, tone, voice quality and resonance were made by tonsillectomy. Sometimes, any patients taken tonsillectomy has suffer from these voice problem after tonsillectomy. However there are less study for these problems until now. Then, we studied to find the anatomical findings that affected the voice quality when tonsillectomy was performed. We evaluated the voice in 2 groups, one is the group showed the normal pharyngeal space by using the transnasal fiberscopy, the other is group showed medially bulging tonsil at pharyngeal cavity by using same method, with perceptual evaluation, nasalance score, nasality, oral formant and nasal formant. We used the computerized speech analysis system, the nasometer and the spectrogram in the CSL program. We could not find any differences in perceptual evaluation between two groups. But objective measures were provided. Nasalance score and nasality on the nasometric analysis were increased significantly and oral formant on the spectrogram was changed singnificantly after tonsillectomy in Group 2. Authors thought medially bulging tonsil in the pharynx is able to affect the voice quality after tonsillectomy when we evaluted through the nasal cavity by the using of fiberscopy and this evaluation would be important especially in singers.

  • PDF

Emotional Image Quality Evaluation Technology for Display Devices

  • Lee, Eun-Jung;Lee, Seung-Bae
    • 조명전기설비학회논문지
    • /
    • 제23권3호
    • /
    • pp.10-17
    • /
    • 2009
  • In this paper, we explained the relation between evaluating display device and emotional image quality evaluation in human perceptual view. It is also suggested two emotional image quality evaluation method of display reflecting human visual function. One is the color space of CIECAM02 and the other is capturing moving image. It is necessary to standardize the evaluation methods of image quality based on emotional evaluation.

VoIP 품질 측량 도구 및 품질 기반의 요금 부과 방안 연구 (VoIP Quality Metric and Quality-based Accounting Scheme)

  • 정윤찬
    • 한국통신학회논문지
    • /
    • 제35권1B호
    • /
    • pp.27-34
    • /
    • 2010
  • 인터넷 음성통신은 이용영역이 무선통신 환경으로 이동함에 따라 유선 통신을 이용할 때와 비교하여 전송 중 더 높은 패킷 손실을 직면하게 된다. 따라서 적정 수준의 통화품질을 보장해줄 수 없을 상황도 고려할 수 밖에 없다. 이런 상황에서 이동 VoIP 서비스의 실시간 품질 추적이 중요한 기술 요소로 대두되었다. 이 논문에서는 두 가지 요인 즉, 평균적인 패킷 분실 정도와 패킷 손실의 뭉침 정도가 인간이 인지하는 통화 품질에 미치는 영향을 연구한다. 또 이 두 요인을 실시간으로 측정할 수 있는 '이동 평균' 방식을 제안한다. 이 이동평균 방식에 따라 실시간으로 측정된 두 요소로 통화품질을 추정할 경우에 얼마나 정확하게 추정가능한지를 확인하기 위하여, 이 논문에서는 기존에 나와 있는 비 실시간 품질 측정 도구를 이용하여 측정한 품질 추정 값과 이동평균 방식으로 측정한 두 요소에 의한 통화품질 예측 값을 비교한다. 이 비교 분석을 통하여 이동평균 방식으로 측정한 두 요소를 품질 측량 도구로 사용할 수 있음을 입증한다. 마지막으로 품질과 요금 부과 관계를 명확히 연관시켜줄 수 있는 품질 기반 요금 부과 체계를 제안한다.

승용차소음의 주관적 음질평가 실험연구 (Experimental Study on Subjective Sound Quality Evaluation of Vehicle Noises)

  • 최병호
    • 한국소음진동공학회논문집
    • /
    • 제14권12호
    • /
    • pp.1223-1232
    • /
    • 2004
  • This study is directed toward determining the number and characteristics of psychologically meaningful perceptual dimensions required for assessing the sound quality with respect to vehicle noises, and toward identifying the acoustical and/or psychoacoustical bases underlying the preference and similarity judgments. For the purpose of analyzing the paired comparison data produced by subjective ratings we used nonmetric multidimensional scaling(MDS). The perceptual dimensions based upon preference ratings could explain 76.3 % of the variance by maximum dB(A) and sharpness acum. The correlation between objective and subjective positions of the stimuli is $R^2$=0.97(F(1,13)=195.45, p < .01), corrected $R^2$=0.93. The less the intensity of the stimulus the more becomes the subjective Position would be over-estimated relative to the objective one. The same is valid for the opposite case. The perceptual dimensions based upon similarity judgments could be accounted for 47.8 % and 23.5% of the variance, each of which might be a match for the maximum dB(A) and the sharpness acum, respectively. The correlation between objective and subjective positions of the stimuli is $R^2$=0.94(F(1,13)=92.38, p < .01), corrected $R^2$=0.87. The more the intensity of the stimulus the more becomes the subjective position would be over-estimated relative to the objective one. The same is valid for the opposite case. In other words, it is likely that the larger the amount of two stimuli which to compare would be judged similar. So far it should be further clarified that whether the relationship between preference ratings and psychological distances nay be optimized through which psycho-physical models.

잡음 에너지 제어를 통한 지각 필터 성능 개선 (Performance Improvement of Perceptual Filter Using Noise Energy Control)

  • 서정국;차형태
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.43-51
    • /
    • 2005
  • 본 논문에서는 잡음 에너지 제어를 통한 지각 필터의 성능을 향상시킴으로써 잡음에 의해 열화 된 오디오 신호의 음질을 개선하는 알고리즘을 제안한다. 기존의 방식에서는 묵음 구간에서 획득한 잡음 에너지를 사용하여 필터를 구성하여 사용하지만, 신호 구간마다 달라지는 신호의 세기 및 잡음의 환경 정도에 많은 영향을 받아 잡음의 에너지가 급격하게 변화한다면 음질의 개선률이 감소함을 알 수 있다. 그러나 제안하는 방식에서는 묵음 구간에서 추정한 잡음의 에너지 제어를 통해 초기 추정 잡음보다 가까운 추정 잡음을 얻음으로써 잡음 에너지가 급격하게 변화하여도 음질 개선률에는 변화가 적음을 알 수 있었다. 또한 저 대역에 영향을 미치는 잡음의 경우에도 다른 방법들과는 달리 음질의 개선이 뚜렷하였다. 기존 방식과의 비교를 위해 다양한 신호 대 잡음 비 (signal-to-noise ratio, SNR)에서 열화 된 오디오 신호를 입력으로 사용하였다. 입력 SNR이 5dB, l0dE, 15dB와 20dB의 각각의 경우에 대하여 SSNR (Segmental SNR)과 잡음 대 마스킹 비 (Noise-to-mask ratio, NMR), 음질 테스트를 수행한 결과, 청감 테스트 (Mean Opinion Score, MOS Test)결과의 향상과 음질의 개선을 확인할 수 있었다.