• 제목/요약/키워드: Mean opinion score (MOS)

검색결과 94건 처리시간 0.025초

센서 네트워크 기반의 다수 사용자간 Full-Duplex 음성 통신 시스템을 위한 TDMA/TDD MAC 프로토콜 설계 (A Design of TDMA/TDD MAC Protocol for Full-Duplex Multi-User Voice Communication Systems Based on Sensor Network)

  • 김지수;이재형;조성호
    • 한국통신학회논문지
    • /
    • 제38C권3호
    • /
    • pp.239-246
    • /
    • 2013
  • 기존 IEEE 802.15.4는 PHY 계층과 MAC 계층에서의 표준을 제공하며 저전력, 저대역폭, 저속 데이터 통신을 특징으로 한다. 이러한 한계점으로 인하여 IEEE 802.15.4는 센서 검출, 홈 네트워크 등의 제한된 용도로만 쓰였으나 최근 음성과 같은 멀티미디어 데이터를 전송하려는 연구가 활발히 진행되고 있다. 본 논문에서는 기존 센서 네트워크 기반 Peer-to-Peer 음성 통신의 개선을 통해 다수 사용자간의 음성 통신을 지원하기 위하여 새로운 IEEE 802.15.4 PHY 기반 TDMA/TDD MAC을 설계하고 그룹 통신을 할 수 있는 하드웨어를 개발 하였다. 또한 설계된 시스템의 성능을 평가하기 위하여 실험을 통해 Mean Opinion Score (MOS)를 측정 하였으며 이는 사인파를 사용하는 방법을 이용하여 검증하였고 본 논문에서 제안하는 시스템이 실제 환경에서 다양한 응용 솔루션으로 개발 될 수 있음을 기대하였다.

잡음 에너지 제어를 통한 지각 필터 성능 개선 (Performance Improvement of Perceptual Filter Using Noise Energy Control)

  • 서정국;차형태
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.43-51
    • /
    • 2005
  • 본 논문에서는 잡음 에너지 제어를 통한 지각 필터의 성능을 향상시킴으로써 잡음에 의해 열화 된 오디오 신호의 음질을 개선하는 알고리즘을 제안한다. 기존의 방식에서는 묵음 구간에서 획득한 잡음 에너지를 사용하여 필터를 구성하여 사용하지만, 신호 구간마다 달라지는 신호의 세기 및 잡음의 환경 정도에 많은 영향을 받아 잡음의 에너지가 급격하게 변화한다면 음질의 개선률이 감소함을 알 수 있다. 그러나 제안하는 방식에서는 묵음 구간에서 추정한 잡음의 에너지 제어를 통해 초기 추정 잡음보다 가까운 추정 잡음을 얻음으로써 잡음 에너지가 급격하게 변화하여도 음질 개선률에는 변화가 적음을 알 수 있었다. 또한 저 대역에 영향을 미치는 잡음의 경우에도 다른 방법들과는 달리 음질의 개선이 뚜렷하였다. 기존 방식과의 비교를 위해 다양한 신호 대 잡음 비 (signal-to-noise ratio, SNR)에서 열화 된 오디오 신호를 입력으로 사용하였다. 입력 SNR이 5dB, l0dE, 15dB와 20dB의 각각의 경우에 대하여 SSNR (Segmental SNR)과 잡음 대 마스킹 비 (Noise-to-mask ratio, NMR), 음질 테스트를 수행한 결과, 청감 테스트 (Mean Opinion Score, MOS Test)결과의 향상과 음질의 개선을 확인할 수 있었다.

화자 의존 환경의 AMR 7.4Kbit/s모드에 기반한 보코더 (A New Vocoder based on AMR 7.4Kbit/s Mode for Speaker Dependent System)

  • 민병제;박동철
    • 한국통신학회논문지
    • /
    • 제33권9C호
    • /
    • pp.691-696
    • /
    • 2008
  • 본 논문은 AMR(Adaptive Multi Rate)코더의 7.4kit/s 모드를 기반으로 화자 의존적인 환경에서 더욱 압축률을 높인 새로운 켈프(CELP)계열의 코더를 제안한다. 제안된 코더는 OGM(OutGoing Message)이나 TTS(Text-To-Speech) 등 한 사람의 음성만을 필요로 하는 시스템에서 유용하게 사용할 수 있다. 새로운 코더의 압축률을 높이기 위해서 무감독 학습 신경망인 Centroid Neural Networks(CNN)를 이용한 새로운 LSP 코드북을 생성하여 사용한다. 또한 고정 코드북 탐색 단계에서 AMR 7.4 kbit/s 모드에서는 4개의 펄스를 서브프레임 마다 사용하는 대신에 새로운 코더에서는 오직 2개의 펄스만을 사용하기 때문에 압축률을 더 높일 수 있다. 이로 인해서 스피치의 질이 감소하게 되는데, 각 서브프레임 마다 예상하는 펄스를 적용함으로써 보상받을 수 있다. 제안된 보코더는 기존 AMR 7.4Kbps모드와 비교해 27% 높은 압축률을 가지는 동시에, MOS( Mean Opinion Score)의 면에서 볼 때, 대등한 음질을 보였다.

비균등 표본화 기법과 음성 부호화로의 응용 (A Nonuniform Sampling Technique and Its Application to Speech Coding)

  • 임병관
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.28-32
    • /
    • 2014
  • 국소적으로 선형적인 특성을 보이는 음성신호와 같은 신호의 데이터율을 감소시키기 위하여 변곡점 검출에 기반한 비균등 표본화 방법을 제안한다. 국소적인 최대값과 최소값 검출에 기반하여 비균등 표본화를 수행하는 기존의 방법에 비하여 변곡점에 기반한 비균등 표본화는 신호의 기하학적인 특징을 충실히 활용한다. 결과로서, 변곡점 검출에 기반하여 비균등 표본화된 데이터를 보간법으로 처리하면 기존의 방법보다 원시신호를 정밀하게 복원할 수 있다. 컴퓨터 모의실험을 통하여 기존의 최대값/최소값 검출 방법에 비교해서 제안된 변곡점 검출 기반의 비균등 표본화가 약 9~23dB의 신호대 잡음비 개선효과가 있음을 확인하였다. 제안된 변곡점 검출 기반의 비균등 부호화의 유용성을 보이기 위하여 음성신호의 부호화에 적용하였으며, Continuously variable slope delta modulation (CVSD)방법과 성능을 비교하였다. 변곡점 표본은 1로 설정된 플래그와 함께 이진수로 전송되며, 비 변곡점은 플래그만 0으로 설정된다. 음성신호에 따라 약 0.3 ~ 9dB의 신호대 잡음비 개선효과가 있으며, 주관적인 성능지표인 Mean Opinion Score (MOS)는 약 0.5 ~ 1.3 개선되었다.

와이브로와 HSDPA 시스템에서의 패킷 기반 음성 서비스의 품질 측정 및 분석 (Quality Measurement and Analysis of Packet-based Voice Service over WiBro and HSDPA Systems)

  • 김진철;김범준
    • 정보처리학회논문지C
    • /
    • 제19C권2호
    • /
    • pp.119-126
    • /
    • 2012
  • 본 논문은 현재 상용화되어 국내에서 서비스가 제공되고 있는 이동통신 시스템인 와이브로와 HSDPA (High Speed Downlink Packet Access) 시스템을 통해서 패킷 기반 음성 서비스가 제공되는 경우의 서비스 품질에 관한 것이다. 미래의 체계적인 서비스 품질 관리 방안 수립 과정에서 이미 개발된 품질 측정 소프트웨어[2]를 이용하여 다양한 시나리오 하에서 실제 음성 서비스의 품질을 측정하였다. 측정 결과의 분석을 통해서 현 시점에서 와이브로와 HSDPA 시스템 기반으로 음성 서비스가 제공될 경우 서비스 품질이 상당히 양호할 것임을 확인할 수 있었다. 추가적으로 무선 전송 환경의 변화가 음성 서비스의 품질에 미치는 영향을 알아보기 위한 또 다른 실험을 통해서 MOS(Mean Opinion Score)값의 급격한 저하 현상이 나타나는 무선 품질 지표의 값을 확인할 수 있었다.

디지털 보청기에서 마이크로폰 어레이를 이용한 잡음제거 (Noise Cancellation using Microphone Array in Digital Hearing Aids)

  • 방동혁;길세기;강현덕;윤광섭;이상민
    • 전기학회논문지
    • /
    • 제58권4호
    • /
    • pp.857-866
    • /
    • 2009
  • In this paper, a noise cancellation-method using microphone array for digital hearing aids is proposed. The microphone array is located around the ear of a dummy. Speech sound is generated from the forward speaker positioned in the front of the dummy and noise sound is generated from the backward speaker. The speech and noise are mixed in the air space and entered into the microphones. VAD(voice activity detector) and ANC(adaptive noise cancellation) methods were used to eliminate noise in the sound of the microphones. 10 two-syllable words and 4 sentences were used for speech signals. Babble and car interior noise were used for noise signals. The performance of the proposed algorithm was evaluated by SNR(signal-to-noise ratio) and PESQ-MOS(perceptual evaluation of speech quality-mean opinion score). In babble noise condition, SNR was improved as much as $7.963{\pm}1.3620dB\;and\;3.968{\pm}0.6659dB$ for words and sentences respectively. In the case of car interior noise, SNR was improved as $10.512{\pm}2.0665dB\;and\;6.000{\pm}1.7642dB$ for words and sentences respectively. PESQ-MOS of the babble noise was improved as much as $0.1722{\pm}0.0861$ score for words and $0.083{\pm}0.0417$ score for sentences. And PESQ-MOS of the car interior noise was improved as $0.2661{\pm}0.0335$ score and $0.040{\pm}0.0201$ score for words and sentences respectively. It is verified that the proposed algorithm has a good performance in noise cancellation of microphone array for digital hearing aids.

G.723.1,G.729 부호화기와 MLT 방법을 이용한 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Using the G.723-1,G.729 Combined with MLT)

  • 김정중;김종학;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.939-942
    • /
    • 2001
  • 본 논문에서는 ITU-T G.723.1, G.729 부호화기와 MLT(Modulated Lapped Transform) 방법을 이용한 광대역 음성 부호화방법을 제안한다. 제안된 광대역 음성부호화 방법은 16 kHz로 샘플링된 입력신호를 QMF(Quadrature Mirror Filter)사용하여 저대역과 고대역으로 나누며, 각 대역은 8 kHz의 샘플링을 갖는 협대역 음성 신호로 변환된다. 고대역은 MLT변환 후 벡터 양자화하며 또한 MLT를 사용한 ATC(Adaptive Transform Coding)방법을 적용하여 표현하며 저대역은 G.723.1과 G.729 부호화기를 사용한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위하여 MOS (Mean Opinion score)실험을 수행하였다. MOS 실험을 통해 16 kbps G.729-MLT VQ방식이 G.722 56kbps 와 비슷한 음질을 나타내었다.

  • PDF

Implementation and Evaluation of an HMM-Based Speech Synthesis System for the Tagalog Language

  • ;김경태;김종진
    • 대한음성학회지:말소리
    • /
    • 제68권
    • /
    • pp.49-63
    • /
    • 2008
  • This paper describes the development and assessment of a hidden Markov model (HMM) based Tagalog speech synthesis system, where Tagalog is the most widely spoken indigenous language of the Philippines. Several aspects of the design process are discussed here. In order to build the synthesizer a speech database is recorded and phonetically segmented. The constructed speech corpus contains approximately 89 minutes of Tagalog speech organized in 596 spoken utterances. Furthermore, contextual information is determined. The quality of the synthesized speech is assessed by subjective tests employing 25 native Tagalog speakers as respondents. Experimental results show that the new system is able to obtain a 3.29 MOS which indicates that the developed system is able to produce highly intelligible neutral Tagalog speech with stable quality even when a small amount of speech data is used for HMM training.

  • PDF

On a Cepstral Pitch Alteration Technique for Prosody Control in the Speech Synthesis System with High Quality

  • Kim, Kyu-Hong;Baek, Seong-Joon;Bae, Myung-Jin
    • The Journal of the Acoustical Society of Korea
    • /
    • 제18권1E호
    • /
    • pp.32-36
    • /
    • 1999
  • In the area of the speech synthesis techniques, the waveform coding methods maintain the intelligibility and naturalness of synthetic speech. In order to apply the waveform coding techniques to synthesis by rule, we must be able to alter the pitches of synthetic speech. In this paper, we propose a new pitch altering method that compensates phase distortion of the cepstral pitch alteration method with time scaling method in the time domain. This method can remove some spectrum distortion which is occurred in conjunction point between the waveforms. For performance test the spectrum distortion rate was used as objective criterion and the MOS(Mean Opinion Score) was used as subjective criterion. As a result, the spectrum distortion and MOS are obtained by 0.66% and 3.9, respectively.

  • PDF

End-to-End Performance of VoIP based on Mobility Pattern over MANETs

  • Kim, Young-Dong
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.309-313
    • /
    • 2009
  • In this paper, end-to-end VoIP(Voice over Internet Protocol) performance is evaluated by simulation with NS-2 simulation tool. There are many results studied and published for VoIP performance over TCP/IP networks. But, almost all of them were focused on wired or wireless Internet environments. About MANET (Mobile Ad Hoc Network), VoIP is currently studying several points of research. In this paper, analysis of VoIP performance is done with focusing on the mobility of MANETs. MOS(Mean Opinion Score), network delay, packet loss rates are considered as end-to-end QoS performance parameters.