• 제목/요약/키워드: Speaker Sound

검색결과 267건 처리시간 0.027초

A DSP Implementation of Subband Sound Localization System

  • Park, Kyusik
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권4E호
    • /
    • pp.52-60
    • /
    • 2001
  • This paper describes real time implementation of subband sound localization system on a floating-point DSP TI TMS320C31. The system determines two dimensional location of an active speaker in a closed room environment with real noise presents. The system consists of an two microphone array connected to TI DSP hosted by PC. The implemented sound localization algorithm is Subband CPSP which is an improved version of traditional CPSP (Cross-Power Spectrum Phase) method. The algorithm first split the input speech signal into arbitrary number of subband using subband filter banks and calculate the CPSP in each subband. It then averages out the CPSP results on each subband and compute a source location estimate. The proposed algorithm has an advantage over CPSP such that it minimize the overall estimation error in source location by limiting the specific band dominant noise to that subband. As a result, it makes possible to set up a robust real time sound localization system. For real time simulation, the input speech is captured using two microphone and digitized by the DSP at sampling rate 8192 hz, 16 bit/sample. The source location is then estimated at once per second to satisfy real-time computational constraints. The performance of the proposed system is confirmed by several real time simulation of the speech at a distance of 1m, 2m, 3m with various speech source locations and it shows over 5% accuracy improvement for the source location estimation.

  • PDF

음향 반사판의 밀도별 흡음특성 및 무대음향에의 영향 (Effect of Acoustic Reflector's Surface Density on Sound Absorption Characteristics and Stage Acoustics)

  • 김영선;정정호;전진용;김명석
    • 한국소음진동공학회논문집
    • /
    • 제22권5호
    • /
    • pp.429-436
    • /
    • 2012
  • In concert halls and auditoriums, acoustic reflector and stage enclosure is one of the main factors on the room and stage acoustic characteristics. As a stage enclosure and acoustic reflector honey comb based light-weight reflector is widely used, because it is easy to install. However, there was not enough research on the surface density effect on room and stage acoustics. In this study, sound absorption coefficient tests on three kinds of wooden acoustic reflectors with different surface density were conducted. Surface density of acoustic reflector was changed from 11 kg/$m^2$ to 41 kg/$m^2$. For the low frequency excitation, sub-woofer was used with omnidirectional loud-speaker simultaneously. From the experiments, it was found that sound absorption coefficient below 250 Hz band was decrease by the increment of surface density. In order to check the influence of the surface density on room and stage acoustic parameters, room acoustic simulation was conducted with sound absorption coefficients, which were tested in reverberation chamber. By the increment of surface density of acoustic reflector, RT(reverberation time) and EDT(early decay time) were increased. Also, ST(stage support) was improved in low frequency bands.

양서류 번식음 맵핑을 위한 무인비행장치 시스템의 정확성 검증 (Accuracy verification for unmanned aerial vehicle system for mapping of amphibians mating call)

  • 박민규;배서현
    • 한국환경복원기술학회지
    • /
    • 제25권2호
    • /
    • pp.85-92
    • /
    • 2022
  • The amphibian breeding habitat is confirmed by mating call. In some cases, the researcher directly identifies the amphibian individual, but in order to designate the habitat, it is necessary to map the mating call region of the amphibian population. Until now, it has been a popular methodology for researchers to hear mating calls and outline their breeding habitats. To improve this subjective methodology, we developed a technique for mapping mating call regions using Unmanned Aerial Vehicle (UAV). The technology uses a UAV, fitted with a sound recorder to record ground mating calls as it flies over an amphibian habitat. The core technology is to synchronize the recorded sound pressure with the flight log of the UAV and predict the sound pressure in a two-dimensional plane with probability density. For a demonstration study of this technology, artificial mating call was generated by a potable speaker on the ground and recorded by a UAV. Then, the recorded sound data was processed with an algorithm developed by us to map mating calls. As a result of the study, the correlation coefficient between the artificial mating call on the ground and the mating call map measured by the UAV was R=0.77. This correlation coefficient proves that our UAV recording system is sufficiently capable of detecting amphibian mating call regions.

디지털 보청기에서 마이크로폰 어레이를 이용한 잡음제거 (Noise Cancellation using Microphone Array in Digital Hearing Aids)

  • 방동혁;길세기;강현덕;윤광섭;이상민
    • 전기학회논문지
    • /
    • 제58권4호
    • /
    • pp.857-866
    • /
    • 2009
  • In this paper, a noise cancellation-method using microphone array for digital hearing aids is proposed. The microphone array is located around the ear of a dummy. Speech sound is generated from the forward speaker positioned in the front of the dummy and noise sound is generated from the backward speaker. The speech and noise are mixed in the air space and entered into the microphones. VAD(voice activity detector) and ANC(adaptive noise cancellation) methods were used to eliminate noise in the sound of the microphones. 10 two-syllable words and 4 sentences were used for speech signals. Babble and car interior noise were used for noise signals. The performance of the proposed algorithm was evaluated by SNR(signal-to-noise ratio) and PESQ-MOS(perceptual evaluation of speech quality-mean opinion score). In babble noise condition, SNR was improved as much as $7.963{\pm}1.3620dB\;and\;3.968{\pm}0.6659dB$ for words and sentences respectively. In the case of car interior noise, SNR was improved as $10.512{\pm}2.0665dB\;and\;6.000{\pm}1.7642dB$ for words and sentences respectively. PESQ-MOS of the babble noise was improved as much as $0.1722{\pm}0.0861$ score for words and $0.083{\pm}0.0417$ score for sentences. And PESQ-MOS of the car interior noise was improved as $0.2661{\pm}0.0335$ score and $0.040{\pm}0.0201$ score for words and sentences respectively. It is verified that the proposed algorithm has a good performance in noise cancellation of microphone array for digital hearing aids.

전방 스피커 어레이 재생 방식 기반 음향 재현 성능 평가 (Subjective Listening Test based on Frontal Loudspeaker Array Reproduction System)

  • 유재현;장대영;이태진
    • 방송공학회논문지
    • /
    • 제20권5호
    • /
    • pp.667-675
    • /
    • 2015
  • 고화질, 고품질 방송에 대한 관심이 크게 증가하면서 영상 신호 뿐만 아니라 음향 신호의 고품질화를 요구하는 목소리도 높아지고 있다. 음향 신호의 고품질화에 기여하는 요소 중 하나는 가령, 10.2채널, 22.2채널 등과 같은 재생 채널 수의 확장이지만 이는 많은 수의 스피커를 설치해야만 하는 문제점이 발생한다. 이와 같은 문제를 해결하기 위한 한 가지 방법으로 전방 스피커 어레이를 통한 입체 음향 재생 방식을 들 수 있는데 본 논문에서는 스피커 어레이 기반 음장 재생 방식인 음장합성 기술 (Wave Field Synthesis, WFS)에 대한 소개 및 이론적인 분석을 하고 이 기술로 구현한 전방 스피커 어레이 시스템의 입체 음향 재현 성능을 확인하기 위한 주관 청취 평가 결과를 제시한다. 결론적으로, WFS에 기반한 전방 스피커 어레이 재생 방식이 디스크리트 5.1채널 재생 방식과 비교하여 만족스러운 음장감을 제공한다는 것을 알 수 있었다.

음향 보상 시스템에 관한 연구 (A Study on the Audio Compensation System)

  • 정병철;원충상
    • 한국음향학회지
    • /
    • 제32권6호
    • /
    • pp.509-517
    • /
    • 2013
  • 본 연구에서는 음성전기변환기로서 다이나믹 마이크로폰과 디지털 신호처리기를 사용하고 성능분석을 통해 좋은 음성신호를 출력하는 방법을 다루었다. 음성음향시스템의 성능이라 함은 음성신호를 왜곡하지 않고 얼마나 원음 특성을 충실하게 증폭하여 확성하는가를 뜻한다. 마이크로폰의 주파수 응답특성을 측정한 후, 신호처리방법으로 표준마이크로폰 주파수 응답특성과 비교하여 주파수대역 별 보정치를 구하였다. 본 논문에 사용된 마이크로폰과 스피커는 일반적으로 사용되는 제품으로, 주파수응답특성을 구하고 기준치와 비교하여 필요한 보정치를 구하였다. 이와 같이 구한 마이크로폰과 스피커의 보정치는 디지털신호처리방법으로 처리하여 원신호음에 가깝게 보상하였다. 그리고 음성음원과 수음마이크 사이의 거리변화에 의한 음향특성변화보상에 관한 측정 결과도 비교적 좋은 결과를 얻었다.

Gaussian Mixture Model과 프레임 단위 유사도 추정을 이용한 유해동영상 필터링 시스템 구현 (A Realization of Injurious moving picture filtering system with Gaussian Mixture Model and Frame-level Likelihood Estimation)

  • 김민정;정종혁
    • 한국지능시스템학회논문지
    • /
    • 제23권2호
    • /
    • pp.184-189
    • /
    • 2013
  • 본 논문에서는 인터넷 및 인터넷 저장 공간에 제한없이 유통되고 있는 유해동영상을 필터링하기 위해 유해동영상에 포함된 특정 소리를 이용한 유해 동영상 필터링 시스템을 제안한다. 이를 위하여 소리의 특성을 잘 표현할 수 있는 Gaussian Mixture Model을 이용하였으며, 필터링 대상 데이터와 소리모델과의 유사도를 계산하기위해 프레임단위 유사도 추정을 이용하였다. 또, 실시간 처리를 위하여 비교대상 데이터의 수를 줄임으로서 실시간 처리가 가능한 프루닝 방법을 적용하였으며, 고정도의 구별 성능을 위하여 기존 화자식별에서 우수한 성능을 보였던 MWMR 방법을 적용하였다. 식별실험결과, 일반 영상과 유해 영상의 기준인 전체프레임 대비 유사도 높은 프레임의 비를 50%로 설정한 경우, 판별 오류율은 6.06%였으며, 프레임 비의 기준이 60%인 경우, 오류율은 3.03%를 나타내어 소리를 이용한 유해동영상 필터링 시스템이 효과적으로 일반영상과 유해영상을 구별할 수 있는 것을 확인하였다.

3축 가속도센서 및 음성인식 모듈을 이용한 마우스 포인팅 시스템의 구현 (A embodiment of mouse pointing system using 3-axis accelerometer and sound-recognition module)

  • 이승준;신동환;아피프;김주웅;박진우;엄기환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.934-937
    • /
    • 2010
  • 본 논문에서는 물리적 스위치 방식의 인터페이스를 사용하기 불편한 장애우나 전자기기 사용에 익숙하지 못한 사람들을 위한 차세대 인터페이스를 구현하기 위해 음성인식과 3축 가속도센서를 헤드셋과 연동하여 새로운 마우스 포인팅 시스템을 구현하였다. 인식률이 상대적으로 높은 화자종속방식을 지원하고 그 음성신호를 인식해서 BCD 코드로 출력을 내는 음성인식 모듈을 헤드셋의 마이크의 출력부와 연결하여 사용하였으며, TMS320F2812 프로세서를 사용한 컨트롤러를 구축하여 3축 가속도 센서와 연동한 후 헤드셋의 머리윗부분에 장착하여 비주얼 베이직을 통해 헤드셋으로 마우스 포인팅 및 클릭이 가능한 시스템을 구현하였다.

  • PDF

An Acoustic Study on the Pronunciation of English [kwJ Sequences by Korean EFL Students

  • Kim, Jung-Eun;Cho, Mi-Hui
    • 음성과학
    • /
    • 제9권1호
    • /
    • pp.193-206
    • /
    • 2002
  • The aim of this study is to find out how the labiovelar onglide /w/ in English kwV sequences that have minimal pairs with kV sequences is pronounced differently among Korean EFL learners based on acoustic evidence. This study tries to identify /w/ sound in English kwV sequences through spectrograms and to examine the duration ratios of each segment in kwV words to compare the patterns of an English native speaker with those of Korean speakers of English. In spectrographic analyses, the complete deletion of /w/ and partial pronunciation of /w/ dubbed [$k^{w}$] were identified as well as the targetappropriate production of /w/. The general production patterns with respect to the duration ratios in English [kw] sequence words showed that the subjects who produced /w/ had similar ratio patterns that the native speaker had in that the vowel duration ratio in kwV sequences was shorter than that in kV sequences. By contrast, the subjects who deleted [w] had a long ratio of the onset [$k^{h}$] while the speaker with a partial pronunciation of /w/ had a long ratio of the following vowel.

  • PDF

화자인식 알고리즘을 이용한 보안 시스템 구축 (An Implementation of Security System Using Speaker Recognition Algorithm)

  • 신유식;박기영;김종교
    • 전자공학회논문지T
    • /
    • 제36T권4호
    • /
    • pp.17-23
    • /
    • 1999
  • 본 연구는 문맥 독립형 화자 인식 알고리즘을 이용하여 보안시스템을 소프트웨어와 하드웨어로 구성한 논문이다. 화자인식을 이용한 보안시스템은 윈도우상에서 사운드카드를 이용하여 음성을 입력받고, 성도 모델링을 이용한 음성 파라미터를 추출하였으며, k-means 클러스터링 알고리즘을 기반으로 하여 화자를 모델링하였다. 등록된 화자에 대한 인식된 결과는 PIC16F84 마이크로 프로세서를 이용하여 자물쇠를 개${\cdot}$폐하도록 구성하였다. OFF-LINE의 실험은 TIMIT데이터를 이용하였으며, 5명의 화자에 대하여 ON-LINE으로 인식한 결과 학습시킨 데이터에 대해서는 100%의 인식률을 얻었으며 학습을 시키지 않은 데이터에 대해서는 99%의 인식률을 얻었다. 그리고 사용자 거부율 1%, 사칭자 허용률 0%, 검증평균오류는 0.5%를 보였다.

  • PDF