• 제목/요약/키워드: speaker detection

검색결과 108건 처리시간 0.029초

스피커를 이용한 ABS와 PP의 손실계수 및 영률 측정 (Measurement of Loss Factor and Young's Modulus of ABS and PP Specimens by Using a Speaker)

  • 전병수;정성수;이종규
    • 한국소음진동공학회논문집
    • /
    • 제24권9호
    • /
    • pp.724-730
    • /
    • 2014
  • It is essential to control noise and vibration in various industrial fields. In the automobile industry, various plastics have been developed and replaced metallic materials in order to reduce mass and vibration effectively. In this study, we measured and analyzed the Young's moduli and the loss factors of Acrylonitrile butadiene styrene(ABS) and Polypropylene(PP). In order to solve the fundamental error to determine the two quantities, a loudspeaker was used instead of conventional electromagnetic devices to generate bending motion to the specimens and a laser vibrometer was also used in detection of vibration signal of the specimen. The measured Young's moduli and loss factors of the ABS specimen were nearly constant as the temperature($-10{\sim}60^{\circ}C$) was increased. The loss factor of PP specimen showed peak value at $20^{\circ}C$ and it means that there is glass transition for the PP specimen. Young's modulus of PP specimen was linearly decreased as the temperature was increased.

음성 신호의 음소 단위 구분화에 관한 연구 (A Study on the Segmentation of Speech Signal into Phonemic Units)

  • 이의천;이강성;김순협
    • 한국음향학회지
    • /
    • 제10권4호
    • /
    • pp.5-11
    • /
    • 1991
  • 본 연구에서는 음성신호의 음소 단위 구분화 방법을 제안한다. 제안된 구분화 시스템은 화자 독립적이고, 음성신호에 대한 사전 정보 없이도 음소 단위로 구분화를 수행할 수 있는 특징을 갖는다. 구분화 처리는 입력 음성신호를 먼저 순수 유성을 구간과 순수 유성음이 아닌 구간으로 분리 시킨 후, 각각의 구간에 대해 세분화된 음소 단위로 분리시키는 2단계 구분화 알고리즘을 적용하였고, 이때 사용된 파라미터는 유성을 검출 파라미터, 영차 LPC 캡스트럼 계수의 시간변호 파라미터, ZCR 파라미터이다. 본 연구에서 제안한 구분화 알고리즘의 유용성을 입증하기 위해 사용한 대상어는 고립단어와 연속음성으로 구성된 어휘로서 전체 어휘중에 포함된 507개 음소에 대한 구분화율은 91.7% 이다.

  • PDF

양단이 지지된 Fabry-Perot 광섬유센서의 음압 감지 특성 연구 (Sound Detection Characteristics Using Fabry-Perot Fiber Optic Sensor which Simply Supported in Structure)

  • 이종길;이진우;이준호
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.585-591
    • /
    • 2003
  • 본 연구에서는 소형화 및 경량화의 특성을 가진 Fabry-Perot형 간섭계를 구성하였다. 음향이 광섬유의 횡방향으로 감지되도록 센서 헤드부를 1㎝정도로 제작하고 총 길이가 9.5㎝인 광섬유의 양단을 단순 지지토록 하였다. 센서의 음향 감지특성을 관찰하기 위하여 무지향성 스피커를 이용하여 음향신호를 인가하였다 횡방향으로 입력된 음향 신호를 광섬유 센서와 마이크로폰이 감지한 신호를 비교하였다. 1㎑ 이하의 신호에서는 광섬유 센서가 마이크로폰보다 감지 특성이 좋으나 2 ㎑에서는 광섬유센서의 감지 특성이 감소하였다. 이것은 제작된 광섬유 센서의 지지구조의 특성을 나타낸 것이며 실험을 통하여 Fabry-Perot 간섭계용 센서는 횡방향의 음향을 잘 감지함을 확인하였다. 이러한 형태의 센서는 지능구조물의 건강진단 모니터링 분야에도 적용가능 하리라 판단된다.

히스토그램 처리방법에 의한 잡음 스펙트럼 추정을 이용한 잡음환경에서의 음성인식 (Speech Recognition in Noisy Environments using the NOise Spectrum Estimation based on the Histogram Technique)

  • 권영욱;김형순
    • 한국음향학회지
    • /
    • 제16권5호
    • /
    • pp.68-75
    • /
    • 1997
  • 스펙트럼 차감법은 잡음이 더해진 환경에서의 음성인시기에 널리 사용되는 전처리 방법이지만, 이를 위해서는 잡음의 스펙트럼을 잘 추정할 필요가 있다. 본 논문에서는 잡음 스펙트럼의 추정방법으로 히스토그램 처리방법을 사용한다. 이 방법은 음성/비음성 구간의 구분을 할 필요가 없으며 서서히 변화하는 잡음의 스펙트럼도 추정할 수 있다는 점에서 여타의 잡음 추정방법에 비해 장점을 지닌다. 다양한 SNR 조건하에서 유색 가우시안 잡음 및 실제 자동차 소음을 부가시킨 음성에 대해 화자독립 고립단어 인식 실험을 수행한 결과, 히스토그램 처리방법에 기반을 둔 스펙트럼 차감법의 인식성능이 초기 비음성구간의 스펙트럼 평균을 이용한 기존의 잡음 스펙트럼 추정방법에 비해 우수한 성능을 나타내었다.

  • PDF

Sagnac형 광섬유 센서를 이용한 중공 원통형 맨드릴의 재료 및 설치 방향에 따른 음압 감지 변화 연구 (Sound Pressure Sensitivity Variation of the Hollow Cylinder Type Sagnac Fiber Optic Sensor According to the Mandrel Install Direction and Its Material)

  • 이종길
    • 한국소음진동공학회논문집
    • /
    • 제22권7호
    • /
    • pp.626-633
    • /
    • 2012
  • In this paper, sound pressure sensitivity of the fiber optic acoustic sensor according to sensor direction and mandrel material were investigated experimentally. Three different directions were selected as stand, lay, and hole. Hollow cylinder type mandrel dimension is 30 mm in outer diameter, 45 mm in length, and 2 mm in thickness, and about 50 m optical fibers were wounded on the surface of the mandrel. Non-directional sound speaker was used as a sound source. Sagnac interferometer and single mode fiber, a laser with 1,550 nm in wavelength, $2{\times}2$ coupler were used. Based on the experimental results, lay direction's sensitivity is the highest in the frequency range of 2 kHz~4 kHz. 'PTFE+carbon' material is more sensitive than PTFE in the frequency range of 5 kHz~20 kHz. Sound pressure detection sensitivity depends on the mandrel direction and material under certain frequency.

TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드웨어 모듈(VR32) 구현 (Real-Time Implementation of Speaker Dependent Speech Recognition Hardware Module Using the TMS320C32 DSP : VR32)

  • 정익주;정훈
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.14-22
    • /
    • 1998
  • 본 연구에서는 Texas Instruments 사의 저가형 부동소수점 디지털 신호 처리기 (Digital Singnal Processor, DSP)인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하 드웨어 모듈(VR32)을 개발하였다. 하드웨어 모듈의 구성은 40MHz의 TMS320C32 DSP, 14bit 코덱인 TLC32044(또는 8bit μ-law PCM 코덱), EPROM과 SRAM 등의 메모리와 호 스트 인터페이스를 위한 로직 회로로 이루어졌다. 뿐만 아니라 이 하드웨어 모듈을 PC사에 서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리 즘의 구성은 에너지와 ZCR을 기반으로 한 끝점검출(Endpoint Detection) 침 10차 가중 LPC 켑스터럼(Weighted LPC Cepstrum) 분석이 실시간으로 이루어지며 이후 Dynamic Time Warping(DTW)를 통하여 최고 유사 단어를 결정하고 다시 검증과정을 거쳐 최종 인식을 수행한다. 끝점검출의 경우 적응 문턱값(Adaptive threshold)을 이용하여 잡음에 강인한 끝 점검출이 가능하며 DTW 알고리즘의 경우 C 및 어셈블리를 이용한 최적화를 통하여 계산 속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 통상 단축다이얼 용도로 사 용할 수 있는 30 단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동 차 소음과 같은 잡음환경에서도 잘 동작한다.

  • PDF

양서류 번식음 맵핑을 위한 무인비행장치 시스템의 정확성 검증 (Accuracy verification for unmanned aerial vehicle system for mapping of amphibians mating call)

  • 박민규;배서현
    • 한국환경복원기술학회지
    • /
    • 제25권2호
    • /
    • pp.85-92
    • /
    • 2022
  • The amphibian breeding habitat is confirmed by mating call. In some cases, the researcher directly identifies the amphibian individual, but in order to designate the habitat, it is necessary to map the mating call region of the amphibian population. Until now, it has been a popular methodology for researchers to hear mating calls and outline their breeding habitats. To improve this subjective methodology, we developed a technique for mapping mating call regions using Unmanned Aerial Vehicle (UAV). The technology uses a UAV, fitted with a sound recorder to record ground mating calls as it flies over an amphibian habitat. The core technology is to synchronize the recorded sound pressure with the flight log of the UAV and predict the sound pressure in a two-dimensional plane with probability density. For a demonstration study of this technology, artificial mating call was generated by a potable speaker on the ground and recorded by a UAV. Then, the recorded sound data was processed with an algorithm developed by us to map mating calls. As a result of the study, the correlation coefficient between the artificial mating call on the ground and the mating call map measured by the UAV was R=0.77. This correlation coefficient proves that our UAV recording system is sufficiently capable of detecting amphibian mating call regions.

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

입술 움직임 영상 선호를 이용한 음성 구간 검출 (Speech Activity Detection using Lip Movement Image Signals)

  • 김응규
    • 융합신호처리학회논문지
    • /
    • 제11권4호
    • /
    • pp.289-297
    • /
    • 2010
  • 본 논문에서는 음성인식을 위한 음성구간 검출과정에서 유입될 수 있는 동적인 음향에너지 이외에 화자의 입술움직임 영상신호까지 확인함으로써 외부 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위한 한 가지 방법이 제시된다. 우선, 연속적인 영상이 PC용 영상카메라를 통하여 획득되고 그 입술움직임 여부가 식별된다. 다음으로, 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세서와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서 공유메모리에 저장되어진 데이터를 확인함으로써 화자의 발성에 의한 음향에너지인지의 여부가 입증된다. 최종적으로, 음성인식기와 영상처리기를 연동시켜 실험한 결과, 영상카메라에 대면해서 발성하면 음성인식 결과의 출력에 이르기까지 연동처리가 정상적으로 진행됨을 확인하였고, 영상카메라에 대면치 않고 발성하면 연동처리시스템이 그 음성인식 결과를 출력치 못함을 확인하였다. 또한, 오프라인하의 입술움직임 초기 특정값 및 템플릿 초기영상을 온라인하에서 추출된 입술움직임 초기특정값 및 템플릿 영상으로 대체함으로써 입술움직임 영상 추적의 변별력을 향상시켰다. 입술움직임 영상 추적과정을 시각적으로 확인하고 실시간으로 관련된 패러미터를 해석하기 위해 영상처리 테스트베드를 구축하였다, 음성과 영상처리 시스템의 연동결과 다양한 조명환경 하에서도 약 99.3%의 연동율을 나타냈다.

가청 주파수 영역의 고주파와 순환 중복 검사를 이용한 무선 데이터 전송 알고리즘 (Wireless Data Transmission Algorithm Using Cyclic Redundancy Check and High Frequency of Audible Range)

  • 정명범
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권9호
    • /
    • pp.321-326
    • /
    • 2015
  • 본 논문에서는 가청 주파수 영역 중 사람들에게 거의 들리지 않는 고주파와 순환 중복 검사 기법을 이용하여 스마트 기기 간의 신뢰성 있는 데이터를 무선으로 전송하는 알고리즘을 제안한다. 제안 알고리즘은 스마트 기기의 내장 스피커에서 출력할 수 있는 가청 주파수 영역(20 Hz~22 kHz) 중 고주파 영역인 18 kHz~22 kHz를 사용한다. 이때 데이터의 전송량을 높이기 위해 고주파 영역 1(18.0 kHz~21.2 kHz)에서 여러 개의 주파수를 혼합하여 전달하며, 이와 동시에 전송 데이터의 정확성을 높이기 위해 고주파 영역 2(21.2 kHz~22.0 kHz)에서 순환 중복 검사를 위한 체크섬을 전달한다. 제안 방법의 데이터 전송 속도와 정확성을 확인하기 위해 스마트 북과 스마트 기기 간에 데이터 전달 실험을 하였다. 그 결과 평균 235 ms에 32 bits 데이터를 전송할 수 있었으며, 전송 성공률은 99.47%, 그리고 순환 중복 검사에 의한 에러 검출률은 0.53%인 것을 확인하였다. 따라서 제안 방법은 스마트 기기 간에 무선으로 데이터를 전송할 수 있는 유용한 기술이 될 것이다.