• 제목/요약/키워드: Acoustic Signal Recognition

검색결과 70건 처리시간 0.046초

인공신경망을 이용한 DWT 전력스펙트럼 밀도 기반 자동화 기계 고장 진단 기법 (Fault Diagnosis Method for Automatic Machine Using Artificial Neutral Network Based on DWT Power Spectral Density)

  • 강경원
    • 융합신호처리학회논문지
    • /
    • 제20권2호
    • /
    • pp.78-83
    • /
    • 2019
  • 소리 기반 기계 고장 진단은 기계의 음향 방출 신호에서 비정상적인 소리를 자동으로 감지하는 것이다. 수학적 모델을 사용하는 기존의 방법은 기계 시스템의 복잡성과 잡음과 같은 비선형 요인이 존재하기 때문에 기계 고장 진단이 어려웠다. 따라서 기계 고장 진단의 문제를 패턴 인식 문제로 해결하고자 한다. 본 논문에서 DWT와 인공신경망 기반 패턴 인식 기법을 이용한 자동화 기계 고장 진단 기법을 제안한다. 기계의 결함을 효과적으로 탐지하기 위해 DWT를 이용해 대역별 분해 후 최상위 고주파 부대역과 최하위 저주파 부대역을 제외한 나머지 부대역의 PSD를 구하여 인공신경망 기반 분류기의 입력으로 사용한다. 그 결과 본 연구에서 제안한 방법은 효과적으로 결함을 탐지할 뿐만 아니라 소리 기반의 다양한 자동 진단 시스템에도 효과적으로 활용될 수 있음을 보여준다.

반향제거를 위한 음성특징 기반의 동시통화 검출 기법 (Speech Feature based Double-talk Detector for Acoustic Echo Cancellation)

  • 박준은;이윤재;김기현;고한석
    • 전기전자학회논문지
    • /
    • 제13권2호
    • /
    • pp.132-139
    • /
    • 2009
  • 본 논문에서는 핸즈프리 통신에서의 반향제거를 위한 음성 특징 기반의 동시통화 검출 기법을 제안한다. 동시통화 검출은 반향제거를 위한 적응 필터의 적응을 제어하는 역할을 하기 때문에 매우 중요한 분야이다. 이전까지의 연구에서는 동시통화 검출을 음성의 특징에 대한 고려 없이 단순히 신호처리 영역에서만 이루어졌다. 하지만 제안한 기법에서는 음성인식으로 사용되는 음성 특징을 핸즈프리 통신상에서의 근단 화자와 원단화자 사이의 차별성을 가지는 특징으로 사용하였다. 제안한 방식이 시간 축에서의 파형만을 이용하여 판단하는 동시통화검출기보다 우수한 성능을 나타내는 것을 실험을 통하여 입증하였다.

  • PDF

초음파 도플러 신호를 이용한 음성 합성 (Speech synthesis using acoustic Doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권2호
    • /
    • pp.134-142
    • /
    • 2016
  • 본 논문에서는 40 kHz 초음파 신호를 입 주변에 쏘고, 되돌아오는 초음파 신호를 이용해 음성신호를 합성하는 방법을 소개하고 성능을 평가하였다. 발성하고 있는 입주변에 초음파를 방사하게 되면, 입술, 턱, 뺨 등의 움직임으로 인한 변위로 도플러 현상이 발생하고, 이에 따라 반사 신호에는 본래의 주파수 성분과는 다른 도플러 주파수가 관찰되는데, 본 논문에서는 이러한 도플러 주파수를 이용하여 음성 파라메터를 추정하도록 하였다. 음성합성에 앞서서 초음파 도플러 신호와 음성 신호 간의 상관관계를 각 주파수 별로 분석하였으며, 이로부터 초음파 도플러 신호를 이용한 음성 신호의 합성 가능성을 살펴보았다. 변환에는 초음파 도플러의 정적, 동적 특성을 함께 반영한 특징 변수를 사용하였으며 결합-혼합 가우시안 기법을 이용하여 음성 파라메터로 변환하였다. 5명의 피 실험자를 이용한 음성 합성 실험에서 필터뱅크 에너지 값을 초음파신호의 특징변수로, LPC(Linear Predictive Coefficient) 켑스트럼 계수를 음성 변수로 사용하는 경우 가장 우수한 변환 성능을 나타내었다. 음성신호에서 추출한 여기신호를 이용하여 합성음을 생성하고, 이를 청취하였을 때 72.2 %의 평균 인식율이 얻어짐을 확인할 수 있었다.

Fractional Fourier 변환을 이용한 능동소나 표적 인식 (Active Sonar Target Recognition Using Fractional Fourier Transform)

  • 석종원;김태환;배건성
    • 한국정보통신학회논문지
    • /
    • 제17권11호
    • /
    • pp.2505-2511
    • /
    • 2013
  • 수중환경 하에서 표적을 탐지하고 식별하는 문제는 군사적인 목적은 물론 비군사적 목적으로도 많은 연구가 수행되어 왔다. 수중환경에서의 수중음향 신호가 시간 공간적으로 특성이 변화하며 천해 다중경로 환경을 반영하는 복잡한 특성을 보이는 점으로 인해 능동 표적인식 기술은 매우 어려운 기술로 여겨져 왔다. 또한 실제 데이터 수집의 어려움이 따르게 된다. 본 논문에서는 3차원 하이라이트 분포를 가지는 모델을 이용하여, 능동소나 표적신호를 음선 추적기법을 기반으로 하여 합성하였다. 합성된 표적신호를 대상으로 Fractional Fourier 변환을 적용하여 특징벡터를 추출하였고, 신경회로망 인식기를 이용하여 인식 실험을 수행하였다.

Hidden Markov Network 음성인식 시스템의 성능평가에 관한 연구 (A Study on Performance Evaluation of Hidden Markov Network Speech Recognition System)

  • 오세진;김광동;노덕규;위석오;송민규;정현열
    • 융합신호처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.30-39
    • /
    • 2003
  • 본 논문에서는 한국어 음성 데이터를 대상으로 HM-Net(Hidden Markov Network) 음성인식 시스템의 성능평가를 수행하였다. 음향모델 작성은 음성인식에서 널리 사용되고 있는 통계적인 모델링 방법인 HMM(Hidden Markov Model)을 개량한 HM-Net을 도입하였다. HM-Net은 기존의 SSS(Successive State Splitting) 알고리즘을 개량한 PDT(Phonetic Decision Tree)-SSS 알고리즘에 의해 문맥방향과 시간방향의 상태분할을 수행하여 생성되는데, 특히 문맥방향 상태분할의 경우 학습 음성데이터에 출현하지 않는 문맥정보를 효과적으로 표현하기 위해 음소결정트리를 채용하고 있으며, 시간방향 상태분할의 경우 학습 음성데이터에서 각 음소별 지속시간 정보를 효과적으로 표현하기 위한 상태분할을 수행하며, 마지막으로 파라미터의 공유를 통해 triphone 형태의 최적인 모델 네트워크를 작성하게 된다. 인식에 사용된 알고리즘은 음소 및 단어인식의 경우에는 One-Pass Viterbi 빔 탐색을 사용하며 트리 구조 형태의 사전과 phone/word-pair 문법을 채용하고 있다. 연속음성인식의 경우에는 단어 bigram과 단어 trigram 언어모델과 목구조 형태의 사전을 채용한 Multi-Pass 빔 탐색을 사용하고 있다. 전체적으로 본 논문에서는 다양한 조건에서 HM-Net 음성인식 시스템의 성능평가를 수행하였으며, 지금까지 소개된 음성인식 시스템과 비교하여 매우 우수한 인식성능을 보임을 실험을 통해 확인할 수 있었다.

  • PDF

복합재 패치로 보수된 알루미늄 패널의 피로균열 성장거동과 AE신호의 유형인식 (Fatigue Crack Growth Behavior of and Recognition of AE Signals from Composite Patch-Repaired Aluminum Panel)

  • 김성진;권오양;장용준
    • 비파괴검사학회지
    • /
    • 제27권1호
    • /
    • pp.48-57
    • /
    • 2007
  • 사용 중인 항공기 구조를 모사하여 리벳구멍 주위에 피로균열이 존재하는 AA2024-T3 박판을 CFRP 복합재 패치로 접합하여 보수한 후 피로균열 성장거동을 음향방출(AE)을 측정하면서 관찰하였다. 패칭의 효과로 균열성장속도의 뚜렷한 감소와 균열이 인접한 리벳 구멍으로 전파되는 시간을 지연시키는 효과가 있음을 확인하였다. 그리고 패칭 후 균열성장에 의해 탐지된 신호와 패치와 알루미늄 사이의 접합계면 분리에 의한 신호의 구별 가능성을 다변량 자료분석 기법인 주성분분석을 통해 알아보았다. 그 결과 균열성장에 따른 AE신호는 계면분리에 따른 AE신호에 비해 중심주파수가 높고 작은 에너지를 가지는 반면, 계면분리 신호는 균열성장 신호에 비해 상승시간이 길고 중심주파수가 상대적으로 낮으며 비교적 큰 에너지를 가진 것으로 나타났다. 따라서 AE신호의 유형인식 방법은 AE 발생원의 위치표정 결과와 결합할 경우 패치 접합으로 보수된 구조에서의 피로균열 성장거동을 예측하는 방법으로 충분히 활용될 수 있다.

잡음 환경에서 음성 인식을 위한 신호처리 (Signal Processing for Speech Recognition in Noisy Environment)

  • 김원구;임용훈;차일환;윤대희
    • 한국음향학회지
    • /
    • 제11권2호
    • /
    • pp.73-84
    • /
    • 1992
  • 본 논문에서는 잡음 환경에서 음성 인식 시스템의 성능을 개선할 수 있는 잡음제거 방식과 거리 측정 방법을 연구하고 백색 및 유색 잡음 환경에서 거리 측정 방법에 따른 음성 인식 시스템의 성능을 평가하였다. 잡음 제거 방법으로는 음성 인식 시스템의 전처리 과정으로서 사용될 수 있는 스펙트럼 차감법, 자기 상관 차감법, 적응 잡음 제거, 적응 빔 형성기가 있으며 거리 측정 방법으로는 Log Likelihood Ration($d_{LLR}$), 켑스트럼에 의한 거리 측정 ($d_{CEP}$), 가중 켑스트럼 거리 측정 ($d_{WCEP}$), 스펙트럼 기울기에 의한 거리 측정 ($d_{RPS}$), 켑스트럼 투영 거리 측정방법 ($d_{CP},\;d_{BCP},\;d_{WCP},\;d_{BWCP}$)들이 있다. 백색 및 자동차 잡음 환경에서의 화자 종속 단독음 인식 실험 결과, 켑스트럼 계수의 높은 차수에 큰 가중을 두는 거리 측정 방법인 $d_{RPS},\;d_{WCEP}$가 잡음에 강한 특성을 나타내었으며, 잡음이 존재할 때는 pre-emphasis를 하지 않은 경우가 높은 인식율을 얻을 수 있었다.

  • PDF

Design of Smart Device Assistive Emergency WayFinder Using Vision Based Emergency Exit Sign Detection

  • 이민우;비나야감 마리아판;비투무키자 조셉;이정훈;조주필;차재상
    • 한국위성정보통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.101-106
    • /
    • 2017
  • In this paper, we present Emergency exit signs are installed to provide escape routes or ways in buildings like shopping malls, hospitals, industry, and government complex, etc. and various other places for safety purpose to aid people to escape easily during emergency situations. In case of an emergency situation like smoke, fire, bad lightings and crowded stamped condition at emergency situations, it's difficult for people to recognize the emergency exit signs and emergency doors to exit from the emergency building areas. This paper propose an automatic emergency exit sing recognition to find exit direction using a smart device. The proposed approach aims to develop an computer vision based smart phone application to detect emergency exit signs using the smart device camera and guide the direction to escape in the visible and audible output format. In this research, a CAMShift object tracking approach is used to detect the emergency exit sign and the direction information extracted using template matching method. The direction information of the exit sign is stored in a text format and then using text-to-speech the text synthesized to audible acoustic signal. The synthesized acoustic signal render on smart device speaker as an escape guide information to the user. This research result is analyzed and concluded from the views of visual elements selecting, EXIT appearance design and EXIT's placement in the building, which is very valuable and can be commonly referred in wayfinder system.

음성 신호와 얼굴 표정을 이용한 감정인식 몇 표현 기법 (An Emotion Recognition and Expression Method using Facial Image and Speech Signal)

  • 주종태;문병현;서상욱;장인훈;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.333-336
    • /
    • 2007
  • 본 논문에서는 감정인식 분야에서 가장 많이 사용되어지는 음성신호와 얼굴영상을 가지고 4개의(기쁨, 슬픔, 화남, 놀람) 감정으로 인식하고 각각 얻어진 감정인식 결과를 Multi modal 기법을 이용해서 이들의 감정을 융합한다. 이를 위해 얼굴영상을 이용한 감정인식에서는 주성분 분석(Principal Component Analysis)법을 이용해 특징벡터를 추출하고, 음성신호는 언어적 특성을 배재한 acoustic feature를 사용하였으며 이와 같이 추출된 특징들을 각각 신경망에 적용시켜 감정별로 패턴을 분류하였고, 인식된 결과는 감정표현 시스템에 작용하여 감정을 표현하였다.

  • PDF

인공신경망 기반의 기타 코드 분류 시스템 성능 비교 (Performance Comparison of Guitar Chords Classification Systems Based on Artificial Neural Network)

  • 박선배;유도식
    • 한국멀티미디어학회논문지
    • /
    • 제21권3호
    • /
    • pp.391-399
    • /
    • 2018
  • In this paper, we construct and compare various guitar chord classification systems using perceptron neural network and convolutional neural network without pre-processing other than Fourier transform to identify the optimal chord classification system. Conventional guitar chord classification schemes use, for better feature extraction, computationally demanding pre-processing techniques such as stochastic analysis employing a hidden markov model or an acoustic data filtering and hence are burdensome for real-time chord classifications. For this reason, we construct various perceptron neural networks and convolutional neural networks that use only Fourier tranform for data pre-processing and compare them with dataset obtained by playing an electric guitar. According to our comparison, convolutional neural networks provide optimal performance considering both chord classification acurracy and fast processing time. In particular, convolutional neural networks exhibit robust performance even when only small fraction of low frequency components of the data are used.