• 제목/요약/키워드: Sound recognition

검색결과 312건 처리시간 0.029초

주변 배경음에 강인한 구간 검출을 통한 음원 인식 및 위치 추적 시스템 설계 (Sound recognition and tracking system design using robust sound extraction section)

  • 김우준;김영섭;이광석
    • 한국전자통신학회논문지
    • /
    • 제11권8호
    • /
    • pp.759-766
    • /
    • 2016
  • 본 논문은 비정상 상황 시 발생하는 음원에 대해 주변 환경 음에 강인한 음원 구간을 검출하여, 구간내의 신호를 이용한 음원 인식 과 위치 추적 시스템 설계에 관한 연구이다. 강인한 음원 구간 검출은 수신되는 오디오 신호로부터 단 구간 가중 평균 델타 에너지를 계산하여, 저역 통과 필터에 입력 후, 출력되는 결과 값들의 비교를 통해 배경음에 강인한 구간을 정의 하며, 음원 인식은 검출된 구간 내 데이터로부터 종래의 인식 방법인 HMM(: Hidden Markov Model)을 이용해, 음원 인식 정보를 생성하여 학습 및 인식을 한다. 이는 주변 배경음이 포함된 음원 신호에 대해 기존 신호의 에너지를 이용해 구간을 검출 후, HMM을 통한 인식에 비해 3.94% 상향된 인식률을 보인다. 또한 인식 결과를 바탕으로 구간내의 신호간의 TDOA(: Time Delay of Arrival)를 이용한 위치 파악은 실제 발생 위치와의 각도와 97.44%일치함을 보인다.

고시조에 표현된 한국인의 소리인식 조사에 관한 연구 (The Korean's Sound Recognition Impressed in Ancient Sijo)

  • 이태강;장길수
    • 한국소음진동공학회논문집
    • /
    • 제15권6호
    • /
    • pp.724-730
    • /
    • 2005
  • Literary works contain various human emotion and historical, cultural background. It is very significant to understand sound recognition and receptions represented in many literary works. This study aims to investigate the sound impression on ancient Korean Sijo( Korean Verse) involved various traditional korean emotion, which were expressed in different situations. Firstly we selected the appropriate Sijo to express sounds, and then classified the sound, analyzed the meaning of recognition to the sound. The number of 297 sounds were classified into 13 categories, and 20 emotional meanings. Especially, 'internal sadness' characterized the korean rooted emotion were more expressed than other meanings and this meaning were symbolized by the sound of wild geese and cuckoos.

주성분 분석 기법을 이용한 심음 인식 (Heart Sound Recognition using Principal Components Analysis)

  • 이상민;홍승홍
    • 전자공학회논문지SC
    • /
    • 제38권5호
    • /
    • pp.59-69
    • /
    • 2001
  • 최근에 디지털 선호처리와 전자부품의 발달로 심음 분식에 관한 많은 연구가 진행되고 있다. 그러나 심음 인식, 특히 심음 한주기 전체에 대한 인식연구는 거의 없다. 본 논문에서 심음 전체 한주기에 대한 새로운 인식 방법을 제안하였다. 먼저 주성분 분석을 이용하여 훈련 셋트로 데이터베이스를 구축한다. 데이터베이스는 새로운 심음입력을 인식하는데 이용된다. 심음은 정상심음, 수축전 심잡음, 수축초기 심잡음, 수축 말기 심잡음, 이완 초기 심잡음, 이완 말기 심잡음, 연속적 심잡음으로 분류된다. 실험결과 새로운 인식 방법은 심음의 특징을 인식하는데 효과적이었다. 최대 인식률은 NO의 경우 71%, PS와 ES의 경우 80%, LS의 경우 78%, ED의 경우 87%, LD의 경우 60%, CM의 경우 20% 이었다. 현재의 결과가 실제적으로 심음을 인식하기에는 충분하지 못하였지만 선음 전체 주기를 대상으로 한 연구라는데 의의가 있으며 더 효과적인 데이터베이스를 구축함으로써 인식률을 개선할 수 있다.

  • PDF

2차원 변환과 CNN 딥러닝 기반 음향 인식 시스템에 관한 연구 (A Study on Sound Recognition System Based on 2-D Transformation and CNN Deep Learning)

  • 하태민;조성원;;;이기성
    • 스마트미디어저널
    • /
    • 제11권1호
    • /
    • pp.31-37
    • /
    • 2022
  • 본 논문은 일상생활에서 흔히 들을 수 있는 소리(비명소리, 박수 소리, 여러 명의 박수 소리, 자동차 지나가는 소리, 배경음 등)를 감지하는 음향 인식을 위하여, 신호처리 및 딥러닝을 적용하는 연구에 관한 것이다. 제안된 음향 인식에서는, 인식 정확도의 향상을 위해서 음향 파형의 스펙트럼, 음향 데이터의 증강, 2차원(2-D) 이미지 변환에 관한 기술들이 사용되었고, 예측의 정확도를 향상을 위한 앙상블 학습, Convolution Neural Network(CNN) 딥러닝 기술들이 적용된다. 제안된 음향 인식 기술은 실험을 통해 다양한 음향을 정확하게 인식할 수 있음을 보여준다.

능동형 기울기 가중치 제약에 기반한 환경소리 인식시스템용 DTW 알고리듬 (Active Slope Weighted-Constraints Based DTW Algorithm for Environmental Sound Recognition System)

  • 정영진;이윤정;김필운;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.471-480
    • /
    • 2008
  • 농자들은 청각장애를 가지고 있기 때문에 알람, 도어 벨, 싸이렌, 경적, 전화 벨 등과 같은 유용한 소리정보를 인식할 수 없다. 이러한 문제를 해결하기 위해서는 주요한 환경소리 인식방법을 탑재한 휴대형 청각보조 장구가 요구되어진다. 본 논문에서는 환경소리 인식시스템에 적용할 수 있는 능동형 기울기 가중치제약 방식의 새로운 동적 시간정합 알고리듬을 제안하였다. 환경소리 인식방법은 크게 세 단계로 구성된다. 첫 번째 단계에서는 소리의 주파수 성분과 크기를 이용하여 시작점과 끝점을 추출한다. 두 번째 단계에서는 추출된 구간에 대하여 특징을 추출하며 세 번째 단계에서는 추출된 특징들을 분류한다. 실험 결과 제안한 방법의 인식률이 거의 90%가 되었다. 그리고 기존의 동적 시간정합 알고리듬과 비교하였을 때 인식율에 있어서 약 20%정도의 개선이 있었다. 따라서 제안된 방법을 사용하여 농자가 환경소리를 인식할 수 있는 휴대형 청각 보조 장구가 개발된다면 그들의 생활에 편리함을 줄 수 있을 것으로 판단된다.

  • PDF

자동차 주행 환경에서의 음성 전달 명료도와 음성 인식 성능 비교 (Comparison of Speech Intelligibility & Performance of Speech Recognition in Real Driving Environments)

  • 이광현;최대림;김영일;김봉완;이용주
    • 대한음성학회지:말소리
    • /
    • 제50호
    • /
    • pp.99-110
    • /
    • 2004
  • The normal transmission characteristics of sound are hardly obtained due to the various noises and structural factors in a running car environment. It is due to the channel distortion of the original source sound recorded by microphones, and it seriously degrades the performance of the speech recognition in real driving environments. In this paper we analyze the degree of intelligibility under the various sound distortion environments by channels according to driving speed with respect to speech transmission index(STI) and compare the STI with rates of speech recognition. We examine the correlation between measures of intelligibility depending on sound pick-up patterns and performance in speech recognition. Thereby we consider the optimal location of a microphone in single channel environment. In experimentation we find that high correlation is obtained between STI and rates of speech recognition.

  • PDF

구간적분과 통계변수 분석에 의한 심음 인식 (Heart Sound Recognition by Analysis of Block Integration and Statistical Variables)

  • 이상민;김인영;홍승홍
    • 대한의용생체공학회:의공학회지
    • /
    • 제20권6호
    • /
    • pp.573-581
    • /
    • 1999
  • 청진에 의한 심음도법은 오래 전부터 진단에 이용되어 왔지만 심음 인식분야에서는 제 1심음, 제 2심음, 특정 판막의 운동과 같이 부분적 기능이나 동작 분석을 목적으로 심음의 일부 구간에 대한 인식 연구가 행하여졌을 뿐 심음 한 주기 전체를 대상으로 하는 심음 특징 인식에 대한 연구성과는 매우 미약하였다. 본 논문에서는 한 주기 동안의 전체 심음을 분석하여 파라메터를 추출하고 이를 이용하여 한 주기 심음 특성에 대한 인식방법을 제안하였다. 제안된 알고리즘은 시간영역에서 제 1심음과 제 2심 검출을 기반으로 한다. 알고리즘은 주요 구간을 추출하고 정점 위치, 구간 적분, 통계변수에 대한 분석을 통하여 심음을 분류한다. 심음을 정상, 수축초기 심잡음, 수축말기 심잡음, 이완 초기 심잡음, 이완 말기 심잡음, 연속적 심잡음으로 구분하였다. 시험 결과 평균 88% 의 평균 인식률을 얻어 제안된 알고리즘의 유용성을 확인하였다. 비정상 심음의 분류에 대한 오인식은 주로 수축초기의 심잡음인 경우로 나타났다.

  • PDF

심해저용 원격 착탈 시스템 제어를 위한 수중음향신호 인식 알고리즘의 개발 (A Development of Underwater Sound Signal Recognition Algorithm for Acoustic Releaser in the Seafloor)

  • 김영진;우종식;조영준;허경무
    • 제어로봇시스템학회논문지
    • /
    • 제10권5호
    • /
    • pp.421-427
    • /
    • 2004
  • In order to exploit underwater resources successfully, the first step would be a marine environmental research and exploration in the seafloor. Generally one sets up a long-term underwater experimental unit in the seafloor and retrieves the unit later after a certain period time. Essential to these applications is the reliable teleoperation and telemetering of the unit. In this paper we presents a robust underwater sound recognition algorithm by which we can identify the sound signal without the influence of disturbances due to underwater environmental changes. The proposed method provides a means suitable for the acoustic releaser which requires low power dissipation and long-time underwater operation. We demonstrate its ability of securing stability and fast sound recognition through simulation methods.

Acoustic releaser 제어를 위한 강인한 수중음향신호 인식 알고리즘의 개발 (A Development of Robust Underwater Sound Signal Recognition Algorithm for Acoustic Releaser)

  • 김영진;허경무
    • 전자공학회논문지SC
    • /
    • 제41권3호
    • /
    • pp.33-38
    • /
    • 2004
  • 본 논문에서는 해저의 환경변화에 따른 외란 요소에 영향을 받지 않고, 안정적으로 음파신호를 인식할 수 있는 수중음향 신호인식 알고리즘을 제안하였다. 제안하는 알고리즘은 배터리에 의존하여 장시간 운용되어야하는 시스템에 적합한 저소비전력형으로서, 신속하게 음파신호를 인식할 수 있고 해양환경 변화에 대한 안정성을 확보할 수 있으며, 이의 효율성을 수학적모델에 따른 수치시험과 회로실험을 통하여 확인하였다.

배경음 및 잡음에 강인한 위험 소리 탐지에 관한 연구 (A Study on Hazardous Sound Detection Robust to Background Sound and Noise)

  • 하태민;강상훈;조성원
    • 한국멀티미디어학회논문지
    • /
    • 제24권12호
    • /
    • pp.1606-1613
    • /
    • 2021
  • Recently various attempts to control hardware through integration of sensors and artificial intelligence have been made. This paper proposes a smart hazardous sound detection at home. Previous sound recognition methods have problems due to the processing of background sounds and the low recognition accuracy of high-frequency sounds. To get around these problems, a new MFCC(Mel-Frequency Cepstral Coefficient) algorithm using Wiener filter, modified filterbank is proposed. Experiments for comparing the performance of the proposed method and the original MFCC were conducted. For the classification of feature vectors extracted using the proposed MFCC, DNN(Deep Neural Network) was used. Experimental results showed the superiority of the modified MFCC in comparison to the conventional MFCC in terms of 1% higher training accuracy and 6.6% higher recognition rate.