• 제목/요약/키워드: 음향효율

검색결과 599건 처리시간 0.023초

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

모수적 궤적 기반의 분절 HMM을 이용한 연속 음성 인식 (Continuous Speech Recognition based on Parmetric Trajectory Segmental HMM)

  • 윤영선;오영환
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.35-44
    • /
    • 2000
  • 본 논문에서는 음성 패턴을 효율적으로 모델링하고자 분절 특징(segmental feature)을 이 용하여 은닉 마코프 모델(hidden markov model)의 일반적인 형식에 기반한 새로운 모수적 궤적 모델 (parametric trajectory model)을 제안한다. 일반적으로 벡터의 열로써 표현되는 분절은 관측 열의 궤적(trajectory)으로 표현된다. 이 궤적은 연속적인 프레임들의 전이 정보(transitional information)를 표현하는 디자인 행렬을 이용하여 얻어지며, 다항식의 회귀 함수(polynomial regression function)로써 나타낼 수 있다. 이러한 궤적을 HMM에 적용하기 위해서 프레임 특징 대신 분절의 특성 을 표현하는 궤적으로 대치하고 우도(likelihood) 계산에 궤적들의 비교에 의한 확률 값을 반영시켜야 한다. 본 논문에서는 궤적간의 유사도를 측정하는 분절 우도(segment likelihood)와 모델을 구성하는 궤적변수의 추정 알고리즘을 제안한다. 임의의 분절에 대한 관측 확률은 제안된 분절 우도와 궤적의 추정 오차(estimation error of trajectories)의 곱으로써 표현된다. 궤적의 추정 오차는 상태에서 주어진 분절 우도의 가중치로 표현될 수 있으며, 이 가중치는 궤적과 대응되는 분절의 적합도를 표현하는 확률을 나타낸다. 본 논문에서 제 안된 모델은 일반적 인 HMM과 모수적 궤적 모델의 일반화(generalization) 또는 확장(extension) 모델로 생각될 수 있다. 본 모델의 성능을 평가하기 위하여 TIMIT 데이터에 기반한 실험을 한 결과, 분절 길이(segment length)와 회귀 차수(regression order)가 변할수록 일반적인 HMM에 비하여 뚜렷한 성능향상이 있음을 알 수 있었다.

  • PDF

선택적 sparse coding 기반 측면주사 소나 영상의 고속 초해상도 복원 알고리즘 (A selective sparse coding based fast super-resolution method for a side-scan sonar image)

  • 박재현;양철종;구본화;이승호;김성일;고한석
    • 한국음향학회지
    • /
    • 제37권1호
    • /
    • pp.12-20
    • /
    • 2018
  • 측면주사 소나 영상 획득의 효율성을 향상시키고자 저해상도의 수중 영상을 복원 기법을 이용하여 고화질 영상으로 개선시키는 연구가 시도되고 있다. 측면주사 소나 영상은 광학 영상과 같은 2차원 신호를 사용한다는 측면에서 기존 광학 영상 복원에 적용된 기법의 응용을 고려할 수 있다. 광학 영상에 대한 가장 대표적인 복원 방법 중 하나는 스파스 코딩이며, 수중 영상의 희소성을 분석하여 스파스 코딩 기법을 수중 영상에 적용할 수 있음을 증명하는 연구가 진행되었다. 스파스 코딩은 입력 신호에 대하여 사전과 스파스 계수의 선형 결합으로 복원 신호를 얻는 방식이다. 하지만 스파스 계수의 값을 정확히 추정하기 위해서는 많은 연산량을 필요로 한다. 본 연구에서는 스파스 코딩 기반의 수중 영상 초해상도 복원을 수행하되, 수중 영상 내 객체 영역에 한해서 선택적으로 복원 기법을 적용하는 방법을 제안함으로써 전체 연산 시간을 단축시킨다. 이를 위하여 수중 영상에서 경계를 검출하고 그 분포에 따라 객체 영역과 비객체 영역을 구분하는 방법을 제안하고, 이를 스파스 코딩 기반의 초해상도 복원 기법과 접목시킨다. 실험을 통해 제안하는 방법이 기존 방식과 동일 수준의 PSNR(Peak Signal-to-Noise Ratio) 수치를 유지하며, 영상 복원에 필요한 시간은 32 % 만큼 단축시킴을 확인함으로써 제안 방법의 유효성을 증명하였다.

설문지를 통한 소음성난청에 대한 인식 조사 및 분석 (Evaluation and Analysis of Awareness in Noise-induced Hearing Loss Using Survey)

  • 이동욱;유재형;한우재
    • 한국음향학회지
    • /
    • 제34권4호
    • /
    • pp.274-281
    • /
    • 2015
  • 소음성난청은 고려 시 되어야 하는 공중보건 문제로 알려져 있지만, 큰 소음의 노출로 인해 난청이 발생됨을 많은 사람들은 잘 인식하지 못하고 있다. 본 연구의 목적은 일반인들이 얼마나 중요하고 심각하게 소음성난청에 대하여 인식하고 있는지 22개의 설문 문항을 바탕으로 조사하고 그 결과를 분석하였다. 20대부터 60대의 성인 남녀 150명을 대상으로 청력손실과 이명을 포함하여 일반적인 건강 문제들에 대한 사회 및 개인적 중요도, 소음노출과 청력손실에 대한 인지 정도, 청력 보존 방법에 대한 인식을 문답하였다. 연구 결과, 다른 건강 문제들과 비교하여 응답자 중 약 17.33 %만이 청력손실을 '매우 큰 문제'로 인식하였다. 놀랍게도 다수의 응답자인 82 %는 청력손실에 관한 정보를 듣거나 보지 못하였다고 답변하였다. 전체 응답자 중 약 85 %의 응답자들은 큰 소음이 있는 환경에서 청력 문제 및 이명을 경험한 적이 있다고 답하였지만, 그 중 11.33 %만이 이어플러그를 착용해 본적이 있다고 응답하였다. 그러나 많은 응답자들은 추후 의료진이 권장하거나(80 %), 소음으로 인한 영구적 청력손실이 발생할 수 있다는 정보를 접한다면(78.67 %) 청력보호를 위해 소음 노출 시 이어플러그를 착용하겠다고 응답하였다. 소음으로 인한 영구적 청력 손실의 잠재성과 효율적인 청력 보호 방법에 대한 체계적인 교육으로 일반인들의 소음성난청을 예방하여야 하겠다.

멀티태스크 러닝 심층신경망을 이용한 화자인증에서의 나이 정보 활용 (Utilization of age information for speaker verification using multi-task learning deep neural networks)

  • 김주호;허희수;정지원;심혜진;김승빈;유하진
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.593-600
    • /
    • 2019
  • 화자 간 음색의 유사성은 화자 인증 시스템의 성능을 하락 시킬 수 있는 요인이다. 본 논문은 화자 인증 시스템의 일반화 성능을 향상시키기 위해, 심층신경망에 멀티태스크 러닝 기법을 적용시켜 발화자의 화자 정보와 나이 정보를 함께 학습 시키는 기법을 제안한다. 멀티태스크 러닝 기법은 은닉층들이 하나의 태스크에 과적합 되지 않도록 하여 심층신경망의 일반화 성능을 향상시킨다고 알려져 있다. 하지만 심층신경망을 멀티태스크 러닝 기법으로 학습시키는 과정에서, 나이 정보에 대한 학습이 효율적으로 수행되지 않는 것을 실험적으로 확인하였다. 이와 같은 현상을 방지하기 위해, 본 논문에서는 심층신경망의 학습 과정 중 화자 식별과 나이 추정 목적 함수의 가중치를 동적으로 변경 하는 기법을 제안한다. 동일 오류율을 기준으로 RSR2015 평가 데이터세트에 대해 화자 인증 성능을 평가한 결과 나이 정보를 활용하지 않은 화자 인증 시스템의 경우 6.91 %, 나이 정보를 활용한 화자 인증 시스템의 경우 6.77 %, 나이 정보를 활용한 화자 인증 시스템에 가중치 변경 기법을 적용한 경우 4.73 %의 오류율을 확인하였다.

하이드로폰을 이용한 산림유역 소류사 유출량 산정 및 현장 적용성 검토 (Evaluation of Field Application and Estimation of Bedload Discharge in the Forest Watershed using the Hydrophone)

  • 서준표;김기대;우충식;이창우;이헌호
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.807-818
    • /
    • 2020
  • 본 연구에서는 산림유역의 소류사 유출량을 산정하기 위해 음향센서를 이용한 하이드로폰을 사용하였다. 하이드로폰의 수로실험과 현장실험을 통해 반응 특성을 분석하고 정량적 소류사 유출량을 산정하여 실측된 유출량과 비교·분석하였다. 하이드로폰 반응은 유량 변화에 따라 펄스값이 변하였지만 모래에는 반응하지 않았다. 입자 크기와 무게에 따라서 펄스값이 다르게 나타났는데 크기와 무게에 따라 적합한 반응을 나타내는 특정 채널이 있었다. 또한 무게와 부피 변화에 따른 반응도 적합하게 나타났지만 특히, 무게 추정에 적절한 것으로 분석되었다. 현장에 설치된 하이드로폰에 대해서 자동충격전달 장치를 이용하여 채널별 반응 특성 분석으로 센서의 정상작동 여부 및 채널별 출력값의 적합성을 확인하고 소류사 유출량 산정을 위해 적합한 채널을 선정하였다. 하이드로폰 펄스와 평균유량을 이용하여 소류사 유출량 산정식을 개발하고 개발된 식과 현장에 실측된 유출량과 비교한 결과 전체적으로 실측값과 유사하게 나타났다. 하이드로폰을 산림유역의 소류사 모니터링에 활용한다면 유출되는 소류사량의 무게를 정량적이고 지속적으로 산정하는데 효율적인 것으로 검토되었다. 국내 산림유역에서 음향센서가 내장된 하이드로폰을 이용하여 소류사 등 토사유출 모니터링에 활용성을 검증함으로써 관련 분야의 연구 및 기술개발 증진에 도움이 될 것으로 기대된다.

선박용 밸브의 내부 누설 진단을 위한 음향방출신호의 머신러닝 기법 적용 연구 (Diagnosis of Valve Internal Leakage for Ship Piping System using Acoustic Emission Signal-based Machine Learning Approach)

  • 이정형
    • 해양환경안전학회지
    • /
    • 제28권1호
    • /
    • pp.184-192
    • /
    • 2022
  • 밸브의 내부 누설 현상은 밸브의 내부 부품의 손상에 의해 발생하며 배관 시스템의 사고와 운전정지를 일으키는 주요 요인이다. 본 연구는 버터플라이형 밸브의 내부 누설에 따라 배관계에서 발생하는 음향방출 신호를 이용하여 배관 가동 중 실시간 누설 진단의 가능성을 검토하였다. 이를 위해 밸브의 작동 모드별로 측정한 시간영역의 AE 원시신호를 취득하였으며 이로부터 구축한 데이터셋은 데이터 기반의 인공지능 알고리즘에 적용하여 밸브의 내부 누설 유무를 진단하는 모델을 생성하였다. 누설 유무진단을 분류의 문제로 정의하여 SVM 기반의 머신러닝과 CNN 기반의 딥러닝 분류 알고리즘을 적용하였다. 데이터의 특징 추출에 기반한 SVM 분류 모델의 경우, 이진분류 모델에서 구축된 모델에 따라 83~90%의 정확도를 나타냈으며, 다중 클래스인 경우 분류 정확도가 66%로 감소하였다. 반면, CNN 기반의 다중 클래스 분류 모델의 경우 99.85%의 분류 정확도를 얻을 수 있었다. 결론적으로 밸브 내부 누설 진단을 위한 SVM 분류모델은 다중 클래스의 정확도 향상을 위해 적절한 특징 추출이 필요하며, CNN 기반의 분류모델은 프로세서의 성능 저하만 없다면 누설진단과 밸브 개도 분류에 효율적인 접근방법임을 확인하였다.

세포 배양 가능한 커버슬립형 초음파 변환자 (Cell-cultivable ultrasonic transducer integrated on glass-coverslip)

  • 이근형;박진형
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.412-421
    • /
    • 2023
  • 초음파 뇌 자극술을 통하여 뇌 심부의 국소 지역에 있는 뇌 세포의 활성화를 유도할 수 있으며, 이를 통하여 저하된 뇌 기능을 치료하는데 효과가 있음이 보고되어 왔다. 반면, 초음파 자극의 종류에 따라 신경 변조의 효율과 방향이 달라질 수 있음이 알려져 있어, 적절한 초음파 자극의 종류를 확립하는 연구가 중요하다. 따라서, 본 논문에서는 이를 효과적으로 최적화 하기 위해 세포 배양시 사용되는 커버슬립 기반의 초음파 변환자를 제안하고자 한다. 균일한 초음파 자극을 전도하기 위해서 폴리머 압전소자(Poly-vinylidene fluoride-trifluorethylene, PVDF-TrFE)를 스핀 코팅하고 패를린 절연층을 상단에 적층시켜 음압 출력을 극대화 시켰다. 개발된 초음파 변환자 융합 커버슬립은 초음파자극기 표면에 배양된 수십개의 신경세포에 균일하고 정확한 초음파 자극을 전달 할 수 있고, 자극에 따른 세포의 반응을 형광 현미경으로 실시간 관찰 가능하다. 따라서, 동일한 초음파 자극에 대한 세포의 반응 신호를 최대 수십개 세포로부터 동시에 획득 가능하므로, 반응 신호를 평균 한다면 낮은 강도의 초음파 자극에 따른 뇌 세포의 미세한 반응을 검출할 수 있을 뿐만 아니라, 초음파 변환자와 물의 표면 등에서 발생하는 정현파에 의한 자극의 왜곡 현상을 줄일 수 있어서 사용자가 원하는 초음파 자극을 정확하게 세포로 전달 가능하다. 이렇게 개발된 초음파 변환자를 통해 변환자 표면에 배양된 별세포에서 6 MHz, 0.2 MPa의 저강도 초음파 자극에 의해 유도된 칼슘 반응을 성공적으로 관찰할 수 있었다.

축방향 서브 나이퀴스트 샘플링 기반의 횡탄성 영상 기법 (Shear-wave elasticity imaging with axial sub-Nyquist sampling)

  • 오우진;윤희철
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.403-411
    • /
    • 2023
  • 탄성 영상과 미세 혈류 도플러 영상과 같은 기능성 초음파 영상은 조직의 기계적, 기능적 정보를 제공함으로써 진단 성능을 향상시킨다. 그러나 기능성 초음파 영상의 구현은 데이터 획득 및 처리 시 대용량 데이터 저장과 같은 한계를 야기한다. 본 논문에서는 효율적인 횡탄성 영상 기법을 위해 데이터 획득 양을 절감시키는 서브 나이퀴스트 접근법을 제안한다. 제안하는 방법은 기존 나이퀴스트 샘플링 속도보다 1/3배 낮은 샘플링 속도로 데이터를 획득하고, 주파수 스펙트럼의 주기성을 이용하여 대역 통과 필터링 기반의 보간을 통해 재구성된 Radio Frequency(RF) 신호를 사용하여 횡파 신호를 추적한다. 이때 RF 신호는 67 % 미만의 비대역폭으로 제한된다. 제안하는 접근법을 검증하기 위해 기존 샘플링 속도로 획득한 횡파 추적 데이터를 이용하여 서브 나이퀴스트 샘플링된 RF 신호를 재현하고, 기존 접근법과 횡파 속도 영상을 재구성한다. 정량적 평가를 위해 재구성한 횡파 속도 영상의 군속도, 대조도 잡음 비, 그리고 구조적 유사성 지수를 비교하였다. 우리는 서브 나이퀴스트 샘플링 기반 횡탄성 영상의 가능성을 정성적, 정량적으로 입증하였고, 향후 실시간 3차원 횡탄성 영상 기술에 유용하게 적용 가능할 것으로 기대된다.

외부 전동블라인드의 사양에 따른 창호 차음성능 개선 효과 (Improvement of sound insulation performance of windows according to the specifications of the external electric blinds)

  • 강민우;이희동;오양기
    • 한국음향학회지
    • /
    • 제41권6호
    • /
    • pp.621-628
    • /
    • 2022
  • 도로교통 소음이나 항공기 소음 등의 건물 외부소음을 저감하기 위한 가장 현실적인 방안은 각 건물의 발코니와 창호, 외벽 등 수음점에서의 차음성능을 강화하는 것이다. 그러나 아직 건물 외부의 차양장치가 광범위하게 사용되지 않고 있는 현실에 비추어 루버나 블라인드 등의 창호 외부장치를 활용하는 차음성능 개선 연구는 많지 않다. 특히 외장형 블라인드는 아침-저녁의 강한 일사의 유입을 건물 외부에서 차단하는 차광 효과 뿐 아니라 출퇴근 시간대에 발생하는 피크 소음을 차단하는 차음 효과도 동시에 목표할 수 있다. 이 연구에서는 가장 효율적인 창호 외부 차양장치의 하나인 외부 전동블라인드(External Electric Blind, EEB)를 활용하여 외부소음에 대한 차음성능을 개선하고자 하는 연구를 수행하였다. 차광 용도로 개발된 외부 전동블라인드의 구성을 변화시켜가면서 다양한 차음성능 실험을 수행하였다. 이를 통해 일반 창호의 저감 성능 대비 외부 전동블라인드를 설치함으로써 6 dB의 추가 차음성능을 얻을 수 있음을 검증하였다.