• 제목/요약/키워드: Microphone Techniques

검색결과 43건 처리시간 0.02초

음성 분류 인공신경망을 활용한 자폐아 치료용 로봇의 지능화 동작 연구 (Motion Study of Treatment Robot for Autistic Children Using Speech Data Classification Based on Artificial Neural Network)

  • 이진규;이보희
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1440-1447
    • /
    • 2019
  • 현재 아이들의 자폐스펙트럼장애 유병률이 한층 더 높게 보고되고 있으며 다양한 형태의 장애 징후를 보이고 있다. 특히 이들은 사회적 의사소통 영역에서 의사소통장애로 인한 대화에 어려움을 겪고 있으며 이를 훈련을 통해 개선 시킬 필요가 대두된다. 이를 위해 본 연구에서는 사전 연구를 통해 설계된 로봇에 장착된 마이크를 통해 음성 정보를 취득하고 이러한 정보를 이용하여 지능적인 동작을 만드는 방식을 제안한다. 음성 정보를 로봇 동작으로 분류하기 위해 인공신경망을 이용하였으며 여러 신경망 기법중 합성곱 방식을 기본으로 한 순환신경망을 결합하여 정확도를 향상시키려고 하였다. 입력 음성 데이터의 전처리는 MFCC를 이용하여 분석하였으며 여러 데이터 정규화 및 인공신경망 최적화 기법을 활용하여 로봇의 동작을 추정하였다. 아울러 설계된 인공신경망은 기존에 사용한 구조 및 사람이 개입하여 분석하는 방법과의 정확도 비교 실험을 진행하여 분석 결과가 높은 정확도를 나타냈다. 향후 보다 높은 정확도를 가질 수 있는 로봇 동작을 설계하여 실제의 자폐아 치료 및 교육 환경에서 적용할 수 있기 위하여 다양한 형태의 데이터를 수집하고 효율적으로 전처리하는 방식에 대한 연구가 요구된다.

BuddyMirror: 이미지 메이킹 서비스를 지원하는 스마트 미러 (BuddyMirror: A Smart Mirror Supporting Image-Making Service)

  • 조연정;심채린;장효원;진재환;이명준
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권5호
    • /
    • pp.811-821
    • /
    • 2019
  • 사람에 대한 이미지 메이킹은 외모나 인상, 자신감 등 자신을 표현할 수 있는 다양한 요소들을 개선하는 방법이다. 사람들은 이미지 메이킹을 위하여 전통적인 방법으로서 거울이나 카메라를 이용하여 자신의 모습을 확인하거나 발표 연습을 수행한다. 최근에는 스마트 미러가 여러 분야에서 널리 활용됨에 따라 스마트 미러가 거울을 대신하여 이미지 메이킹 도구로 사용하고자 하는 시도가 빈번하게 등장하고 있다. 스마트 미러는 쉽게 접근이 가능하다는 거울의 특성을 가질 뿐만 아니라 카메라나 마이크 등 다양한 기기를 부착할 수 있으므로 이미지 메이킹 서비스를 제공하기 위한 도구로서 적합하다. 본 논문에서는 사용자에게 이미지 메이킹 서비스를 제공하는 스마트 미러 소프트웨어인 BuddyMirror와 이를 유연하게 동작시키기 위한 전용 모바일 앱의 개발에 대하여 기술한다. BuddyMirror는 사용자의 요청에 따라 발표준비, 모의면접, 스타일링 서비스를 제공하고 전용 모바일 앱과의 연동 기능을 제공한다. 이를 위하여, 본 논문에서는 개발된 새로운 서비스를 널리 사용되는 스마트 미러 개발 플랫폼인 MagicMirror의 모듈로서 구현하고 동작시키기 기법을 설명한다. 전용 모바일 앱은 사용자가 이미지 메이킹 서비스를 제공 받기 위해 발표 자료를 스마트 미러에 전달하거나 촬영된 영상을 다운로드하는 기능을 제공한다.

음성 향상에서 강인한 새로운 선행 SNR 추정 기법에 관한 연구 (A Novel Approach to a Robust A Priori SNR Estimator in Speech Enhancement)

  • 박윤식;장준혁
    • 한국음향학회지
    • /
    • 제25권8호
    • /
    • pp.383-388
    • /
    • 2006
  • 본 논문에서는 잡음 환경에서 단일 마이크로폰의 음성 향상에 대한 새로운 기법을 제시했다. 일반적으로 널리 알려진 스펙트럼 차감법에 근거한 음성 향상 기술은 신호 대 잡음비에 따른 스펙트럼 이득으로 표현된다. 대표적인 Ephraim과 Malah의 decision-directed (DD) 추정치는 잡음 구간에서 효율적으로 뮤지컬 잡음을 제거하지만 음성 구간에서는 이전 프레임의 음성 스펙트럼 성분에 더 큰 비중을 두기 때문에 a priori SNR의 프레임 지연이 발생한다. 따라서 DD에 의해 추정된 a priori SNR이 적용된 잡음 제거 이득은 현재 프레임보다 이전 프레임에 영향을 받으므로 음성 전이 구간에서 잡음 제거 성능을 저하시킨다. 본 논문은 DD의 가중치 파라미터에 Sigmoid Type의 함수를 적용하여 계산적으로는 간단하지만 효과적인 음성 향상 알고리즘을 제안한다. 제안된 접근 방식은 DD의 주요 파라미터인 a priori SNR 지연의 문제점을 해결하면서 뮤지컬 잡음 제거에 우수한 DD의 이점은 유지한다. 제안된 알고리즘의 성능은 다양한 잡음 환경에서 ITU-T P.862 Perceptual Evaluation of Speech Quality (PESQ) 와 Mean Opinion Score (MOS). 그리고 음성 스펙트로그램 (Spectrogram)에 의해 평가했고 기존의 DD의 고정된 가중치 파라미터를 사용했을 때 보다 향상된 결과를 나타내었다.