• 제목/요약/키워드: Mel test

검색결과 38건 처리시간 0.023초

DHMM 음성 인식 시스템을 위한 양자화 기반의 화자 정규화 (Quantization Based Speaker Normalization for DHMM Speech Recognition System)

  • 신옥근
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.299-307
    • /
    • 2003
  • 화자독립 음성인식기에서 화자사이의 성도 길이의 영향을 최소화시켜 인식 성능을 개선하는 화자 정규화에 대한 많은 연구가 있어 왔다. 본 연구에서는 벡터양자화기를 이용하여 화자 검증이 가능하다는 사실에 착안하여 벡터 양자화기를 이용한 비교적 간단한 선형 워핑 화자정규화방법을 제안한다. 제안하는 방법에서는 먼저 정규화에 이용될 최적의 코드북을 생성한 다음, 이 코드 북을 이용하여 화자의 선형 워핑계수를 추출하고 추출된 워핑계수는 멜 켑스트럼 추출시에 사용되는 멜스케일 필터뱅크를 워핑하기 위해 이용된다. 본고에서 제안한 워핑계수 추출 및 적용 방법의 성능을 확인하기 위해 이산 HMM을 이용한 13가지의 단음절 한글 숫자음 인식기를 이용하여 인식실험을 수행하였으며, 실험 결과 약 29%의 오인식률 감소를 보여 제안하는 화자 정규화방법이 다른 라인서치 워핑계수추출 방법보다 간단한 동시에 효용가치가 있음을 확인하였다.

G/T 4.99톤급 한국 연안어선의 저항성능 개선에 관한 연구 (A Study on the Improvement of Resistance Performance for G/T 4.99ton Class Korean Coastal Fishing Boats)

  • 유진원;이영길;지현우;박애선;최영찬;하윤진;정광열
    • 대한조선학회논문집
    • /
    • 제47권6호
    • /
    • pp.757-762
    • /
    • 2010
  • Korean fishing boats have had appropriate hull forms for the safety, stability and convenience of fishing ability. However, Korean fishermen are recently concerned about the resistance performance and speed of Korean fishing boats, because the prices of fuel oil are gradually risen, also the exhausting of fish resources and the demand of high speed fishing boats are increased. Therefore, the necessity of the study on the improvement of resistance performance for Korean small coastal fishing boats is gradually increased. This study compares the hull form characteristics of Korean fishing boats with those of Japanese fishing boats, and the hull form of a representative Korean fishing boat is modified. From the modification of the hull form parameters for the Korean fishing boat, the improvement of resistance performances is evaluated. Moreover, the increase of resistance performances is also achieved from the modification of local characteristics for the hull form of the Korean fishing boat. A computational method and ship model tests in towing tank are used for the conformations of the improvement of resistance performance.

차분 특징을 이용한 평균-교사 모델의 음향 이벤트 검출 성능 향상 (Performance Improvement of Mean-Teacher Models in Audio Event Detection Using Derivative Features)

  • 곽진열;정용주
    • 한국전자통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.401-406
    • /
    • 2021
  • 최근 들어, 음향 이벤트 검출을 위하여 CRNN(: Convolutional Recurrent Neural Network) 구조에 기반 한 평균-교사 모델이 대표적으로 사용되고 있다. 평균-교사 모델은 두 개의 병렬 형태의 CRNN을 가진 구조이며, 이들의 출력들의 일치성을 학습 기준으로 사용함으로서 약-전사 레이블(label)과 비-전사 레이블 음향 데이터에 대해서도 효과적인 학습이 가능하다. 본 연구에서는 최신의 평균-교사 모델에 로그-멜 스펙트럼에 대한 차분 특징을 추가적으로 사용함으로서 보다 나은 성능을 이루고자 하였다. DCASE 2018/2019 Challenge Task 4용 학습 및 테스트 데이터를 이용한 음향 이벤트 검출 실험에서 제안된 차분특징을 이용한 평균-교사모델은 기존의 방식에 비해서 최대 8.1%의 상대적 ER(: Error Rate)의 향상을 얻을 수 있었다.

LSTM 순환 신경망을 이용한 초음파 도플러 신호의 음성 패러미터 추정 (Estimating speech parameters for ultrasonic Doppler signal using LSTM recurrent neural networks)

  • 주형길;이기승
    • 한국음향학회지
    • /
    • 제38권4호
    • /
    • pp.433-441
    • /
    • 2019
  • 본 논문에서는 입 주변에 방사한 초음파 신호가 반사되어 돌아올 때 발생하는 초음파 도플러 신호를 LSTM(Long Short Term Memory) 순환 신경망 (Recurrent Neural Networks, RNN)을 이용해 음성 패러미터를 추정하는 방법을 소개하고 다층 퍼셉트론 (Multi-Layer Perceptrons, MLP) 신경망을 이용한 방법과 성능 비교를 하였다. 본 논문에서는 LSTM 순환 신경망을 이용해 초음파 도플러 신호로부터 음성 신호의 푸리에 변환 계수를 추정하였다. LSTM 순환 신경망을 학습하기 위한 입력 및 기준값으로 초음파 도플러 신호와 음성 신호로부터 각각 추출된 멜 주파수 대역별 에너지 로그값과 푸리에 변환 계수가 사용되었다. 테스트 데이터를 이용한 실험을 통해 LSTM 순환 신경망과 MLP의 성능을 평가, 비교하였고 척도로는 평균 제곱근 오차(Root Mean Squared Error, RMSE)가 사용되었다.각 실험의 RMSE는 각각 0.5810, 0.7380로 나타났다. 약 0.1570 차이로 LSTM 순환 신경망을 이용한 방법의 성능 우세한 것으로 확인되었다.

Harnessing the Power of Voice: A Deep Neural Network Model for Alzheimer's Disease Detection

  • Chan-Young Park;Minsoo Kim;YongSoo Shim;Nayoung Ryoo;Hyunjoo Choi;Ho Tae Jeong;Gihyun Yun;Hunboc Lee;Hyungryul Kim;SangYun Kim;Young Chul Youn
    • 대한치매학회지
    • /
    • 제23권1호
    • /
    • pp.1-10
    • /
    • 2024
  • Background and Purpose: Voice, reflecting cerebral functions, holds potential for analyzing and understanding brain function, especially in the context of cognitive impairment (CI) and Alzheimer's disease (AD). This study used voice data to distinguish between normal cognition and CI or Alzheimer's disease dementia (ADD). Methods: This study enrolled 3 groups of subjects: 1) 52 subjects with subjective cognitive decline; 2) 110 subjects with mild CI; and 3) 59 subjects with ADD. Voice features were extracted using Mel-frequency cepstral coefficients and Chroma. Results: A deep neural network (DNN) model showed promising performance, with an accuracy of roughly 81% in 10 trials in predicting ADD, which increased to an average value of about 82.0%±1.6% when evaluated against unseen test dataset. Conclusions: Although results did not demonstrate the level of accuracy necessary for a definitive clinical tool, they provided a compelling proof-of-concept for the potential use of voice data in cognitive status assessment. DNN algorithms using voice offer a promising approach to early detection of AD. They could improve the accuracy and accessibility of diagnosis, ultimately leading to better outcomes for patients.

멜론 및 참외 순도 검정을 위한 SNP 마커 개발 및 F1 종자 순도 검정 (SNP Marker Development for Purity Test of Oriental Melon and Melon)

  • 안송지;권진경;양희범;최혜정;정희진;김용재;최경자;강병철
    • 한국육종학회지
    • /
    • 제42권4호
    • /
    • pp.397-406
    • /
    • 2010
  • 멜론과 참외의 국내 소비 시장이 확대됨에 따라 다양한 $F_1$ 품종이 개발되고 있다. 멜론과 참외의 $F_1$ 품종의 순도를 검정하기 위해 포장재배 등의 순도검정법이 이용되고 있으나 시간과 노력이 매우 많이 소요되기 때문에 분자마커를 이용한 순도검정법의 개발이 필요하다. 본 연구에서는 멜론의 EST 염기정보로부터 30개의 SNP 프라이머 조합을 고안하여 멜론과 참외의 순도 검정을 위한 HRM분석방법을 개발하였다. 멜론 두 품종과 참외 한 품종의 양친 사이에 HRM 해리곡선의 다형성을 보이는 10개의 마커를 선발하였으며 순도검정 마커를 선발하기 위해 blind test를 실시하였다. Blind test와 HRM 유전형 분석 결과가 일치하였으며 MEL SNP 2번과 12 마커를 이용하여 '레드 퀸'과 '얼쓰 VIP'의 $F_1$ 501개 개체에 대해 순도검정을 실시하였다. HRM분석한 결과 모두 이형집합체로 나타나 100%의 순도를 보였다. 또한 HRM 방법을 이용하여 개발한 SNP 마커를 CAPS 마커로 전환하였다. CAPS 마커는 HRM 분석 마커와 비교하여 볼 때 멜론과 참외의 순도검정용 마커로 더 유용하게 활용될 수 있을 것으로 기대된다.

고분자필름과 금속막 의료소재에 대한 생체적합성 및 독성 평가를 위한 새로운 세포배양시스템의 개발 및 적용 (Development and Application of a Novel Mammalian Cell Culture System for the Biocompatibility and Toxicity of Polymer Films and Metal Plate Biomaterials)

  • 곽문화;윤우빈;김지은;성지은;이현아;서은지;남국일;정영진;황대연
    • 생명과학회지
    • /
    • 제26권6호
    • /
    • pp.633-639
    • /
    • 2016
  • 고분자(polymer), 금속(metal), 세라믹(ceramic), 합성물(composite) 등과 같은 바이오소소재(Biomaterials)는 그들의 물리화학적 성질 때문에 의료용섬유(medical fibers), 인공혈관(artificial blood vessels), 인공관절(artificial joints), 임플란트(implants), 연조직(soft tissue), 인공성형물(plastic surgery materials) 등 의료용으로 많이 사용되며, 개발연구도 활발히 진행되고 있다. 그러나, 필름(film)이나 판(plate)형태의 바이오소재에 대한 생체적합성(biocompatibility)이나 독성(toxicity)을 포유동물세포를 이용하여 평가하는 것은 적절한 평가용 장치가 없기 때문에 매우 어려운 상황이다. 따라서 이러한 문제를 해결하기 위해서, 본 연구에서는 고분자필름이나 금속판에 유용하게 적용할 수 있는 실리콘링, 상판(top panel), 하판(bottom panel)으로 구성된 새로운 포유동물배양시스템을 개발하고, 이를 실제 적용하고자 하였다. 개발된 시스템은 평가하고자 하는 시료를 상판과 하판사이에 조립하는 샌드위치시스템을 기반으로 한다. 세포배양장치의 조립 후, SK-MEL-2세포를 3가지 시료; Styela Clava Tunic (SCT)- PF, NaHCO3-added SCT (SCTN)-PF, magnesium MP (MMP)에 적용하고 37℃ 이산화탄소 배양기에서 24시간과 48시간 동안 배양하였다. MTT분석결과에서, 세포생존율(cell viability)은 24시간과 48시간 동안 SCT-PF배양그룹에서 정상적으로 유지되었지만 48시간 동안 SCTN-PF배양그룹에서는 급격하게 감소되었다. 더불어, MMP배양그룹에서 세포생존율은 24시간과 48시간 배양 후에 대조군과 유사하게 유지되었다. 이러한 결과는 본 연구에서 새롭게 개발된 샌드위치형태의 포유동물세포배양장치는 고분자필름이나 금속판형태의 바이오소재에 대한 독성이나 생체적합성을 평가하기 위한 우수한 잠재력을 보유하고 있음을 제시하고 있다.

강인한 음성인식을 위한 통계적 특징벡터 추출방법의 개선 (An Improvement of Stochastic Feature Extraction for Robust Speech Recognition)

  • 김회린;고진석
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.180-186
    • /
    • 2004
  • 음성 신호에 존재하는 잡음은 음성 인식기의 성능을 현저하게 감소시킨다. 이것은 잡음이 훈련 조건과 인식 조건 사이의 불일치를 가져오기 때문이다. 본 논문에서는 이러한 불일치를 최소화하기 위해서 통계적 특징벡터의 추출방법을 개선하기 위한 방법을 연구하였다. 밴드 SNR에 따라 잡음 스펙트럼의 차감 레벨을 조절하는 기존의 멀티 밴드 잡음 차감법 (MSS)을 개선하기 위하여 잡음 정규화 상수를 이용하여 잡음 스펙트럼의 차감 레벨을 보다 정확하게 조절하는 방법 (M-MSS)을 제시하였다. 다음으로, 기존의 통계적 특징벡터 추출방법 (SFE)에서 잡음 차감법을 파워 스펙트럼 영역에 적용함으로써 성능을 개선하였다(M-SFE). 마지막으로, 위의 두 가지 방법의 장점을 결합하기 위해서 밴드 SNR에 근거한 통계적 특징벡터 추출방법 (MMSS-MSFE)을 제안하였다. 제안된 방법들은 다양한 잡음 환경 하에서 화자독립 고립 단어 인식으로 성능을 평가하였다. 기본적인 잡음 차감법 (SS)에 비하여 M-MSS, M-SFE와 MMSS-MSFE의 평균 에러율은 각각 18.6%, 15.1%와 33.9% 감소하였다. 위의 결과로부터 제안한 방법이 잡음에 강인한 음성인식을 위해 매우 효과적임을 입증하였다.