• 제목/요약/키워드: 음성추출

검색결과 988건 처리시간 0.044초

생체 신호 추출값 비교를 통한 40~50대 여성의 사상체질 분류 시스템 구현 (Implementation of Sasang Constitution Classification of 40~50 Years Woman Using Physiology Signal Extraction Comparison)

  • 조동욱;김봉현;이세환;가민경;박선애;곽지현
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2008년도 춘계학술발표논문집
    • /
    • pp.125-128
    • /
    • 2008
  • 사상의학은 개인별 체질의 분류에 따른 맞춤형 의학으로 우리나라 고유의 독특한 전통 의학이다. 이와 같은 사상의학에서 가장 중요하게 여겨지는 것이 사상체질의 정확한 분류이다. 따라서 사상체질 분류에 대한 객관적 요소의 확보 및 진단 지표 마련이 시급하게 해결되어야 할 과제이다. 이를 위해 본 논문에서는 사상체질 분류의 객관화, 정량화 및 시각화를 위해 얼굴 영상 신호와 음성 신호를 분석하여 결과값을 추출하고 체질별 집단군간의 차이점을 비교하여 사상체질 분류 시스템을 구현하고자 한다. 특히 영상 및 음성 신호는 성별, 연령별, 지역별 등의 구분에 따라 달라지기 때문에 본 논문에서는 40에서 50대 사이의 장년 여성을 대상으로 서울지역 거주자에 한해 사상체질 집단군을 구성하고 이들의 영상 및 음성 신호를 추출하여 체질간 비교, 분석을 수행하고자 한다. 최종적으로 실험을 통한 연구 결과의 유의성을 입증하고자 한다.

  • PDF

피치 요소 추출 및 분석을 이용한 20-30대 남성의 사상체질 태음인 분류 기법 (Classfication Method of Sasang Constitution Teeumin 20-30 Years of Man Using Pitch Element Extraction and Analysis)

  • 김봉현;가민경;이세환;곽지현;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.133-136
    • /
    • 2008
  • 초고령화 사회로 진입하면서 건강의 유지 및 관리는 일상생활에서 매우 중요한 관심으로 대두되고 있다. 특히 우리나라 전통의학에 대한 가치성이 향상되면서 이를 실생활에 접목하기 위한 노력이 활발하게 진행되고 있는 실정이다. 이를 위해 본 논문에서는 사상의학에 대한 체질 분류의 객관화를 통해 예방차원의 건강 관리를 지속하기 위한 연구를 진행하고자 한다. 특히 사상의학에서 제안하고 있는 여러 사상체질 분류 방법 중에서 음성을 통한 사상체질 분류 방법을 공학적으로 구현하여 이를 객관적 진단 지표로 설계하고자 한다. 따라서 본 논문에서는 서울지역에 거주하고 있는 20-30대 남성의 음성을 수집하여 음성 분석학적 요소 중 피치 분석 요소들에 대한 추출 및 비교를 통해 사상의학의 사기론에서 제안하는 이론적 근거를 입증하고자 한다. 최종적으로 실험을 통해 추출된 결과를 사상의학 전문의의 진단 결과와 비교, 분석하여 제안하는 기법에 대한 검증을 수행하고자 한다.

새로운 시간축 정규화 방법을 이용한 한국어 고립단어 인식기 (Korean isolated word recognizer using new time alignment method of speech signal)

  • 남명우;박규홍;노승용
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.567-575
    • /
    • 2001
  • 본 논문에서는 음성신호의 발성길이와 상관없이 일정한 크기의 파라미터를 얻을 수 있는 새로운 방법을 제안하였다. 음성인식기의 성능은 음성신호에서 추출된 파라미터간의 유사도(패턴간의 거리)를 어떻게 비교하는지에 따라 결정된다. 그러나 화자에 따른 음성신호의 변이나 발성속도의 차이는 음성신호에서 일정한 크기의 파라미터 추출을 어렵게 한다. 제안한 방법은 음성신호에서 얻어진 파라미터를 스펙토그램의 형태로 표현한 뒤 2차원 DCT(Discrete Cosine Transform)를 이용해 일정한 크기의 파라미터로 정규화시키는 방법이다. 제안한 방법의 유효성을 입증하기 위해 청각세포를 모델링한 32개의 대역통과 필터로부터 얻어진 음성신호의 파라미터를 2차원 DCT 방법으로 가공한 후, 신경 회로망의 입력으로 사용하였다. 또한 기존 방법과의 인식률 비교를 위해 기존의 정규화된 입력을 구하는 방법 중 하나를 선택하여 비교 실험을 수행하였다. 실험결과 제안한 방법은 기존 방법에 비해 화자종속 및 화자독립 고립단어 인식에서 더 높은 인식률과 빠른 인식속도를 얻을 수 있었다.

  • PDF

Dialog/4 보드를 이용한 전화음성 기반의 화자 인증 시스템의 구현 (An Implementation of Telephone-based Speaker Verification System using Dialog/4 Board)

  • 이순려;박일구;최홍섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.89-92
    • /
    • 2004
  • 전화 음성용 화자인증 시스템 전화기에서 의뢰인의 ID와 음성을 입력받은 후 인증관련 처리론 PC에서 수행하여 그 인증 결과를 의뢰인의 전화로 알려주는 시스템으로 본 논문에서는 CTI(Computer Telephony Integration) 기술이 적용된 Dialog/4 보드를 이용하여 시스템을 구현하였다. Dialog/4 보드를 통하여 시스템에 입력된 ID와 음성에 대하여 신호처리와 특징 추출을 거친후 ID에 해당하는 화자모델과 배경화자 정보를 이용하여 유사도를 계산하여 의뢰인에 대한 인증 또는 거절의 결과를 알려준다. 실제의 전화음성을 이용한 화자인증 시스템이 성능평가에서 전화음성으로 실험을 할 경우 $99.6\%$의 인증률을 보여주었다.

  • PDF

음성을 이용한 사상체질 분류 보조 알고리즘 (Voice Classification Algorithm for Sasang Constitution)

  • 강재환;이혜정
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1982_1983
    • /
    • 2009
  • 본 연구에서는 기존의 특정 음성 변수에 대한 모수적 통계 접근 방법을 탈피하고 새로운 음성을 이용한 사상체질 분류 알고리즘을 개발하고자 먼저 5개의 모음과 2개의 문장으로 이루어진 총 120명의 여성 음성 데이터 수집하였다. 이후 다양한 음성 신호 분석 방법과 툴을 이용하여 총 134개의 음성 변수를 추출하였다. 각 변수에서는 체질별 최대값들의 최소값, 최소값들의 최대값을 이용해 4개의 조건 변수를 새로 생성하고 이를 관리하기 위한 메모리와 체질 점수 개념을 도입하여 비모수적인 통계 방법을 기반으로 한 분류 알고리즘을 개발하였다. 알고리즘 성능 테스트를 위해 10-fold cross 검정테스트를 실시하였으며 본 알고리즘은 최종적으로 이진 분류에서 진단률 41.5%와 정확률 79.5%를 가지는 것으로 확인되었다.

  • PDF

호텔예약을 위한 자동통역 시스템 (An Experimental Speech Translation System for Hotel Reservation)

  • 구명완;김웅인;김재인;도삼주;강용범;박상규;손일현;김우성;장두성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.105-108
    • /
    • 1995
  • 한국에 있는 손님이 한국어 만을 사용하여 일본 호텔을 예약할 수 있도록 해 주는 한일간 자동통역 시연 시스템에 관해 기술하였다. 이 시스템은 한국어 음성인식부, 한일 기계번역부, 한국어 음성합성부로 구성되어 있다. 한국어 음성인식부는 기본적으로 HMM을 이용하는 화자독립, 약 300단어급 연속음성인식 시스템으로서 전향 언어 모델로 바이그램 언어 모델, 후향 언어 모델로는 의존 문법을 사용하여 N-BEST 문장을 생성해낸다. 실험결과, 단어 인식률은 top1 문장에 대해 약 94.5%, top5 문장에 대해 약 94.7%의 인식률을 얻었다. 인식 시간은 길이가 다른 여러 문장들에 대해 약 0.1~3초가 걸렸다. 기계번역부에서는 음성인식에서 의존 문법을 사용하여 분석된 파싱 결과를 이용, 직접 번역 방식을 채택하여 일본어를 생성한다. 음성 합성부는 반음소를 합서의 기본단위로 하고, 합성방식으로는 주기 파형 분해 및 재배치 방식으로 하였다. 실험 환경은 2 CPU를 장착한 SPARC 20 workstation 이었으며 실시간 특징 추출을 위해 TMS320C30 DSP 보드 1개를 이용하였다.

  • PDF

시간 영역에서 개선된 파라미터 추론을 통한 효율적인 초광대역 확장 시스템 설계 (Designing of efficient super-wide bandwidth extension system using enhanced parameter estimation in time domain)

  • 전종근
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.431-433
    • /
    • 2018
  • 본 논문은 광대역 음성의 음질 향상을 위해 시간 영역에서 인공대역 확장 기술을 사용하여 초광대역 음성신호를 출력하여 사용자에게 개선된 음질의 음성을 제공하는 시스템을 제안한다. 시간 영역에서 소스필터 모델에 기반하여 광대역 여기신호 및 LSP를 추출하고, 각각의 대역폭 확장 알고리즘을 적용였고, 초광대역 여기신호 및 LSP를 추론하여 초광대역 음성신호를 합성한다. 주관적인 테스트를 통해 광대역 음성신호보다 초광대역 음성신호의 음질을 더 선호하는 결과를 도출하였다.

  • PDF

응급구조에서의 음향데이터 분석을 위한 음성 부재구간 검출 기술 (Voice inactivity detection for Analysis of Acoustic data of Emergency Rescue)

  • 황승현;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1348-1349
    • /
    • 2015
  • 본 논문에서는 응급구조의 신고 상황에서의 수보자의 보다 정확하고 신속한 대응를 위하여 수화자의 음향환경을 분석하여 주변상황에 대한 정보를 알고자 심화 신경망 기반의 음성 부재구간 검출 기법을 제안한다. 제안한 알고리즘은 음성 신호에서의 23차의 Mel-filter bank를 추출하고 이를 심화 신경망 기법을 이용하여 음성 부재구간을 검출한다. 객관적인 성능 평가를 위해 제안된 기법은 실제 응급구조 상황에서 평가되었으며, 기존의 음성검출기를 이용한 음성 부재구간 검출 성능에 비하여 향상된 성능을 보였다.

스펙트럴 차원의 잡음처리를 이용한 음성인식 (Speech Recognition Using Noise Processing in Spectral Dimension)

  • 이광석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.738-741
    • /
    • 2009
  • 본 연구는 잡음을 포함한 음성 환경에서의 음성인식을 개선방안에 관한 것이다. 우리는 음성인식에서 잡음 섞인 음성으로부터 얻은 스펙트럴 envelope에서 곡들의 스펙트럴 subtraction 및 복원이 보다 더 효과적임을 알 수 있었다. 본 연구에서, 평균화된 스펙트럴 envelope은 모음 스펙트럼으로부터 추출하여 곡들의 강조에 사용하였다. 낮은 주파수 영역에서의 모음 스펙트럴 정보는 강조되어지고 자음으로부터 얻은 스펙트럼은 변하지 않는다. 시뮬레이션으로 살펴보면, 강조계수는 켑스트럴 영역에서 변한다. 이 방법으로 잡음석인 숫자음성 인식에서 적용하였으며 인식결과가 개선됨을 알 수 있었다.

  • PDF

STT 효율 증대를 위한 음성 주파수 correlation 기반 노이즈 필터링 방안 (Noise filtering method based on voice frequency correlation to increase STT efficiency)

  • 임지원;황용해;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.176-179
    • /
    • 2021
  • 현재 음성인식 기술은 인공지능 비서, 전화자동응답, 네비게이션 등 다양한 분야에서 사용되고 있으며 인간의 음성을 디바이스에 전달하기 위해 음성 신호를 텍스트로 변환하는 Speech-To-Text (STT) 기술을 필요로 한다. 초기의 STT 기술의 대부분은 확률 통계 방식인 Hidden Markov Model (HMM)기반으로 이루졌으며, 딥러닝 기술의 발전으로 HMM과 함께 Recurrent Nural Network (RNN), Deep Nural Network (DNN) 기법을 사용함으로써 과거보다 단어 인식 오류를 개선하며 20%의 성능 향상을 이루어냈다. 그러나 다수의 화자 혹은 생활소음, 노래 등 소음이 있는 주변 환경의 간섭 신호 영향을 받으면 인식 정확도에 차이가 발생한다. 본 논문에서는 이러한 문제를 해결하기 위하여 음성 신호를 추출하여 주파수성분을 분석하고 오디오 신호 사이의 주파수 영역 correlation 연산을 통해 음성 신호와 노이즈 신호를 구분하는 것으로 STT 인식률을 높이고, 목소리 신호를 더욱 효율적으로 STT 기술에 입력하기 위한 방안을 제안한다.

  • PDF