• 제목/요약/키워드: 음성 훈련

검색결과 281건 처리시간 0.027초

웹 3D 기술을 사용한 수소충전소 가상체험교육시스템 제작 (Development of Web3D-based Virtual Reality System for Hydrogen Station)

  • 윤종철;권지용;이인권
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제15권2호
    • /
    • pp.35-40
    • /
    • 2009
  • 본 논문에선 수소 경제의 핵심 인프라 시설이며, 차세대 동력원인 수소에너지 관리 시설의 관리자들의 안전교육 및 훈련을 위한 가상체험 모들을 제안한다. 우리의 시스템은 이벤트 기반의 웹 3D기술을 사용하여, 일반적인 사용자가 손쉽게 사이트에 접속하여 실제 모델별 수소충전소를 가상으로 경험하며, 내부적으로 위치한 안전장치에 대한 가상 경험을 제공한다. 사용자는, 가상현실 환경 내에서 다양한 이벤트를 통해 안전사고시 대처상황을 습득할 수 있으며, 추가적으로 동영상과 음성 등의 멀티 미디어 객체의 제공으로 보다 나은 교육환경을 제시한다. 본 시스템을 사용하며, 실제 수소충전소의 관리자들의 교육기능을 향상시킬 수 있으며, 향후 수소충전소의 홍보수단으로도 사용이 가능하다.

  • PDF

CD-ROM 네트워크(LAN)에 관한 소고(小考) (A Study on the CD ROM Network(LAN))

  • 길형도
    • 정보관리연구
    • /
    • 제21권2호
    • /
    • pp.9-23
    • /
    • 1990
  • CD-ROM기술(技術)의 개발(開發)은 불과 10년이 채 안되었지만 그동안 비약적 발전을 거듭하여 여러 응용분야(應用分野)에서 활용되고 있다. 서지데이터는 물론 수치(數値), 음성(音聲), 영(映) 화상(畵像) 데이터를 초록형(抄錄型) 또는 전문형(全文型)으로 수록하여 도서관은 물론 기업체(企業體), 정보기관(情報機關) 등에 제공(提供), 활용(活用)하여 도서관(圖書館) 직원(職員), 정보전문가(情報專門家), 일반이용자(一般利用者)들에게 정보검색(情報檢索) 훈련용(訓練用)으로 쓰일 수 있게 되었다. 한 개 디스크를 액세스하기 위해 한 대의 디스크드라이브와 한 대의 컴퓨터를 필요(必要)로 했던 것에서 탈피하여 현재는 한 대의 드라이브로 여러 장의 CD-ROM을 검색(檢索)할 수 있고, 동시에 여러 명의 이용자가 다양한 정보(情報)를 액세스할 우 있는 이상적인 시스템인 CD-ROM LAN이 가능하게 되었다. 따라서, 본고(本稿)에서는 CO-ROM의 기능(機能)과 종류(種類), 특성(特性), 시스템구성(構成)과 데이터블록, 제작과정(製作過程)과 표준화(標準化) 그리고 CD-ROM LAN에 대해 살펴보았다.

  • PDF

유사 음소 모델 스키마 지원을 위한 결정 트리 (Decision Tree for Likely phoneme model schema support)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.367-372
    • /
    • 2013
  • 어휘 인식 시스템에서는 훈련 중에 적용되지 않는 음소에 대한 문제점으로 인해 시스템에 저장된 모델을 재생성해야 하고 그에 따른 시간과 추가 비용이 초래된다. 본 논문에서는 결정 트리 군집화 방법을 사용하여 유사 음소 모델을 관리하는 방법을 제안하였다. 제안한 방법은 생성된 모델들로부터 결정트리 군집화 방법을 적용하여 군집화된 모델에서 음소 단위로 확률 모델을 탐색할 수 있는 시스템을 모델링하여 모델의 재생성 과정을 줄이고 강인하고 정확한 음향 모델을 제공한다. 또한, 제안된 시스템의 사용으로 시스템에서 기존에 생성되어진 음향 모델에 추가적으로 유사 음소 모델을 생성하여 제공하므로 음성 인식에 강인한 음향 모델을 구성한다. 본 연구에서 제안된 방법으로 실내 환경에 대하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 실내 환경의 어휘 종속 실험에서는 98.3%의 인식 성능을 보였고, 어휘 독립 실험에서 98.4%의 인식 성능을 보였다.

베이지안 분류를 이용한 립 리딩 시스템 (Lip-reading System based on Bayesian Classifier)

  • 김성우;차경애;박세현
    • 한국산업정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.9-16
    • /
    • 2020
  • 음성 정보를 배제하고 영상 정보만을 이용한 발음 인식 시스템은 다양한 맞춤형 서비스에 적용될 수 있다. 본 논문에서는 베이지안 분류기를 기반으로 입술 모양을 인식하여 한글 모음을 구분하는 시스템을 개발한다. 얼굴 이미지의 입술 모양에서 특징 벡터를 추출하고 설계된 기계 학습모델을 적용하여 실험한 결과 'ㅏ' 발음의 경우 94%의 인식률을 보였으며, 평균 인식률은 약 84%를 나타내었다. 또한 비교군으로 실험한 CNN 환경에서의 인식률보다 높은 결과를 보였다. 이를 통해서 입술 영역의 랜드 마크로 설계된 특징 값을 사용하는 베이지안 분류 기법이 적은 수의 훈련 데이터에서 보다 효율적일 수 있음을 알 수 있다. 따라서 모바일 디바이스와 같은 제한적 하드웨어에서 응용 가능한 어플리케이션 개발에 활용할 수 있다.

화자 겹침을 고려한 화자 전환 검출 시스템 제안 (Proposal of speaker change detection system considering speaker overlap)

  • 박지수;윤영선;차신;박전규
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.466-472
    • /
    • 2021
  • 화자 전환 검출은 대화 중에 발성 화자가 다른 사람으로 바뀌는 시점을 검출하는 것을 의미한다. 이 과정에서 화자 중복, 화자 정보 표기의 부정확성, 데이터 불균형 등으로 화자가 바뀌는 순간을 검출하는 데 어려움이 발생한다. 본 논문에서는 이러한 문제를 해결하기 위해 음성 인식에 널리 사용되는 TIMIT 데이터를 가공하여 충분한 양의 훈련 데이터를 얻었으며, 화자가 겹치는지를 파악한 후에 화자 전환 여부를 판단하였다. 본 논문에서는 화자 겹침을 고려한 화자 전환 검출 시스템을 구축하기 위하여 다양한 접근법을 사용하여 성능을 평가하고 검증했다. 그 결과 화자 겹칩 영역을 제거하기 위해 X-Vector 구조와 유사한 형태의 검출 시스템과 화자 전환 검출 시스템을 모델링하기 위한 Bi-LSTM 모델을 제안하였다. 실험 결과 기준 시스템보다 상대적으로 각각 4.6 %, 13.8 % 성능 향상을 확인하였다. 또한, 실험 결과를 기반으로 텍스트 정보와 화자 정보 등을 고려한다면 좀 더 강인한 화자 전환 검출 시스템을 구축할 수 있을 것으로 판단한다.

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.

A군 연구균 감염이후 Antistreptolysin-O 혈중 농도 증가가 뚜렛씨 장애의 증상악화에 미치는 영향에 대한 임상 연구 (TIC SYMPTOM EXACERBATION ASSOCIATED WITH STREPTOCOCCAL INFECTION IN TOURETTE'S DISORDER)

  • 정유숙
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제9권2호
    • /
    • pp.209-217
    • /
    • 1998
  • 본 연구는 최근 증상이 악화된 뚜렛씨 증후군 환자에서 A군연구균(GABHS) 감염을 확인하기 위하여 antistreptolysin-O의 혈중 농도를 측정 하고 틱의 증상을 평가하여 항체의 혈중농도의 증가가 틱 증상 정도에 영향을 미치는지를 분석하여 악화 요인 중의 하나로 A군연구균(GABHS)의 감염을 검증하고자 하였다. 전체 대상군은 14명의 아동들로 특징은 다음과 같다. (1) 연령은 $6{\sim}15$세로 학동기와 청소년전기 아동으로 구성된다. (2) DSM-Ⅳ에 의해 1년이상 지속된 운동틱과 음성틱이 있는 뚜렛씨 증후군을 진단하였다. 단순틱 장애와 만성 운동 또는 만성 음성틱 장애는 배제하였다. (3) 정신병적인 상태나 경련이 있거나 기왕력이 있었던 경우 대상군에서 제외 하였다. 대상 아동들은 뚜렛씨 장애를 내원시에 처음 진단 받았거나 이전에 진단을 받고 약물 투여 중에 증상의 악화가 있었던 아동, 이전에 약물을 사용하였으나 호전 되어 약물 중단이후 최근 증상의 악화가 나타난 아동들었다. 예일 틱증상 평가척도(Yale Global Tic Severity Scale)를 사용하여 틱증상의 정도와 antistreptolysin-O 항체 수치(ASO titer)를 측정하였는데 항체수치가 상승한군(6명), 정상항체군(8명)의 두군으로 나누어 두군에서의 인구학적, 임상학적 특성, 틱증상의 정도, 공존장애율 등을 비교하였다. 항체수치가 상승한 군에서 정상항체군에 비해 남아의 비율이 더 높았으며 예일 틱증상 평가척도에서 장해도와 틱증상의 총점에서 더 높은 점수를 나타내 항체상승군에서 틱증상의 정도가 더욱 심함을 알 수 있었다. 통계적으로 유의하지는 않았지만 공존장애율도 항체상승군에서 더 높은 경향을 보이고 있었다. 이는 뚜렛씨 장애의 일부아형에서는 기존에 알려진 요인이외에도 증상의 발병과 악화에 A군연구균(GABHS)의 감염이 중요한 역할을 할 가능성이 있음을 시사해 준다고 할 수 있겠다.등 다른질환군이 동반된 군에서는 사회기술 평가 척도의 사회기술 항목에서 유의한 증가(p<.05)를 보였다. 그러나 각 집단간의 치료효과에 대해서는 세 집단사이에서 유의한 차이는 보이지 않았다. 위 결과로 보아 주의력결핍 과잉운동장애 아동에서 사회기술훈련 치료프로그램은 통계적으로 유의미할 만한 사회기술 향상은 보이지 않았다. 반면 품행장애가 동반된 군에서 공격적 행동의 감소를 가져오고 인지능력이 떨어진 군에서 사회기술 호전을 보이는 등 아동의 특성 및 동반증상에 따라 사회기술의 호전 및 증상의 변화에 도움이 됨을 확인할 수 있었다. 문제이며, 이것을 예방하고 치료하기 위해서는 우리 의사들의 적극적 관심이 필요하다고 생각하였다.)에서 자기파괴적인 행동이 있었으며 46명(29.3%)에서 충동성이 동반되었고 35명(22.3%)에서 유뇨증이 관찰되었다. 환자의 발병연령과 내원시 연령, 병의 이병 기간, 강박증상의 정도 사이에 통계적으로 유의한 양성의 상관관계가 있었고 과잉행동성과 음성의 상관관계가 있었다. 과잉행동성과 충동성, 강박성, 야뇨증, 자기파괴적 행동사이에 통계적으로 유의한 양성의 상관관계가 있었다. 환자의 강박증상의 정도와 과잉행동성, 수면장애, 자기파괴적 행동 사이에 통계적으로 유의한 양성의 상관관계가 있었다. 본 연구 결과 저자들은 외래에 내원한 뚜렛장애 환자의 임상적 특성이나 동반된 행동상 문제들이 이전 연구와 크게 상이하지 않음을 확인할 수 있었으며 발병연령이 어릴수록 과잉행동성이 심했으며 발병연령이 늦을수록 강박성이 심했다. 과잉행동성과 충동성, 강박성, 야뇨증, 자기파괴적 행동 등은 상호 높은 관련성이 있었다.}$과잉운동장애환아(過剩運動障碍患兒)에서의 충동성(衝動性)은 이 장애의 중심증상이 아니거나, 이들 약물투여에 의해 호전되지 않거나, 호전의 측정에 문제가 있을 수도 있겠다. 마지막으로 주의력결핍(注意力缺乏)${\cdot}$과잉운동장애(過剩運動障碍)에서 과잉행동(過剩行動)

  • PDF

측두하악관절 주변인대 질환의 초음파영상 (Ultrasounds Image on the Disorders of the Ligaments Surrounding Temporomandibular Joints)

  • 홍수민;임영관;김병국
    • Journal of Oral Medicine and Pain
    • /
    • 제33권4호
    • /
    • pp.387-394
    • /
    • 2008
  • 목적 : 측두하악장애 환자에서 고가의 자기공명영상 진단을 대신하여 상대적으로 경제적인 진단방법으로 고해상도 초음파 영상을 도입하는데 있어서 그 정확성과 유용성을 확인하고자 하였다. 방법 : 측두하악장애의 임상적 증상 중 과두걸림, crepitation과 함께 통증을 호소하는 20명의 환자를 대상으로 하였다. 고해상도 초음파 촬영을 시행하였고, 고해상도를 가진 초음파촬영시의 결과를 비교하기 위하여, 통상적인 방사선 사진인 측두하악관절의 횡두개 촬영을 Accurad X-200으로, 그리고 Dental CT를 촬영하였으며, 이를 임상소견과 더불어 비교항목으로 선택하였다. 고해상도 초음파의 진단학적 가지 평가를 위하여 통계학적으로 감수성, 특이성, 양성예상치, 음성예상치 및 정확도를 계산하였다. 결과 : 고해상도의 초음파 영상은 골관절염성 변화를 진단하는데 67.5%의 정확도를 보였으며, 관절원판의 위치변화를 진단하는데 92.5%를 보였으나, 관절 주변조직인 관절낭, 관절원판 후조직 그리고 주변 인대의 이상을 측정하는데 있어서 정확도가 55%를 나타내었다. 결론 : 향후 초음파 영상을 얻기 위한 적절한 기기의 발전과 고주파수의 transducer 등이 개발되고 시술자의 훈련과 경험이 쌓이게 되면 매우 우수한 그리고 비침습적이고 접근이 용이하며 경제적인 진단학적인 검사방법으로서 일반적인 도입이 가능할 것으로 사료된다.

한국과 미국 정치인 대중연설 음성의 스펙트럼 비교 연구 (A Comparative Study on the Public Speech Spectrum between ROK and USA Politicians)

  • 정은이;이상호
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권3호
    • /
    • pp.143-155
    • /
    • 2016
  • 본 연구는 정치인의 메시지 전달에 있어 목소리의 중요성에 주목하였다. 목소리의 여러 요소는 메시지 전달에 있어 다양한 양상을 보이며, 메시지를 듣는 수용자의 메시지 호응도, 이해도 등에 영향을 미친다. 그런 만큼 다양한 메시지 전달과정에서의 목소리에 대한 연구, 분석은 의미가 있는 시도라 할 수 있다. 이에 본 연구자들은 정치인의 목소리에 관심을 갖고 연구하였는데, 대국민연설 등의 메시지 전달이 일상인 정치인에게 있어 목소리가 매우 중요하다고 판단하였기 때문이다. 그리하여 한 나라를 대표하는 정치인들의 목소리 현주소가 어떠한지를 살펴보고자 하였다. 이에 본 연구자들은 한미 양국을 대표하는 정치인들을 선정하여 대표적인 대국민연설을 선정하고, 연설시 나타난 목소리를 분석, 비교하여 함의를 도출하고자 하였다. 한국과 미국 정치인 남녀 각각 4명씩을 선정하여 총 8명의 목소리를 분석함으로써 그 특징을 알아보고, 보다 확실한 전달력을 보이는 목소리에 대한 지침을 제시하고자 하였다. 목소리의 음높이, 발음의 정확성, 공명, 억양변화 등의 목소리 특징으로 실험대상자의 목소리를 분석하였는데, 연구결과 한국 정치인들이 미국정치인들에 비해 다소 목소리에 대한 활용이 떨어지는 것으로 나타났다. 특히 메시지 전달에 있어 상당한 영향력을 발휘하는 발음의 정확성에 있어서 부족한 면모를 여실히 드러냈다. 이는 메시지 전달의 정확성이 떨어짐을 유추할 수 있는 대목이며, 이에 발음의 정확성을 향상시키기 위한 한국정치인들의 목소리 훈련이 진행되기를 바란다.

가변어휘 단어 인식에서의 미등록어 거절 알고리즘 성능 비교 (Performance Comparison of Out-Of-Vocabulary Word Rejection Algorithms in Variable Vocabulary Word Recognition)

  • 김기태;문광식;김회린;이영직;정재호
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.27-34
    • /
    • 2001
  • 발화 검증이란 등록된 단어 목록 이외의 단어가 입력되었을 때, 미등록된 단어는 인식할 수 없는 단어임을 알려주는 기능으로써 사용자에게 친숙한 음성 인식 시스템을 설계하는데 중요한 기술이다. 본 논문에서는 가변어휘 단어 인식기에서 최소 검증 오류를 나타낼 수 있는 발화 검증 시스템의 알고리즘을 제안한다. 우선, 한국전자통신연구원의 PBW(Phonetically Balanced Words) 445DB를 이용하여 가변어휘 단어 인식에서의 미등록어 거절 성능을 향상시키는 효과적인 발화 검증 방법을 제안하였다. 구체적으로 특별한 훈련 과정이 없이도 유사 음소 집합을 많이 포함시킨 반음소 모델을 제안하여 최소 검증 오류를 지니도록 하였다. 또한, 음소 단위의 null hypothesis와 alternate hypothesis의 비를 이용한 음소 단위의 신뢰도는 null hypothesis로 정규화해서 강인한 발화 검증 성능을 보여 주었으며, 음소 단위의 신뢰도를 이용한 단어 단위의 신뢰도는 등록어와 미등록어 사이의 분별력을 잘 표현해 주었다. 이와 같이 새로이 제안된 반음소 모델과 발화 검증 방법을 사용했을 때, CA (Correctly Accept for Keyword: 등록어를 제대로 인정한 경우)는 약 89%, CR (Correctly Reject for OOV (Out-of-Vocabulary): 미등록어에 대해 거절한 경우)은 약 90%로써, 기존 필터 모델을 이용한 방법보다 미등록어 거절 성능이 ERR (Error Reduction Rate) 측면에서 약 15-21% 향상됨을 알 수 있었다.

  • PDF