• 제목/요약/키워드: TTS

검색결과 306건 처리시간 0.026초

고품질 내장형 음성합성 시스템을 위한 음성합성 DB구현 (The implementation of database for high quality Embedded Text-to-speech system)

  • 권오일
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.103-110
    • /
    • 2005
  • 음성 데이터베이스는 TTS 시스템에서 가장 중요한 요소 중의 하나이다. 특히, 내장형 TTS 시스템에서는 서버형 TTS 시스템에서보다 좀 더 작은 데이터베이스를 필요로 한다. 이러한 이유로, 음성합성 데이터의 압축과 통계적 축소과정의 비중은 내장형 TTS 시스템에서 아주 중요한 항목이라고 말할 수 있다. 그러나 이러한 압축과 통계적 축소과정은 합성음질의 저하를 유발시킨다. 본 논문에서는 고품질 내장형 TTS 시스템에서의 데이터 구축방법을 제안하며, MOS 테스트를 통한 합성음질을 검증한다.

안드로이드 OS 기반 한국어 TTS 서비스의 설계 및 구현 (Implementation of Korean TTS Service on Android OS)

  • 김태권;김봉완;최대림;이용주
    • 한국콘텐츠학회논문지
    • /
    • 제12권1호
    • /
    • pp.9-16
    • /
    • 2012
  • 국내에서 출시된 안드로이드 기반의 스마트폰은 한국어 TTS 엔진이 내장되어 있지 않고, 구글에서도 공식적인 한국어 TTS 기술 개발을 발표하지 않고 있는 상황이다. 따라서 안드로이드 스마트폰을 사용하는 어플리케이션 개발자 및 사용자들의 불편이 갈수록 심해져 가고 있다. 본 논문은 안드로이드 기반의 스마트폰에서 서비스할 수 있는 TTS시스템의 설계 및 구현에 대해 기술하였다. 신속 명료한 TTS를 위해 안드로이드 NDK를 이용하여 텍스트 전처리와 합성음 생성 라이브러리를 구현하였다. 또한, 자바의 스레드 기법과 스트림을 적용한 AudioTrack 클래스 객체를 사용하여 TTS 응답시간을 최소화 하였다. 구현된 한국어 TTS 서비스를 테스트하기 위해 수신된 문자메시지를 읽어주는 어플리케이션을 설계 및 개발하였다. 평가 결과, 임의의 문장에 대해 자연스러운 합성음을 생성하였으며, 실시간 청취가 가능하였다. 또한, 어플리케이션 개발자들은 구현된 한국어 TTS 서비스를 이용하여 음성을 통한 정보 전달을 손쉽게 적용할 수 있다. 본 논문에서 구현한 한국어 TTS 서비스는 기존 제한적 음성합성 방식의 어플리케이션의 단점을 개선하였으며, 음성을 통한 정보전달 어플리케이션 개발자 및 사용자들에게 사용성과 편의성을 제공할 수 있다.

d-vector를 이용한 한국어 다화자 TTS 시스템 (A Korean Multi-speaker Text-to-Speech System Using d-vector)

  • 김광현;권철홍
    • 문화기술의 융합
    • /
    • 제8권3호
    • /
    • pp.469-475
    • /
    • 2022
  • 딥러닝 기반 1인 화자 TTS 시스템의 모델을 학습하기 위해서 수십 시간 분량의 음성 DB와 많은 학습 시간이 요구된다. 이것은 다화자 또는 개인화 TTS 모델을 학습시키기 위해서는 시간과 비용 측면에서 비효율적 방법이다. 음색 복제 방법은 새로운 화자의 TTS 모델을 생성하기 위하여 화자 인코더 모델을 이용하는 방식이다. 학습된 화자 인코더 모델을 통해 학습에 사용되지 않은 새로운 화자의 적은 음성 파일로부터 이 화자의 음색을 대표하는 화자 임베딩 벡터를 만든다. 본 논문에서는 음색 복제 방식을 적용한 다화자 TTS 시스템을 제안한다. 제안한 TTS 시스템은 화자 인코더, synthesizer와 보코더로 구성되어 있는데, 화자 인코더는 화자인식 분야에서 사용하는 d-vector 기법을 적용한다. 학습된 화자 인코더에서 도출한 d-vector를 synthesizer에 입력으로 추가하여 새로운 화자의 음색을 표현한다. MOS와 음색 유사도 청취 방법으로 도출한 실험 결과로부터 제안한 TTS 시스템의 성능이 우수함을 알 수 있다.

동반이환된 특발성 수근관증후군과 족근관증후군의 전기생리학적 특징 (Electrophysiologic Characteristics of Combined Idiopathic Carpal Tunnel Syndrome and Tarsal Tunnel Syndrome)

  • 김성혁;양지원;성영희;박기형;박현미;신동진;이영배
    • Annals of Clinical Neurophysiology
    • /
    • 제13권1호
    • /
    • pp.31-37
    • /
    • 2011
  • Background: Carpal tunnel syndrome (CTS) and tarsal tunnel syndrome (TTS) are thought to share a similar pathophysiology, compression of the median and plantar nerve by the carpal tunnel and flexor retinaculum. A few reports introduced the relationship between idiopathic CTS and TTS without definite evidence of coexistence. The current study was designed to analyze the electrophysiologic characteristics of combined idiopathic CTS and TTS by comparing with each idiopathic CTS or TTS. Methods: We retrospectively collected patients with combined idiopathic CTS and TTS (CTS-TTS group) from June 2001 to February 2009. Patients with each idiopathic CTS or TTS were collected as controls. Electrophysiologic data of median and plantar nerves were compared between CTS-TTS group and controls. Results: CTS-TTS group was composed of 31 patients. Control group of each CTS or TTS were 50 CTS and 49 TTS patients. In comparison of median nerve conduction study between CTS-TTS group and CTS control group, decreased compound muscle action potential amplitude (p<0.001), decreased median sensory nerve action potential amplitude (p<0.001) and sensory nerve conduction velocity at finger stimulation (p=0.013) were prominent in CTS-TTS group. Decreased medial plantar sensory nerve action potential amplitude (p=0.034) was indicated when CTS-TTS groups and TTS control group were compared. Conclusions: If the electrophysiology study of patients with CTS or TTS was suggestive of severe degree of nerve injury, concerns about the possibility of combined CTS and TTS would be helpful.

교육용 한국어 TTS 플랫폼 개발 (A Korean TTS System for Educational Purpose)

  • 이정철;이상호
    • 대한음성학회지:말소리
    • /
    • 제50호
    • /
    • pp.41-50
    • /
    • 2004
  • Recently, there has been considerable progress in the natural language processing and digital signal processing components and this progress has led to the improved synthetic speech qualify of many commercial TTS systems. But there still remain many obstacles to overcome for the practical application of TTS. To resolve the problems, the cooperative research among the related areas is highly required and a common Korean TTS platform is essential to promote these activities. This platform offers a general framework for building Korean speech synthesis systems and a full C/C++ source for modules supports to implement and test his own algorithm. In this paper we described the aspect of a Korean TTS platform to be developed and a developing plan.

  • PDF

TTS DB 압축을 위한 광대역 파형보간 부호기 구현 (Implementation of Wideband Waveform Interpolation Coder for TTS DB Compression)

  • 양희식;한민수
    • 대한음성학회지:말소리
    • /
    • 제55권
    • /
    • pp.143-158
    • /
    • 2005
  • The adequate compression algorithm is essential to achieve high quality embedded TTS system. in this paper, we Propose waveform interpolation coder for TTS corpus compression after many speech coder investigation. Unlike speech coders in communication system, compression rate and anality are more important factors in TTS DB compression than other performance criteria. Thus we select waveform interpolation algorithm because it provides good speech quality under high compression rate at the cost of complexity. The implemented coder has bit rate 6kbps with quality degradation 0.47. The performance indicates that the waveform interpolation is adequate for TTS DB compression with some further study.

  • PDF

데이터베이스 분산을 통한 소용량 문자-음성 합성 단말기 구현 (Implementation of text to speech terminal system by distributed database)

  • 김영길;박창현;양윤기
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2431-2434
    • /
    • 2003
  • In this research, our goal is to realize Korean Distribute TTS system with server/client function in wireless network. The speech databases and some routines of TTS system is stuck with the server which has strong functions and we made Korean speech databases and accomplished research about DB which is suitable for distributed TTS. We designed a terminal has the minimum setting which operate this TTS and designed proper protocol so we will check action of Distributed TTS.

  • PDF

특발성 발목터널 증후군에서 내측 발바닥 신경의 전기 생리학적 검사 (Electrophysiological Study of Medial Plantar Nerve in Idiopathic Tarsal Tunnel Syndrome)

  • 안재영;김병준
    • Annals of Clinical Neurophysiology
    • /
    • 제8권2호
    • /
    • pp.146-151
    • /
    • 2006
  • Background: Tarsal tunnel syndrome (TTS) is an entrapment neuropathy of the tibial nerve within fibrous tunnel on the medial side of the ankle. The most common cause of TTS is idiopathic. This is a retrospective study to define the electrophysiological characteristics of idiopathic TTS. Methods: We reviewed the medical and electrophysiological records of consecutive patients with foot sensory symptoms referred to electromyography laboratory. Inclusion of patients was based on clinical findings suggestive of TTS. Among them, patients with any other possible causes of sensory symptoms on the foot were excluded. Control data were obtained from 19 age-matched people with no sensory symptoms or signs. Routine motor and sensory nerve conduction study (NCS) including medial plantar nerve (MPN) using surface electrodes were performed. Result: Twenty one patients (13 women, 8 men, 9 unilateral, 12 bilateral) were enrolled to have idiopathic TTS (total 31 feet). Tinel's sign was positive in 16 feet (51.6%) of TTS and four feet (10.5%) in control group. The statistically significant electrophysiological parameter was difference of sensory conduction velocity (SCV) between sural nerve and MPN. Amplitude of sensory nerve action potential and SCV of MPN were not different significantly between idiopathic TTS feet and controls. Conclusion: Bilateral development in idiopathic TTS was more common. Tinel's sign and difference of SCV between sural nerve and MPN may be helpful for the diagnosis of idiopathic TTS.

  • PDF

스크린리더 사용자를 위한 플러그인 가상악기 TTS-1의 접근성 평가 연구 (A Study of the Accessibility Evaluation of TTS-1 for the Screen Reader User)

  • 석용환
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.513-522
    • /
    • 2022
  • 본 연구는 Cakewalk by Bandlab(과거의 Sonar)의 대표적인 가상악기인 TTS-1의 접근성을 평가하고 개선방안을 제안하기 위한 목적으로 수행되었다. 본 연구는 소프트웨어 개발자의 관점에서 스크린리더 사용자가 TTS-1을사용하여 NCS의 [가상악기 에디팅하기] 능력단위 요소를 수행하기 위한 접근성이 평가되었고, 기본 접근성이 없는 기능들은 센스리더와 MIDI 기능을 활용하여 확장된 접근 방법을 모색하였다. 본 연구결과, 스크린리더 사용자가 TTS-1을 사용하여 정안인과 동등한 수준의 작업은 가능하나, 센스리더와 MIDI를 활용한 별도의 접근방법을 사용해야만 하는 것으로 나타났다. 이 결과를 통해, 스크린리더 사용자가 보다 효율적으로 작업할 수 있는 개선방안이 제안되었다.

국내 LNG TTS 벙커링 시 안전구역 기준에 관한 연구 (A Study on the Standard for the Safety Zone in the Domestic LNG TTS Bunkering)

  • 박성인;노재승;박재희;박경민;신동규
    • 대한조선학회논문집
    • /
    • 제59권5호
    • /
    • pp.323-329
    • /
    • 2022
  • This paper suggests an example guideline of a safety zone layout for the domestic LNG Truck-To-Ship (TTS) bunkering. The safety zone is one of the controlled area in LNG bunkering and its layout is required as a fundamental safety barrier. While the international standard provides a layout methodology of the safety zone, its detail application is not user-friendly and only possible with a level of the process engineering. In the domestic case, the enforcement regulations are applied for LNG bunkering but the safety zone is not properly defined for TTS operation. Considerations are made for the intuitive approach of the safety zone layout and an example guideline is suggested for application in the domestic TTS bunkering. A technical background of the guideline is described and its applicability is demonstrated with regard to the characteristics of TTS bunkering. The findings of the study are summarized in association with a practical layout of the safety zone, contributing to the safety culture in the domestic LNG bunkering.