• 제목/요약/키워드: voice data

검색결과 1,256건 처리시간 0.034초

적갑상선 전절제술 환자의 방사성 동위원소치료 전.후 음성의 변화에 대한 연구 (Voice Analysis before and after Radioactive Iodine Ablation in Patients with Total Thyroidectomy)

  • 홍기환;서은지;이현두;윤연섭;임석태
    • 대한후두음성언어의학회지
    • /
    • 제24권1호
    • /
    • pp.33-40
    • /
    • 2013
  • Background and Objectives:This study is to objectively compare and analyze the acoustic changes in the patients with total thyroidectomy before and after RI therapy. Subjects and Methods:For this study, a total of 50 patients with total thyroidectomy were participated as subjects. Voice samples were obtained at the time of post-operation (Post-OP), before high-dose radioactive iodine therapy (Pre-RIT), and after high-dose radioactive iodine therapy (Post-RIT). Acoustic analysis, the maximum phonation time and K-VHI (Korea-Voice handicap index) were used for subjective evaluation. Results:According to the comparison analysis of the three periods, mFo (Hz) was significantly reduced in all of the vowels /a/ and /i/ as the hormone was discontinued. This can be related to the reduction in vocal range. As thyroid hormone was discontinued, Shim (%) and APQ (%) values, which are the parameters related to the degree of aggressiveness, showed a significant increase in the middle vowel /a/. As thyroid hormone was discontinued, emotional index was significantly decreased in VHI (voice handicap index). Conclusion:These results can be assumed that thyroid hormone suspension is related to the increased changes in the vocal intensity, the increase in noise and the reduction in vocal range. Emotionally, these data can be assumed that the responsive factors of one's own voice disorders were significantly decreased in the patients with vocal handicap.

  • PDF

음성인식 기능을 이용한 시각장애인용 키오스크 (Kiosk for the Visually Impaired using Voice Recognition)

  • 김대영;이아현;이건행;김세현;이붕주
    • 한국전자통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.873-882
    • /
    • 2022
  • 본 논문에서는 현대사회에서 많이 사용되는 키오스크가 시각장애인들이 이용하는 것에 있어서 불편함을 보완해야 한다고 생각하여 편리성을 위한 음성인식 시스템 키오스크를 연구하였다. 초음파센서, 적외선센서를 활용하여 80cm-40cm 범위 안에 시각장애인을 인식하고, MP3 모듈을 통한 키오스크 소개 및 가까이 오도록 유도를 하고 40cm 이내의 시각장애인을 인식하면 MP3모듈을 통해 상품 설명 및 주문을 유도한다. 녹음 기반 데이터 음성인식 시스템과 서보모터를 통해 원하는 물건이 출력되는 키오스크를 연구하였다. 제작된 음성인식 키오스크에 대한 적외선, 초음파, 음성인식, 충격감지센서의 동작실험 및 최적화 실험을 통해 시각장애인의 편리성을 위한 키오스크를 제작하였고, 보안성을 강화하기 위해 충격감지센서, 비상벨을 활용했기 때문에 방범적인 측면에서도 기능을 추가한 시스템을 연구하였다.

다수 화자 한국어 음성 변환 실험 (Many-to-many voice conversion experiments using a Korean speech corpus)

  • 육동석;서형진;고봉구;유인철
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.351-358
    • /
    • 2022
  • 심층 생성 모델의 일종인 Generative Adversarial Network(GAN)과 Variational AutoEncoder(VAE)는 비병렬 학습 데이터를 사용한 음성 변환에 새로운 방법론을 제시하고 있다. 특히, Conditional Cycle-Consistent Generative Adversarial Network(CC-GAN)과 Cycle-Consistent Variational AutoEncoder(CycleVAE)는 다수 화자 사이의 음성 변환에 우수한 성능을 보이고 있다. 그러나, CC-GAN과 CycleVAE는 비교적 적은 수의 화자를 대상으로 연구가 진행되어왔다. 본 논문에서는 100 명의 한국어 화자 데이터를 사용하여 CC-GAN과 CycleVAE의 음성 변환 성능과 확장 가능성을 실험적으로 분석하였다. 실험 결과 소규모 화자의 경우 CC-GAN이 Mel-Cepstral Distortion(MCD) 기준으로 4.5 % 우수한 성능을 보이지만 대규모 화자의 경우 CycleVAE가 제한된 학습 시간 안에 12.7 % 우수한 성능을 보였다.

DSP를 이용한 음성인식기 구현 (Implementation of Speech Recognizer using DSP(Digital Signal Processor))

  • 임창환;문철홍;전경남
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.187-190
    • /
    • 2000
  • In this paper, implementation of speech Recognizer system, Separated from Personal computer. By using DSP, this intends to extend the voice recognizing, limited into PC because of amount of data and calculations. For this performance The thesis uses the real time End point detector and organizes no additional device between human and the system, characteristic vector are that detects End point and voice from absolute energy and ZCR, that uses 12 difference Cepstrum from LPC, that uses the method to compensate the process of pattern separating and pre-calculated standard pattern limitation.

  • PDF

GPRS에서 채널 de-allocation 이용시 자원관리 정책 평가 비교 (Performance and comparison resource management policies with channel De-Allocation in GPRS Network)

  • 송윤경;박동선
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 I
    • /
    • pp.61-64
    • /
    • 2003
  • GPRS is designed for transmitting packet data and supposed to take its radio resource form the pool of channels unused by GSM voice services. In this paper, The GPRS and GSM circuit switched services share the same radio resource. Whenever a channel is not used by circuit switched services, it may be utilized by GPRS. In this paper, the main aim is performance and comparison resource management policies with channel de-allocation in GPRS network. Three resource management policies is voice priority, R-reservation, dynamic reservation.

  • PDF

Pathological Vibratory patterns of the Vocal Folds Observed by the High Speed Digital Imaging System

  • Niimi, Seiji
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1998년도 제10회 학술대회 심포지움
    • /
    • pp.208-209
    • /
    • 1998
  • It is generally known that many cases of pathological rough voice are characterized not by simple random perturbations but by quasi-periodic perturbations in the speech wave. However, there are few studies on the characteristics of perturbations in vocal fold vibrations associated with this type of voice. We have been conducting studies of pathological vocal fold vibration using a high-speed digital image recording system developed by our institute, Compared to the ordinary high-speed-motion picture system, the present system is compact and simple to operate and thus, it suited for pathological data collection. (omitted)

  • PDF

공중교환전화망 (PSTN)에 의한 데이터 전송에 있어서의 군지정 #곡에 관한 연구 (Study on Group Delay Distortion in Data transmission by Means of Public Switching Telephone Network (PSTN))

  • 조규심;박규태
    • 대한전자공학회논문지
    • /
    • 제21권4호
    • /
    • pp.24-30
    • /
    • 1984
  • 군지연왜곡(상위왜곡)은 음성전송의 입장에서는 그다지 문제가 되지 않는 특성이다. 그러나 기존의 공중교환전화망(음성대역전송)을 통하여 데이터, FAX 등의 파형전송을 하는 경우에는 데이터 신호를 왜곡시키는 최대의 요인이 되므로 이를 철저하게 검토하여야 한다. 본고는 기존의 공중교환전화망을 데이터전송에 개방하기 위하여 군지연왜곡에 관한 해석을 하고, 실험 및 측정결과를 기술하고 또 이 왜곡의 개선에 대해서도 언급한 것이다.

  • PDF

Kernel PCA를 이용한 GMM 기반의 음성변환 (GMM Based Voice Conversion Using Kernel PCA)

  • 한준희;배재현;오영환
    • 대한음성학회지:말소리
    • /
    • 제67호
    • /
    • pp.167-180
    • /
    • 2008
  • This paper describes a novel spectral envelope conversion method based on Gaussian mixture model (GMM). The core of this paper is rearranging source feature vectors in input space to the transformed feature vectors in feature space for the better modeling of GMM of source and target features. The quality of statistical modeling is dependent on the distribution and the dimension of data. The proposed method transforms both of the distribution and dimension of data and gives us the chance to model the same data with different configuration. Because the converted feature vectors should be on the input space, only source feature vectors are rearranged in the feature space and target feature vectors remain unchanged for the joint pdf of source and target features using KPCA. The experimental result shows that the proposed method outperforms the conventional GMM-based conversion method in various training environment.

  • PDF

인터넷전화 이용자 체감품질 측정을 위한 측정데이터 간의 시간동기화 (Time Synchronization of the Monitoring Data for the VoIP User Assessment of Voice Quality Measurement)

  • 권태훈;황혜정;이석기;송한춘;원승영
    • 한국콘텐츠학회논문지
    • /
    • 제5권4호
    • /
    • pp.227-236
    • /
    • 2005
  • 인터넷전화 이용자 체감품질을 측정함에 있어 측정시스템 간의 시간동기화가 중요하다. 현재 시스템의 시간동기를 하는 방법에는 NTP 또는 GPS를 이용하여 시간동기화를 하고 있으나 NTP 서버와 시스템간의 거리에 따른 시간적 오차, GPS로부터 수신된 데이터를 처리하는 과정에서의 지연시간, 시스템 클럭의 특성에 따라 발생하는 오차와 같은 문제로 인해 측정시스템 간의 시간동기가 어려운 실정이다. 본 논문에서는 측정데이터의 시간동기를 위해 측정시스템 간의 시간적 오차와 클럭 특성에 의해 발생되는 오차를 보정하여 신뢰성 있는 품질측정 결과를 생성하는 시간동기화 방식을 제안하고 구현하였다.

  • PDF

VoDSL 서비스에 최적화된 ATM SAR 프로세서 (The ATM SAR Processor Optimized for VoDSL Service)

  • 손윤식;정정화
    • 대한전자공학회논문지SD
    • /
    • 제40권10호
    • /
    • pp.9-16
    • /
    • 2003
  • 본 논문은 VoDSL(Voice over DSL) 가입자용 단말기에 적합한 ATM(Asynchronous Transfer Mode) 프로세서를 제안한다. 제안된 ATM 프로세서는 ATM 단, ATM 적응단의 프로토콜을 처리하는 블록. ATS 스케줄러 등으로 구성되며, ATM 네트워크상에 음성과 데이터 서비스를 위한 4개의 VCC (Virtual Channel Connection)을 지원한다. ATS(Adaptive Time Slot) 스케줄러는 음성 트래픽의 QoS (Quality of Service)를 보장하며 다중 AAL2 패킷을 지원하도록 설계하였다. 제안된 ATM 프로세서는 하이닉스 반도체의 0.35마이크론 공정에서 제작되었으며, 최대 52Mbps의 속도를 지원한다. 본 ATM 프로세서가 탑재된 VoDSL 가입자 장비인 LAD(Integrate Access Device)를 실제 제작하여 테스트용 네트워크 상에서 실험한 통하여 제안된 ATM 프로세서의 하드웨어 구조가 VoDSL 서비스의 대부분의 응용 분야에 성공적으로 적용 될 수 있음을 확인한다.