• 제목/요약/키워드: Cohort speakers

검색결과 8건 처리시간 0.021초

정질적 기준을 이용한 다층신경망 기반 화자증명 시스템의 등록속도 단축방법 (Improving Speaker Enrolling Speed for Speaker Verification Systems Based on Multilayer Perceptrons by Using a Qualitative Background Speaker Selection)

  • 이태승;황병원
    • 한국음향학회지
    • /
    • 제22권5호
    • /
    • pp.360-366
    • /
    • 2003
  • 다층신경망 (multilayer perceptron)이 다른 패턴인식 방법에 비해 여러 가지 이점을 제공하지만 다층신경망에 기반한 화자증명 시스템은 낮은 증명오류를 달성하기 위한 대규모 배경화자로 인한 느린 등록속도의 문제를 안는다. 이 문제를 해결하기 위해 QnDCS(quantitative discriminative cohort speakers) 방법에서 화자군집 방법을 다층신경망 기반화자증명 시스템에 도입하여 화자등록에 필요한 배경화자의 수를 줄이려는 시도가 있었다. QnDCS 방법이 목적을 어느 정도 달성하긴 했지만 등록속도의 향상률이 만족할만한 수준이지 못했다. 본 논문에서는 보다 높은 등록속도 향상률을 달성하기 위한 방법으로서, 선택되는 배경화자의 수를 더욱 낮추는 정질에 기반한 기준을 도입한 QlDCS (qualitative discriminative cohort speakers) 방법을 제안한다. 두 방법에 대한 성능평가를 위해 다층신경망과 지속음에 기반한 화자증명 시스템과 음성 데이터베이스를 사용한 실험을 실시한다 그 결과 제안한 방법이 QlDCS에 비해 온라인 방식의 EBP (error backpropagation)에 대한 학습속도 향상률 면에서 2배 이상 더 짧은 시간 내에 화자를 등록하는 것으로 나타나 보다 높은 효율을 지녔음을 증명한다.

다층신경망 기반 화자증명 시스템에서 학습 데이터 감축을 통한 화자등록속도 향상방법 (A Method on the Improvement of Speaker Enrolling Speed for a Multilayer Perceptron Based Speaker Verification System through Reducing Learning Data)

  • 이백영;황병원;이태승
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.585-591
    • /
    • 2002
  • 다층 신경망 (MLP: multilayer perceptron)은 기존의 패턴인식 방법에 비해 몇 가지 이점을 제공하지만 학습에 비교적 많은 시간을 요구한다. 이 점은 화자증명 시스템의 인식방법으로서 다층 신경망을 사용할 경우 등록시간이 길어지는 문제를 발생시킨다. 본 논문에서는 기존의 시스템에서 채택한 화자군집 방법을 응용하여 다층 신경망 학습에 필요한 배경화자 수를 줄임으로써 화자등록 시간을 단축하는 방법을 제안하고, 지속음을 인식단위로 하는 다층 신경망 화자증명 시스템에 이 방법을 적용한 실험결과를 통해 그 효과를 확인한다.

학습속도 개선과 학습데이터 축소를 통한 MLP 기반 화자증명 시스템의 등록속도 향상방법 (An Improvement of the MLP Based Speaker Verification System through Improving the learning Speed and Reducing the Learning Data)

  • 이백영;이태승;황병원
    • 대한전자공학회논문지SP
    • /
    • 제39권3호
    • /
    • pp.88-98
    • /
    • 2002
  • MLP(multilayer perceptron)는 다른 패턴인식 방법에 비해 몇 가지 유리한 이점을 지니고 있어 화자증명 시스템의 화자학습 및 인식 방법으로서 사용이 기대된다. 그러나 MLP의 학습은 학습에 이용되는 EBP(error backpropagation) 알고리즘의 저속 때문에 상당한 시간을 소요한다. 이 점은 화자증명 시스템에서 높은 화자인식률을 달성하기 위해서는 많은 배경화자가 필요하다는 점과 맞물려 시스템에 화자를 등록하기 위해 많은 시간이 걸린다는 문제를 낳는다. 화자증명 시스템은 화자 등록후 곧바로 증명 서비스를 제공해야 하기 때문에 이 문제를 해결해야 한다. 본 논문에서는 이 문제를 해결하기 위해 EBP의 학습속도를 개선하는 방법과, 기존의 화자증명 방법에서 화자군집 방법을 도입한 배경화자 축소방법을 사용하여 MLP 기반 화자증명 시스템에서 화자등록에 필요한 시간의 단축을 시도한다.

화자인증 시스템에서 선정 방법에 관한 연구 (A Study on Background Speaker Selection Method in Speaker Verification System)

  • 최홍섭
    • 음성과학
    • /
    • 제9권2호
    • /
    • pp.135-146
    • /
    • 2002
  • Generally a speaker verification system improves its system recognition ratio by regularizing log likelihood ratio, using a speaker model and its background speaker model that are required to be verified. The speaker-based cohort method is one of the methods that are widely used for selecting background speaker model. Recently, Gaussian-based cohort model has been suggested as a virtually synthesized cohort model, and unlike a speaker-based model, this is the method that chooses only the probability distributions close to basic speaker's probability distribution among the several neighboring speakers' probability distributions and thereby synthesizes a new virtual speaker model. It shows more excellent results than the existing speaker-based method. This study compared the existing speaker-based background speaker models and virtual speaker models and then constructed new virtual background speaker model groups which combined them in a certain ratio. For this, this study constructed a speaker verification system that uses GMM (Gaussin Mixture Model), and found that the suggested method of selecting virtual background speaker model shows more improved performance.

  • PDF

차량 보안을 위한 어구독립 화자증명의 등록시간 단축에 관한 연구 (A Study on the Fast Enrollment of Text-Independent Speaker Verification for Vehicle Security)

  • 이태승;최호진
    • 한국항행학회논문지
    • /
    • 제5권1호
    • /
    • pp.1-10
    • /
    • 2001
  • 음성은 차량 운행시 여러 가지 조작으로 분주한 운전자에게 간편한 장비 입력 및 조작을 위한 수단으로 유용한 특성을 지니고 있다. 본 논문에서는 이런 음성의 특성을 이용하여 차량 도난이나 중요한 온라인 서비스 접근시 신원을 증명할 수 있는 화자증명 방식을 제안한다. 이 방식에서는 음성의 언어정보를 이용하는 지속음 인식 기법과 함께 확률적 인식 방식에 비해 몇 가지 이점을 갖는 MLP(multi-layer perceptron)를 사용한다. 하지만 MLP를 사용하는 인식 기법은 학습에 많은 계산량을 요구하므로 실시간으로 화자를 등록해야 하는 화자증명에서는 적용하기가 쉽지 않다. 이 문제를 해결하기 위해 본 논문에서는 기존의 화자점수 평준화 방법에서 화자군집 모델 기법을 도입하여 배경화자를 사전에 여러 개의 작은 화자군집으로 분리하는 방법을 제안한다. 등록화자를 이렇게 나눈 화자군집 중 하나로 분류한 뒤 해당 화자군집에 대해서만 등록 학습과정을 거치는 방법으로 계산량을 큰 폭으로 줄일 수 있다.

  • PDF

MLP에 기반한 고성능 화자증명 시스템 (High Performance MLP-based Speaker Verification System)

  • Lee, Tae-Seung;Park, Ho-Jin
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.571-573
    • /
    • 2004
  • Speaker verification systems based on multilayer perceptrons (MLPs) have good prospects in reliability and flexibility required as a successful authentication system. However, the poor learning speed of the error backpropagation (EBP) which is representative learning method of MLPs is the major defect to be complemented to achieve real-time user enrollments. In this paper, we implement an MLP-based speaker verification system and apply the existing two methods of the omitting patterns in instant learning (OIL) and the discriminative cohort speakers (DCS) to approach real-time enrollment. An evaluation of the system on a Korean speech database demonstrates the feasibility of the system as a speaker verification system of high performance.

  • PDF

The Effect of Broadcasting Sow Suckling Grunts in the Lactation Shed on Piglet Growth

  • Cronin, G.M.;Leeson, E.;Cronin, J.G.;Barnett, J.L.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제14권7호
    • /
    • pp.1019-1023
    • /
    • 2001
  • An on-farm trial was conducted in temperature-controlled lactation rooms at a commercial pig farm to investigate the efficacy of broadcasting sow suckling grunts from day 4 of lactation, on increasing piglet growth to weaning. In the Broadcast treatment, sows and litters were exposed to a 3-min broadcast from loud-speakers every 42 min. The Control treatment was not exposed to the broadcast. All sows and litters had similar husbandry and piglets were provided with creep feed on the floor twice daily. In each of the three replicates in time, the Broadcast and Control treatments were allocated to different lactation rooms at random and there were 12 sows and litters per treatment per replicate. A total of four identical lactation rooms were available for the trial, each containing 28 conventional sow and litter crates with piglet heater in the creep area. A non-trial room separated the two treatment rooms in each replicate to minimise the chance that the broadcast grunt stimulation was audible to the Control treatment litters. Five "normal and average-looking" piglets from the trial litters were weighed twice, 7 d apart. The cohort of five piglets was identified by ear-tags and formed the experimental unit for the statistical analysis. The average (${\pm}SD$) age of piglets at initial weighing was 7.7(${\pm}2.22$) days. For each litter, mean piglet live weight at day 14 of lactation was estimated by linear regression of the two weights recorded seven days apart, when on average, the Broadcast treatment had been exposed to the stimulation for 10 days. Piglets in the Broadcast treatment were heavier (p<0.01) at day 14 of lactation compared to Control treatment (4.24 and 3.92 kg, respectively) and tended to have a greater average daily weight gain over the 7-d period (245 and 228 g/day, respectively; p<0.08). The results suggest piglet growth was improved by about 8% in response to the regular, timed broadcast of sow suckling grunts in the lactation shed. The independent contributions of milk and creep feed to the improved growth remain to be determined.

Introduction of Questionnaires for Quality of Life of Patients with Malignant Tumors of the Central Nervous System into Neurosurgical Practice in the Republic of Kazakhstan

  • Akshulakov, Serik;Aldiyarova, Nurgul;Ryskeldiyev, Nurzhan;Akhmetzhanova, Zauresh;Gaitova, Kamila;Auezova, Raushan;Doskaliyev, Aidos;Kerimbayev, Talgat
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권2호
    • /
    • pp.873-876
    • /
    • 2016
  • Background: Studies of quality of life (QoL) of oncological patients is carried out using questionnaires approved in many international clinical studies. The European Organization for Research and Treatment of Cancer EORTC QLQ-C30 (Quality of Life Questionnary-Core 30) and its special brain cancer module EORTC QLQ-BN20 are widely used in the world neurooncologic practice. They are available in more than 80 official versions of 30 languages of the world. Previously we used the official versions in Russian, which often causes difficulty in understanding for native Kazakh language speakers, who comprise more than 60% of our respondents. This was the reason for creating a version of Kazakh language. Therefore, in 2014 for the first time the process of adaptation of questionnaires to the Kazakh language was initiated. Materials and Methods: The translation process of questionnaires to Kazakh language was held in accordance with the requirements of the European Organization for Research and Treatment of Cancer EORTC on QoL and consisted of the following stages: preparation - translation - pilot testing - approval. The official permission of authors and "Guideline on translation" was obtained which was developed by the working group of the EORTC on QoL. The pilot testing of EORTC QLQ-C30 and QLQ-BN20 questionnaires was conducted on the basis of the Department of Central Nervous System Pathology of the "National Centre for Neurosurgery" in patients with malignant tumors of the central nervous system. Results: The official versions of the EORTC QLQ-C30 and QLQ-BN20 questionnaires in Kazakh language were introduced and adapted in practical neurosurgical operations in Kazakhstan. Conclusions: The approved versions of the questionnaires in Kazakh language are now available for mainstream use on the official website EORTC.com. The versions of these questionnaires can be used in domestic cohort studies and clinical practice in the Republic of Kazakhstan. The use of these tools for assessing QoL will help professionals in the planning of individual treatment strategies and selection of the necessary therapy.