• Title/Summary/Keyword: 음성지수 모델

Search Result 15, Processing Time 0.023 seconds

Joint CDMA/PRMA의 성능향상 기법에 관한 연구

  • 국광호;이강원;박정우;강석열
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2001.05a
    • /
    • pp.134-134
    • /
    • 2001
  • 이동통신 망을 통한 멀티미디어 통신의 수요 급증으로, 차세대 이동통신 시스템에서는 패킷 교환에 기초한 망 구조가 사용될 것으로 예측된다. VOD(Voice Activity Detector)를 갖는 음성 단말은 데이터를 발생시키는 talk spurt(평균이 t$_1$인 지수분포를 따름)와 데이터를 발생시키지 않는 silence period(평균이 t$_2$인 지수분포를 따름)의 두가지 상태를 갖는 마코프 체인으로 모델링된다. Goodman at. al.은 음성 단말들이 talk spurt동안만 데이터를 전송하게 함으로써 더 많은 가입자들을 수용할 수 있는 PRMA(Packet Reservation Multiple Access) 기법을 제안되었다. PRMA 방식에서는 시간 축이 슬롯들로 구성되며 여러개의 슬롯들로 프레임이 형성된다. Silence period 상태에 있던 음성 단말은 talk spurt 상태가 되면 talk spurt의 첫 번째 데이터를 하나의 슬롯을 통해 전송하게 된다. 이때 단말들은 각 슬롯에서 데이터를 전송할 수 있는 확률을 나타내는 채널 접근 확률(channel access probability)에 의해 데이터를 전송하게 되며 전송에 성공하면 슬롯을 예약함으로서 다음 프레임부터는 동일한 위치의 슬롯을 통해 데이터들을 전송하게 된다. DS/CDMA(Direct Sequence/code Division Multiple Access)는 이동통신 단말의 수용 용량상의 이점, 소프트 핸드오버 능력, 보다 용이하게 셀 계획을 세울 수 있는 점 등에 의해 차세대 이동통신 망에서 채택될 예정이다. CDMA 시스템은 간섭(interference)에 의해 용량이 제한을 받게 되며, MAI(Multiple Access Interference)가 시스템의 성능에 많은 영향을 미치게 된다. Brand, et. al.은 간섭의 분산을 줄이기 위해 PRMA 개념을 DS/CDMA 환경으로 확장한 Joint CDMA/PRMA 프로토콜을 제안하였다. 이때 각 슬롯에서의 데이터 전송확률을 그 슬롯에서 예약상태에 있는 음성 단말의 수에 의존하게 하는 방식을 사용하였으며 데이터 전송확률을 나타내는 채널 접근 확률들을 시뮬레이션을 통해 유도하였다. 한편 음성 단말에게는 실시간 서비스를 제공해 주어야 하는 대신 데이터 단말에게는 실시간 서비스를 제공해 주지 않아도 되므로, 트래픽이 많을 때에는 음성 단말의 데이터 전송에 우선권을 주는 것이 바람직하다. 이를 위해서 Brand, et. al.은 채널 접근 확률을 각 슬롯의 트래픽 상태에 따라 적응적으로 산출하는 기법을 제안하였다. 본 연구에서는 Joint CDMA/PRMA의 성능이 채널 접근 함수의 효율성에 많이 의존하게 되므로 보다 효율적인 채널 접근 확률을 구하는 방법을 제안한다. 즉 채널 액세스 확률을 각 슬롯에서 예약상태에 있는 음성 단말의 수뿐만 아니라 각 슬롯에서 예약을 하려고 하는 단말의 수에 기초하여 산출하는 방법을 제안하고 이의 성능을 분석하였다. 시뮬레이션에 의해 새로 제안된 채널 허용 확률을 산출하는 방식의 성능을 비교한 결과 기존에 제안된 방법들보다 상당한 성능의 향상을 볼 수 있었다.

  • PDF

Relationships between rhythm and fluency indices and listeners' ratings of Korean speakers' English paragraph reading (리듬 및 유창성 지수와 한국 화자의 영어 읽기 발화 청취 평가의 관련성)

  • Hyunsong Chung
    • Phonetics and Speech Sciences
    • /
    • v.14 no.4
    • /
    • pp.25-33
    • /
    • 2022
  • This study investigates the relationships between rhythm and fluency indices and listeners' ratings of the rhythm and fluency of Korean college students' English paragraph reading. 17 university students read and recorded a passage from "The North Wind and the Sun" twice before and after three months of English pronunciation instruction. Seven in-service and pre-service English teachers in graduate school assessed the rhythm and fluency of the utterances. In addition, the values of 14 indices of rhythm and fluency were extracted from each speech and the relationships between the indices and the listeners' ratings were analyzed. The rhythm indices of the speakers in this study did not differ significantly from those of native English speakers presented in previous studies in %V, VarcoV, and nPVIV, but were higher in ΔV, ΔC, and VarcoC and lower in speech rate. The level of rhythm and fluency demonstrated by Korean college students was comparable, at least in terms of objective values for certain indices. The fluency indices, such as percentage of pauses, articulation rate, and speech rate, significantly contributed more to predicting both rhythm and fluency ratings than the rhythm indices.

Statistical Analysis of Call Interarrival Time and Channel Holding Time in Cellular Telephony Network (이동전화망에서 호 도착 시간과 채널 보류 시간의 통계적 분석)

  • 엄태랑;장주욱;이경근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04d
    • /
    • pp.478-480
    • /
    • 2003
  • 일반적으로 음성전화망에서 수학적 모델을 사용하여 트래픽 분석을 수행하는 경우 호 도착 시간과 채널 보류 시간은 지수 분포라고 가정한다. 본 논문에서는 이동전화망을 구성하고 있는 교환기에서 추출한 과금 데이터를 이용하여 호 발생으로 인해 집계되는 호량애 관한 호 도착 시간과 채널 보류 시간이 나타내는 분포를 알아본다. 또한 분석된 확률 분포를 통계적 검정 방법을 이용하여 경험분포함수에 대한 기대 분포함수의 적합성을 판별한다.

  • PDF

A Design of Artificial Emotion Model (인공 감정 모델의 설계)

  • Lee, In-Geun;Seo, Seok-Tae;Jeong, Hye-Cheon;Gwon, Sun-Hak
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.58-62
    • /
    • 2007
  • 인간이 생성한 음성, 표정 영상, 문장 등으로부터 인간의 감정 상태를 인식하는 연구와 함께, 인간의 감정을 모방하여 다양한 외부 자극으로 감정을 생성하는 인공 감정(Artificial Emotion)에 관한 연구가 이루어지고 있다. 그러나 기존의 인공 감정 연구는 외부 감정 자극에 대한 감정 변화 상태를 선형적, 지수적으로 변화시킴으로써 감정 상태가 급격하게 변하는 형태를 보인다. 본 논문에서는 외부 감정 자극의 강도와 빈도뿐만 아니라 자극의 반복 주기를 감정 상태에 반영하고, 시간에 따른 감정의 변화를 Sigmoid 곡선 형태로 표현하는 감정 생성 모델을 제안한다. 그리고 기존의 감정 자극에 대한 회상(recollection)을 통해 외부 감정 자극이 없는 상황에서도 감정을 생성할 수 있는 인공 감정 시스템을 제안한다.

  • PDF

A Study on a Model Parameter Compensation Method for Noise-Robust Speech Recognition (잡음환경에서의 음성인식을 위한 모델 파라미터 변환 방식에 관한 연구)

  • Chang, Yuk-Hyeun;Chung, Yong-Joo;Park, Sung-Hyun;Un, Chong-Kwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.5
    • /
    • pp.112-121
    • /
    • 1997
  • In this paper, we study a model parameter compensation method for noise-robust speech recognition. We study model parameter compensation on a sentence by sentence and no other informations are used. Parallel model combination(PMC), well known as a model parameter compensation algorithm, is implemented and used for a reference of performance comparision. We also propose a modified PMC method which tunes model parameter with an association factor that controls average variability of gaussian mixtures and variability of single gaussian mixture per state for more robust modeling. We obtain a re-estimation solution of environmental variables based on the expectation-maximization(EM) algorithm in the cepstral domain. To evaluate the performance of the model compensation methods, we perform experiments on speaker-independent isolated word recognition. Noise sources used are white gaussian and driving car noise. To get corrupted speech we added noise to clean speech at various signal-to-noise ratio(SNR). We use noise mean and variance modeled by 3 frame noise data. Experimental result of the VTS approach is superior to other methods. The scheme of the zero order VTS approach is similar to the modified PMC method in adapting mean vector only. But, the recognition rate of the Zero order VTS approach is higher than PMC and modified PMC method based on log-normal approximation.

  • PDF

Compromised feature normalization method for deep neural network based speech recognition (심층신경망 기반의 음성인식을 위한 절충된 특징 정규화 방식)

  • Kim, Min Sik;Kim, Hyung Soon
    • Phonetics and Speech Sciences
    • /
    • v.12 no.3
    • /
    • pp.65-71
    • /
    • 2020
  • Feature normalization is a method to reduce the effect of environmental mismatch between the training and test conditions through the normalization of statistical characteristics of acoustic feature parameters. It demonstrates excellent performance improvement in the traditional Gaussian mixture model-hidden Markov model (GMM-HMM)-based speech recognition system. However, in a deep neural network (DNN)-based speech recognition system, minimizing the effects of environmental mismatch does not necessarily lead to the best performance improvement. In this paper, we attribute the cause of this phenomenon to information loss due to excessive feature normalization. We investigate whether there is a feature normalization method that maximizes the speech recognition performance by properly reducing the impact of environmental mismatch, while preserving useful information for training acoustic models. To this end, we introduce the mean and exponentiated variance normalization (MEVN), which is a compromise between the mean normalization (MN) and the mean and variance normalization (MVN), and compare the performance of DNN-based speech recognition system in noisy and reverberant environments according to the degree of variance normalization. Experimental results reveal that a slight performance improvement is obtained with the MEVN over the MN and the MVN, depending on the degree of variance normalization.

Comparison of Acoustic Performance Depending on the Location of Sound Absorptive and Diffuser in Small Auditoriums Using 1/10 Scale Models (1/10 축소모형을 이용한 소공연장의 흡음재와 확산체의 적용위치에 따른 음향성능 비교)

  • Kim, Tae-Hee;Park, Chan-Jae;Park, Ji-Hoon;Haan, Chan-Hoon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.34 no.2
    • /
    • pp.146-156
    • /
    • 2015
  • This study investigated how the location of sound absorptive materials and sound diffusers affects the acoustic performance of small auditoriums. It was conducted for a standard model established with the averaged dimension of 36 auditoriums which had opened since 2000 in Daehak-ro, Seoul. In this study, the installation area of finishing materials was calculated upon a back wall which had the smallest installation effective area of finishing materials. To analyze the changes of acoustic performance according to installation location of finishing materials, experiments were carried out using the 1/10 down scale models for 8 cases which were made by classifying the installation location of ceiling and side wall into the front, middle and rear part.The used acoustic parameters were reverberation time (RT), early decay time (EDT), clarity (C80), definition (D50) and speech transmission index (STI). In result, the index related to the amount of reverberant sound (RT, EDT) showed the great changes when evaluating it through just noticeable difference (JND), but the one related to clarity (C80, D50, STI) hardly indicated the changes. In case to obtain short reverberation time, it was most effective to control reverberation time through the side walls when installing sound absorptive and diffusive materials, and side wall front was the location which could get the shortest reverberation time.

A Study on Noisy Speech Recognition Using Discriminative Training for PMC Algorithm (PMC 방식에서의 분별적 학습을 이용한 잡음 음성인식에 관한 연구)

  • 정용주
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.2
    • /
    • pp.83-89
    • /
    • 2000
  • In this paper, we proposed a discriminative adaptation method for PMC algorithm and achieved improved speech recognition rate. For the adaptation, we adopted modified PMC(MPMC) which is a variant of PMC and discriminatively adapted the association factor for each mixture of the HMM in the MPMC. From the recognition experiments, the proposed method showed better recognition rate than the conventional PMC. Also, compared with STAR algorithm which is another model parameter compensation method, the proposed method showed superior performance when the SNR is very low and the adaptation data is not sufficient.

  • PDF

Analysis of debris flow movement and diffusion zone, on August 2020 (2020년 8월 토석류 발생지역의 이동확산범위 분석)

  • Kim, Minseok;An, Hyunuk;Lee, Seongjun;Kim, Jisu
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.235-235
    • /
    • 2021
  • 아시아 몬순기후의 영향에 의해 우리나라는 2020년 7월부터 9월까지 약 90일간의 장마로 인해 크고 작은 수재해가 발생하였다. 특히, 안성, 충주, 음성 그리고 곡성 등에서 인명피해가 발생하였으며, 그 외 13개소에서 많은 재산 피해가 발생하였다. 2020년 산사태/토석류 재해로 인한 전국적인 피해액은 약 3,900억으로 보고되고 있으며, 매년 집중호우에 의해 피해 양상이 변하고, 도시지역에서의 발생이 빈번하게 늘고 있다. 집중호우에 의한 산사태/토석류 전이 피해를 저감시키기 위해서는 발생 물질이 어디까지 이동할 수 있는지에 대한 위험범위확산에 대한 연구가 중요하며, 이런 연구를 기반으로 인명피해를 줄이기 위한 연구가 필요하다. 이를 위해 본 연구에서는 천수방정식, 유변학특성 식 그리고 연행침식 식을 조합하여 개발된 적응형 격자기반 2차원 토석류 모델을 이용하여 안성, 음성 그리고 단성지역에서 발생했었던 산사태/토석류 전이 피해 양상을 해석하였다. 산사태 발생 후 2~3일 이내에 지표 지질 및 지형 조사를 실시하였으며, UAV 및 항공사진을 이용하여 산사태 및 토석류의 형태를 맵핑하였다. 지질 및 지형조사 시 간이 Vein tester를 이용하여 야외에서 토양 물성관련 자료를 취득하였으며, 토석류의 이동 흔적(나무 등에의 토석류 타격 흔적)을 이용하여 조사지점에서의 최대 토석류 흐름 깊이를 추정하였다. 정확한 토석류의 유속에 대한 자료 부족으로 2011년 우면산에서 발생한 약 26m/s의 속도를 이용하여 토석류의 흐름 특성을 계산하였다. 이와 더불어 연행침식의 계산을 위해 발생지점 부터 토석류가 퇴적된 하류부까지 기반암의 노출 및 퇴적 정보를 통해 최대 침식 깊이를 추정하여 입력자료로 활용하였다. 토석류 맵핑자료와 비교 결과 정확도가 90%이상으로 나타났으며, 토석류 발생 후 안성 200초, 음성 180초 그리고 단성 180초 이내로 토석류가 하류까지 이동할 수 있는 것으로 계산되었다. 본 연구와 같이 산사태/토석류 발생 메커니즘 해석에 대한 지속적인 연구를 통해 산지 재해에 의한 인명 피해를 줄일 수 있는 토석류확산범위 해석에 대한 연구가 지속적으로 필요할 것으로 판단된다.

  • PDF

Data Processing of AutoML-based Classification Models for Improving Performance in Unbalanced Classes (불균형 클래스에서 AutoML 기반 분류 모델의 성능 향상을 위한 데이터 처리)

  • Lee, Dong-Joon;Kang, Ji-Soo;Chung, Kyungyong
    • Journal of Convergence for Information Technology
    • /
    • v.11 no.6
    • /
    • pp.49-54
    • /
    • 2021
  • With the recent development of smart healthcare technology, interest in daily diseases is increasing. However, healthcare data has an imbalance between positive and negative data. This is caused by the difficulty of collecting data because there are relatively many people who are not patients compared to patients with certain diseases. Data imbalances need to be adjusted because they affect performance in ongoing learning during disease prediction and analysis. Therefore, in this paper, We replace missing values through multiple imputation in detection models to determine whether they are prevalent or not, and resolve data imbalances through over-sampling. Based on AutoML using preprocessed data, We generate several models and select top 3 models to generate ensemble models.