• 제목/요약/키워드: speaker

검색결과 1,684건 처리시간 0.027초

멀티모달 인터페이스를 위한 음성 및 문자 공용 인식시스템의 구현 (An On-line Speech and Character Combined Recognition System for Multimodal Interfaces)

  • 석수영;김민정;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.216-223
    • /
    • 2003
  • 본 논문에서는 음성과 온라인 문자를 단일시스템으로 인식할 수 있는 음성 문자 공용인식 시스템을 제안한다. 일반적으로 CHMM(Continuous Hidden Markov Model)은 음성인식과 온라인 문자인식을 위해 매우 유용한 도구로 잘 알려져 있으나, 인식을 위해서는 각각을 독립 시스템으로 구현하고 있어 추가적인 메모리와 계산량을 요구한다. 제안한 공용인식 시스템은 음성인식과 문자인식을 결합하기 위하여 이들을 동일한 CHMM모델로 구성한 후 상태단위로 지속정보를 제어하는 OPDP(One Pass Dynamic Programming) 알고리즘을 통하여 음성과 문자를 인식할 수 있는 확률 통계적 시스템을 구현하였다. 음성은 MFCC(Mel Frequency Cepstrum Coefficient) 파라미터, 문자는 위치 변화량 파라미터와 비트맵 파라미터를 사용하였으며, MLE(Maximum Likelihood Estimation) 추정법을 이용하여 음소와 자소를 결합한 115개의 3상태 9천이 CHMM모델을 구성하였다. 공용인식기의 실험결과 음소 인식률 51.65%, 음성 단어 인식률 88.6%, 자소 인식률 85.3%, 필기체 단어인식률 85.6%를 나타내어 공용인식의 유효함을 확인할 수 있었다.

  • PDF

Invention of the Guide Catheter Irrigation Monitoring Device for Neuroendovascular Therapy

  • Ozkul, Ayca;Park, Jong-Hyun;Shin, Dong-Seung;Yilmaz, Ali;Kim, Bum-Tae
    • Journal of Korean Neurosurgical Society
    • /
    • 제60권4호
    • /
    • pp.471-474
    • /
    • 2017
  • Objective : The thromboembolic events during neuroendovascular therapy (NET) are the major complications of concern that can be occasionally fatal. The thrombotic occlusion of the guide catheter for NET is thought to be the risk of the thromboembolic events. We have developed an idea for inventing the monitoring system of the continuous irrigation through the guide catheter. We herein present a unique invention of the guide catheter irrigation monitoring device. Methods : We have developed ideas for preventing the thrombotic occlusion of the guide catheter. In order to design a convenient device working in the practical use, we have consulted and shared the ideas with the electrical engineers about putting the invention. Results : The guide catheter irrigation monitoring device (GCIMD) consisted of three parts of optical sensor, main body and electric adapter. In brief, the basic principles of working of the GCIMD are as follows. The optical sensor is attached to the dripping chamber of the line to irrigation solution. The main body had the small light and speaker to make an alarm sounds. The sensor monitors the dripping of flush solution. If the dripping stops more than three seconds, a warning alarm has been activated. So, the operating physicians can concentrate and check the guide catheter irrigation. After the use of the GCIMD, there was no major thromboembolic complication in conjunction with the thrombotic occlusion of the guide catheter in our institute. Conclusion : We have developed a brilliant invention of the GCIMD for NET.

감정 음성 인식을 위한 강인한 음성 파라메터 (Robust Speech Parameters for the Emotional Speech Recognition)

  • 이규현;김원구
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.681-686
    • /
    • 2012
  • 본 논문에서는 강인한 감정 음성 인식 시스템을 개발하기 위하여 감정의 영향을 적게 받는 음성 파라메터에 대한 연구를 수행하였다. 이러한 목적을 위하여 다양한 감정이 포함된 데이터를 사용하여 감정이 음성 인식 시스템과 음성 파라메터에 미치는 영향을 분석하였다. 본 연구에서는 멜 켑스트럼, 델타 멜 켑스트럼, RASTA 멜 켑스트럼, 루트 켑스트럼, PLP 계수와 성도 길이 정규화 방법에서 주파수 와핑된 멜 켑스트럼 계수를 사용하였다. 또한 신호 편의 제거 방법으로 CMS 방법과 SBR 방법이 사용되었다. 실험결과에서 성도정규화 방법을 사용한 RASTA 멜 켑스트럼, 델타 멜 켑스트럼 및 CMS 방법을 사용한 경우가 HMM 기반의 화자독립 단독음 인식 실험 결과에서 가장 우수한 결과를 나타내었다.

주파수 와핑을 이용한 감정에 강인한 음성 인식 학습 방법 (A Training Method for Emotionally Robust Speech Recognition using Frequency Warping)

  • 김원구
    • 한국지능시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.528-533
    • /
    • 2010
  • 본 논문에서는 인간의 감정 변화의 영향을 적게 받는 음성 인식 시스템의 학습 방법에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화가 음성 신호와 음성 인식 시스템의 성능에 미치는 영향에 관한 연구를 수행하였다. 감정이 포함되지 않은 평상의 음성으로 학습된 음성 인식 시스템에 감정이 포함된 인식 데이터가 입력되는 경우 감정에 따른 음성의 차이가 인식 시스템의 성능을 저하시킨다. 본 연구에서는 감정의 변화에 따라 화자의 성도 길이가 변화한다는 것과 이러한 변화는 음성 인식 시스템의 성능을 저하시키는 원인 중의 하나임을 관찰하였다. 본 연구에서는 이러한 음성의 변화를 포함하는 학습 방법을 제안하여 감정 변화에 강인한 음성 인식 시스템을 개발하였다. HMM을 사용한 단독음 인식 실험에서 제안된 학습 방법을 사용하면 감정 데이터의 오차가 기존 방법보다 28.4% 감소되었다.

디지털음성명료도 향상을 위한 적응형 잡음제거 기법에 관한 연구 (A study on adaptive noise cancellation for enhancement of digital speech articulation)

  • 김수용;지석근
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.961-968
    • /
    • 2007
  • 오늘날, 우리는 어디엔가 엔제나 무전기 통신 장치를 사용할수 있다. 때때로, 우리는 음향잡음환경에서 장치를 사용하였다. 그 음향잡음은 통신장치에서 많은 문제를 만들었다. 음향잡음환경에서는, 말은 음성신호와 잡음신호 양쪽에 신호를 포함하고, 받았기 때문에 깨끗한 정보를 받기위해 보낼수가 없었다. 디지털필터는 바라는 신호를 얻기 위해 옮기는 잡음으로서 유용하였다. 방법의 하나는 자동적으로 맞추는 필터 파라미터로서 적응 잡음 망상조직으로 적응디지털필터를 사용하는 것이다. 본 논문은 두 적응필터 방법에 의하여 현실에서 음향잡음으로서 명료도 알고리즘의 번지라고 할 수가 있다. 하나는 두 입력 채널과 함께 적응잡음 망상조직이라 할 수 있고, 또 다른 것은 하나 입력 채널과 함께 스펙트럼 빼기필터이다. 이 실험의 결과는 제안된 필터로부터 스펙트럼 진폭필터는 움직이지 않는 잡음은 효력이 있는 동안 움직이는 것을 줄이기 위해 사용되어지는 것은 적응잡음망상조직으로 보여준다.

메이지·다이쇼 작품의 てくれ·てください의 표현 양상 (Expressions of requests using give and receive verbs in the era of Meizi and Taisyo)

  • 양정순
    • 비교문화연구
    • /
    • 제29권
    • /
    • pp.391-411
    • /
    • 2012
  • Request expressions can be defined as expressions that demand or ask the other person to do certain movements. There are direct request expressions that ask the other person to do certain movements directly and indirect request expressions that ask the other person to do certain movements by describing the speaker's condition. The study analyzed gender and hierarchy of speakers and listeners who used 'tekure' and 'tekudasai' in dialog examples of the Meiji Period and the Taisho Period. In those periods, the modern Tokyo dialect was formed and established. "Toseishoseikatagi"in Meiji 10s,"Ukigumo""Natsukodachi""Tajotakon"in Meiji 20s,"Hakai""Botchan"in Meiji 30s,"Huton""Inakakyoshi" in Meiji 40s and "Aruonna"in the Taisho Period were analyzed for the study. 'kure' was used more by male speakers than female speakers. Examples by female speakers were shown on the novels after Meji 30s. In case of male speakers, they often used it to listeners with an equitable relationship at "Toseishoseikatagi"in Meiji 10s but they often used it to younger listeners at "Hakai"in Meiji 30s. 'okure' was used more by female speakers than male speakers. Listeners were varied from older ones to younger ones. In case of female speakers, 'okure' was used more often at "Aruonna"in the Taisho Period than the other novels. In case of male speakers, 'okure' was used only at "Ukigumo""Natsukodachi"and "Hakai". 'Okurenasai' was used outstandingly by female speakers on the form of 'okun_'. In case of 'kudasai', female speakers used it more than male speakers at "Toseishoseikatagi" and "Aruonna"but male speakers used it more than female speakers at "Tajotakon"and "Hakai". Listeners were varied from older ones to younger ones. 'o~kudasai' was not shown until Meiji 20s but shown after Meiji 30s among the analyzed novels. According to gender, it was used a little bit more often by female speakers than male speakers. According to hierarchy, listeners were usually older than speakers. 'o~nasatekudasai' was used more often by male speakers than female speakers. Listeners were also usually older than speakers.

동축형 스월-제트 분사기의 음향가진에 따른 동특성 (Dynamic Characteristics of Coaxial Swirl-jet Injector with Acoustic Excitation)

  • 배진현;김태성;정석규;정찬영;최정열;윤영빈
    • 한국추진공학회지
    • /
    • 제22권4호
    • /
    • pp.99-107
    • /
    • 2018
  • 본 연구에서는 제트 유동 증가에 따라 스피커로 제트와 스월 유동에 각각 가진을 가하여 기체-기체 동축형 제트-스월 분사기의 분사기 전달함수(Injector Transfer Function, ITF)을 측정하였다. 공급시스템의 길이를 변화시켜 ITF를 측정한 결과 공급시스템의 공진주파수에서 피크가 발생하는 것을 확인할 수 있었다. 제트 유동에 가진을 줄 때, 제트 유동이 증가함에 따라 ITF의 크기는 감소하다가 다시 증가하는 것을 확인할 수 있었다. 즉, 두 유동의 속도차가 클수록 ITF의 크기가 증가하였다. 스월 가진 시 제트 유동이 증가함에 따라 ITF가 감소하는 것을 확인할 수 있었는데, 이는 후단에서 일정 유량 대비 가진 에너지가 감소하기 때문이다.

The f0 distribution of Korean speakers in a spontaneous speech corpus

  • Yang, Byunggon
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.31-37
    • /
    • 2021
  • The fundamental frequency, or f0, is an important acoustic measure in the prosody of human speech. The current study examined the f0 distribution of a corpus of spontaneous speech in order to provide normative data for Korean speakers. The corpus consists of 40 speakers talking freely about their daily activities and their personal views. Praat scripts were created to collect f0 values, and a majority of obvious errors were corrected manually by watching and listening to the f0 contour on a narrow-band spectrogram. Statistical analyses of the f0 distribution were conducted using R. The results showed that the f0 values of all the Korean speakers were right-skewed, with a pointy distribution. The speakers produced spontaneous speech within a frequency range of 274 Hz (from 65 Hz to 339 Hz), excluding statistical outliers. The mode of the total f0 data was 102 Hz. The female f0 range, with a bimodal distribution, appeared wider than that of the male group. Regression analyses based on age and f0 values yielded negligible R-squared values. As the mode of an individual speaker could be predicted from the median, either the median or mode could serve as a good reference for the individual f0 range. Finally, an analysis of the continuous f0 points of intonational phrases revealed that the initial and final segments of the phrases yielded several f0 measurement errors. From these results, we conclude that an examination of a spontaneous speech corpus can provide linguists with useful measures to generalize acoustic properties of f0 variability in a language by an individual or groups. Further studies would be desirable of the use of statistical measures to secure reliable f0 values of individual speakers.

스마트 단말에서의 통역용 단기기억력 향상 훈련 시스템 (Smart device based short-term memory training system for interpretation)

  • 표지혜;안동혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권3호
    • /
    • pp.747-756
    • /
    • 2019
  • 통역을 학습하는 학생들은 수업 외에도 추가적인 학습 및 훈련을 수행한다. 동시통역 및 순차통역에서 두 언어의 구조가 다르기 때문에 통역가는 발표 내용을 빠르게 기억해야 한다. 단기 기억 향상을 위해서 통역을 학습하는 학생들은 메모리 훈련을 수행한다. 메모리 훈련은 파트너가 필요하기 때문에 학습 효율성이 저하되고 자가 학습이 불가능하다. 이를 해결하기 위해서 컴퓨터 기반의 단기 기억 훈련 시스템이 제안되었다. 지문 내 단어를 특수문자로 변경함으로써 학생들이 파트너 없이도 자가 학습이 가능하다. 하지만 컴퓨터는 휴대성이 떨어지기 때문에 외부에서는 학습 능률이 저하된다. 제거되는 단어보다 키워드로 제공하는 단어의 수가 더 많아서 학습 난이도가 저하된다. 이를 해결하기 위해서, 본 논문에서는 스마트 단말 기반의 문장구역 훈련 시스템을 제안하였다. 스마트 단말은 휴대성이 높아 학습의 제한이 없어 효율이 증가한다. 제안하는 훈련 시스템에서는 삭제되는 단어수가 키워드보다 더 많도록 하여 학습 난이도가 증가한다. 제안한 훈련 시스템을 구현하고 기능을 검증하였다.

러시아어와 폴란드어 문학텍스트 내 생략의 화용적 분석 - 므로제크의 "남쪽으로의 도주"를 중심으로 - (A Pragmatic Approach to Ellipsis in Russian and Polish Colloquial and Informal Texts of the Novel "Exit to the South")

  • 정정원
    • 비교문화연구
    • /
    • 제33권
    • /
    • pp.407-459
    • /
    • 2013
  • The paper pragmatically analyzes ellipsis in Russian and Polish colloquial and informal texts. The famous Polish writer Sławomir $Mro{\dot{z}}ek^{\prime}s$ "Exit to the South", written in Polish and Russian is used as a material for the analysis. Russian and Polish ellipsis in colloquial and informal texts have in common that the givenness and subjecthood of the elliptical co-referent play a crucial role. However, the ellipsis in two languages also has differences in many ways. Above all, in the Polish texts of colloquial and informal style, a theme is likely to be elliptical and the coreferential relation reaches to an extra-sentential antecedent, while the ellipsis in analysed Russian texts in most cases requires coordinate, subordinate or relative clauses, and the elliptical co-referent tends to have an intra-sentential antecedent. The ellipsis of the theme-subject is unmarked in Polish, where every verbal form has an ending denoting person. Unlike formal style which often allows explicit noun subject, Polish text of colloquial and informal style prefer null form of the subject in most cases. If Polish sentences have explicit theme-subjects, they disambiguate intervening and main themes, and indicate the contrast, the focus, the introduction of new narratives or the change of speaker's point of view. Sometimes direct speeches and deictic pronouns also need explicit theme-subjects in Polish sentences. On the other hand, the ellipsis of the theme-subject is marked in Russian even in colloquial and informal texts. The theme-subject can be deleted in Russian colloquial and informal texts, if the subject is a form of the first or the second person, or if the aspect and the tense of the antecedent sentence's verb are the same as those of the given sentence's verb and both the antecedent and the coreferential word have the nominative case.