• 제목/요약/키워드: 김화자

검색결과 184건 처리시간 0.034초

정상 성인 화자와 음성장애 성인 화자의 문단낭독 시 호흡단락에 대한 비교 연구: 예비연구 (A Comparison Study of Breath Groups during Reading Paragraph Tasks in Normal Adults and Adult Patients with Voice Disorders: A Preliminary Study)

  • 표화영;김소연;백승국
    • 말소리와 음성과학
    • /
    • 제6권4호
    • /
    • pp.181-187
    • /
    • 2014
  • The present study was performed to investigate the characteristics of breath groups while reading paragraph in normal adults and adult patients with voice disorders. 10 normal females(avr. 20.6 yrs.), 10 young voice disorder females(avr. 33.5 yrs., P1 group), and 10 old voice disorder females(avr. 56.3 yrs., P2 group) read a paragraph of 210 syllables. By using the 'Running Speech' program of the Phonatory Aerodynamic System(PAS), total duration, numbers of breath groups, duration per breath group, and numbers of syllables per breath group were measured, and their correlations with aerodynamic measurement results of reading were analyzed. As a result, in total duration, numbers of breath groups, normals scored highest and P2 group speakers, lowest. Normals showed the longest duration per breath group which was not significant. P2 group speakers showed the highest numbers of syllables per breath group. Correlation analysis showed significantly high correlation scores of total duration and expiratory airflow; numbers of breath groups and inspiratory volume.

후지쯔에 있어서의 음성 자동인식의 현상과 장래 (Automatic Speech Recognition Research at Fujitsu)

  • 나라 야스히로;기무라 신타;김경호
    • 한국음향학회지
    • /
    • 제10권1호
    • /
    • pp.82-91
    • /
    • 1991
  • 본 논문에서는, 후지쯔의 음성 자동인식 관련 제품 개발의 역사, 현재의 상품, 그리고 앞으로의 연구 개발에 대해서 소개한다. 현재는 4,000단어로 부터 12,000단어를 인식하는 특정 화자형의 F2360, 17단어를 인식하는 불특정 화자형의 F2355 L/S를 판매하고 있으며, 앞으로의 연구 개발로는 음소 변형에 적극적으로 대처하고, 자연적인 발성을 인식하기 위한 기초 기술을 개발할 계획에 있다. 인식할 단어의 문자 표기에 음향 segment 변형 규칙을 적용하여 음향 segment network를 자동 생산하여서 입력 음성과의 조합을 행한다. 이 기초 기술을 대어휘 단어 음성 인식에 응용하기 위해서 필요한 단어 후보 선택 방식, 문절 발성을 문장 입력에 응용하기 위한 문절 후보 생성 방식과 문 검사 방식에 대해서도 서술한다.

  • PDF

GMM 기반 실시간 문맥독립화자식별시스템의 성능향상을 위한 프레임선택 및 가중치를 이용한 Hybrid 방법 (Hybrid Method using Frame Selection and Weighting Model Rank to improve Performance of Real-time Text-Independent Speaker Recognition System based on GMM)

  • 김민정;석수영;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.512-522
    • /
    • 2002
  • 본 논문에서는 GMM(Gaussian Mixture Model)에 기반한 실시간문맥독립화자식별시스템[1][2]의 성능향상을 위하여 프레임선택(Frame Selection)방법과 프레임가중치(Weighting Model Rank)방법을 혼합한 hybrid방법을 제안한다. 본 시스템에서는 GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법과 인식 알고리즘으로 ML(Maximum Likelihood)을 기본적으로 사용하였다. 제안한 hybrid 방법은 두 단계로 이루어진다. 첫째, 화자모델과 테스트 데이터를 이용하여 프레임단위로 유사도를 계산하고, 가장 큰 유사도 값과 두 번째로 큰 유사도 값의 차를 계산한 후, 차가 문턱치보다 큰 프레임만을 선택한다 두 번째로, 선택되어진 프레임에서 계산되어진 유사도 값 대신에 가중치 값을 사용하여 전체 스코어를 계산한다. 특징 파라미터로서는 켑스트럼과 회귀계수를 사용하였으며, 학습과 테스트를 위한 데이터베이스는 채집기간이 다른 여러 데이터베이스들로 구성되어 있으며, 실험을 위한 데이터는 임의의 단어를 선택하여 사용하였다. 화자인식실험은 기본 시스템에 프레임선택방법, 프레임가중치방법, 제안한 Hybrid방법을 각각 적용하여 실험하였다. 실험결과, 프레임선택방법에 비해 평균 4%, 프레임가중치방법에 비해 평균 1%의 인식률 향상을 보여, 본 논문에서 적용한 hybrid방법의 유효성을 확인하였다.

  • PDF

연령세대에 따른 말 산출의 시간적 특성: 말속도와 쉼을 중심으로 (The effects of speakers' age on temporal features of speech among healthy young, middle-aged, and older adults)

  • 김예지;이송민;최민경;정상민;성지은;이영미
    • 말소리와 음성과학
    • /
    • 제14권1호
    • /
    • pp.37-47
    • /
    • 2022
  • 본 연구의 목적은 정상 성인 화자의 연령세대에 따른 말 산출의 시간적 특성 간에 유의한 차이가 있는지를 분석하고, 말 산출 변수들 중에서 청년 화자와 노년 화자를 유의하게 분류할 수 있는 변수가 무엇인지 살펴보고자 하였다. 이를 위해 청년, 장년, 노년의 말속도(전체 말속도, 조음속도)와 발화당 쉼 빈도, 쉼 지속시간, 쉼의 실현 위치를 살펴보았다. 국립국어원에서 배포하는 오픈 코퍼스인 서울말 낭독 발화 말뭉치에서 청년층, 장년층, 노년층 각 10명씩 총 30명 화자의 발화를 선별해 말 산출의 시간적 특성을 분석하였다. 그 결과, 전체 말속도, 조음속도, 전체 쉼 빈도, 어절 간 쉼 빈도, 전체 쉼 지속시간, 어절 간 쉼 지속시간에 집단 간 유의한 차이가 발생했다. 사후 검정 결과, 장년층이 청년층보다, 노년층이 청년층보다 느린 말속도, 잦은 쉼 빈도, 긴 쉼 지속시간을 보였다. 반면 정상 성인에게서는 부적절한 쉼인 어절 내 쉼 빈도, 어절 내 쉼 지속시간에는 집단 간 유의한 차이가 없었다. 이중 청년층과 노년층을 유의하게 구별하는 변수는 전체 말속도로 나타났다. 노년층이 한 번 쉼을 가질 때 청·장년층과 비슷한 길이지만, 훨씬 더 빈번하게 가진다는 것을 보여주었다. 이러한 결과는 연령세대에 따라 말 산출의 시간적 특성에 변화가 나타난다는 것을 시사한다.

창업지원정책이 기업가정신에 미치는 영향: 중소벤처기업부 팁스(TIPS) 지원사업을 중심으로 (The Effect of Startup Support Policy on Entrepreneurship: Focusing on TIPS Support Projects by the Ministry of SMEs and Startups)

  • 김미주
    • 벤처창업연구
    • /
    • 제17권3호
    • /
    • pp.1-17
    • /
    • 2022
  • 본 연구는 중소벤처기업부 팁스(TIPS) 지원사업이 팁스 창업기업의 기업가정신에 미치는 영향에 대해 연구하였다. 연구대상에 해당하는 팁스 창업기업은 팁스(TIPS) 지원사업에 선정되어 사업화자금, 보육시설, 역량강화 프로그램에 모두 참가하였고, 민간투자 유치까지 받은 기업으로 선정하였다. 팁스 창업기업 13개사를 대상으로 2022년 1월 14일부터 2022년 3월 11일까지 약 8주간 1:1 심층 인터뷰를 진행하였다. 본 연구를 위해 팁스(TIPS) 지원사업을 세분화하여 사업화자금, 보육시설, 역량강화 프로그램 그리고 민간투자 유치 총 4가지로 분류하였으며, 기업가정신 요인은 혁신성, 도전정신, 리더십, 위험감수 총 4가지로 구분하였다. 심층 인터뷰 결과, 팁스(TIPS) 지원사업이 기업가 정신 요소에 미치는 영향력은 도전정신, 혁신성, 위험감수, 리더십 순으로 나타났다. 구체적으로 살펴보면 사업화자금은 혁신성과 위험감수, 보육시설은 도전정신과 위험감수, 역량강화 프로그램은 도전정신과 리더십, 민간투자 유치는 혁신성과 도전정신에 영향력을 미치는 것으로 나타났다. 본 연구의 시사점은 민간투자 주도형 기술창업지원 프로그램인 팁스(TIPS) 지원사업이 2013년 도입 후 2022년 3월 말 기준으로 약 10년 차를 맞이하였으며, 그간 민간투자실적, 고용률 등 가시적인 성과 중심으로 보고서가 작성되었다. 또한, 본 연구를 통해 팁스(TIPS) 지원사업이 팁스 창업기업에게 기업가정신 함양에 기여했는지를 분석해봄으로써 양적 성장뿐 아니라 질적 성장에도 긍정적인 영향력을 미치고 있다는 것을 알 수 있었다.

시청각 화자식별에서 신뢰성 기반 정보 통합 방법의 성능 향상 (Improvement of Reliability based Information Integration in Audio-visual Person Identification)

  • ;김진영;홍준희
    • 대한음성학회지:말소리
    • /
    • 제62호
    • /
    • pp.149-161
    • /
    • 2007
  • In this paper we proposed a modified reliability function for improving bimodal speaker identification(BSI) performance. The convectional reliability function, used by N. Fox[1], is extended by introducing an optimization factor. We evaluated the proposed method in BSI domain. A BSI system was implemented based on GMM and it was tested using VidTIMIT database. Through speaker identification experiments we verified the usefulness of our proposed method. The experiments showed the improved performance, i.e., the reduction of error rate by 39%.

  • PDF

음성정보처리기술 응용서비스

  • 구명완;김재인
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.17-24
    • /
    • 2004
  • 음성정보처리 기술은 사람의 말을 음향, 언어, 심리학 및 공학적인 측면에서 연구하여 사람과 기계사이의 인터페이스를 자연스럽게 하는 것을 목표로 하고 있으며, 음성인식, 음성합성 및 언어처리 기술로 이루어져 있다. 음성인식기술이란 사람의 말을 이해하는 것뿐만 아니라 화자를 식별하고 인증하는 기술도 포함하고 있으며, 음성합성 기술이란 문자로부터 음성을 생성하는 기술을 의미한다. 그리고 언어처리 기술은 음성인식, 음성합성기술 속에 포함될 수 있으나 최근 마크업 언어를 활용하여 음성인식, 합성 등을 제어하는 경향이 도래함에 따라 언어처리 기술을 따로 분류하기도 한다[1][2].(중략)

  • PDF

LPC cepstrum 과 집단화를 이용한 한국어 고립단어 인식에 관한 연구 (The study on Korean isolated-word recognition using LPC cepstrum and clustering)

  • 김진영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1987년도 학술발표회 논문집
    • /
    • pp.70-74
    • /
    • 1987
  • 본 논문은 화자독립 고립단어 인식에 있어서 LP 모델의 문제점과 그 해결 방안으로서 cepstrum 영역에 있어서 lifter를 이용한 해결에 대해서 고찰하였다. 한편, 각 인식 단어의 기준 패턴을 구하기 위한 방법으로서 집단화의 방법에 대해 논하였다. 집단화의 방법으로서는 UWA 방법과 K-iteration 방법을 변형시킨 KMA 방법을 제시 비교하였다. 인식 실험결과 정현파 lifter와 KMA의 집단화 방법을 사용하였을 때 95%의 최고 인식률을 보였다.

  • PDF

전화망을 위한 어구 종속 화자 확인 시스템 (Text-dependent Speaker Verification System Over Telephone Lines)

  • 김유진;정재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.663-667
    • /
    • 1999
  • In this paper, we review the conventional speaker verification algorithm and present the text-dependent speaker verification system for application over telephone lines and its result of experiments. We apply blind-segmentation algorithm which segments speech into sub-word unit without linguistic information to the speaker verification system for training speaker model effectively with limited enrollment data. And the World-mode] that is created from PBW DB for score normalization is used. The experiments are presented in implemented system using database, which were constructed to simulate field test, and are shown 3.3% EER.

  • PDF