• 제목/요약/키워드: 인식률 향상

검색결과 906건 처리시간 0.023초

포만트 정보를 이용한 음성인식률 개선에 관한 연구 (On a Study of the Improvement of Speech Recognition with Formant Information)

  • 신동성;이윤주;송종희;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(4)
    • /
    • pp.88-91
    • /
    • 2000
  • 개인용 컴퓨터가 멀티미디어 환경으로 변함에 따라서 인식률 향상과 처리시간 단축을 요구하고 있다. 본 논문은 기준패턴의 수가 증가함에 따라 발생하는 처리시간 증가 문제의 해결과 인식률 향상에 관한 것이다. 기준패턴의 수를 줄이기 위한 방법으로 각 모음별 포만트 정보를 구한 뒤 시험패턴과 비교할 후보자를 미리 정하여 인식률을 향상시키는 방법을 제안하고자 한다. 위와 같은 방법으로 모의 실험한 결과 전체 시스템 인식률이 기존의 방법에 비하여 0.5% 정도 향상되었고, 처리시간은 10%정도 감소하였다.

  • PDF

Glottal Spectrum 과 화자식별 Parameter와의 상관 관계에 관한 연구 (On a Study of Relation Between Glottal Spectrum and Speaker Identification Parameter)

  • 이윤주;신동성;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.793-796
    • /
    • 2001
  • 음성인식 시스템은 인간의 의사소통 수단인 음성을 기계가 인지할 수 있게 하는 것이다. 이러한 음성 인식 알고리즘 개발은 현재 활발히 진행되고 있다. 올바른 음성인식 시스템의 구현을 위해서는 높은 인식률 구현과 적은 처리시간이 요구된다. 또한 인식률 향상을 위해서는 그 구현 알고리즘이 복잡해지고 이에 따라 많은 처리 시간이 요구된다. 본 논문에서는 성문 특성에 따른 Glottal Spectrum에 적응적인 필터계수를 적용하여 인식률 향상을 도모하였다. 제안한 알고리즘을 모의 실험한 결과 전체 인식률이 2% 향상되었다.

  • PDF

HMM 어휘 인식 모델 최적화를 이용한 베이시안 기법 인식률 향상 (Bayesian Method Recognition Rates Improvement using HMM Vocabulary Recognition Model Optimization)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제12권7호
    • /
    • pp.273-278
    • /
    • 2014
  • HMM(Hidden Markov Model)을 이용한 어휘 인식에서 인식 어휘의 모델들의 대한 인식 확률이 이산적인 분포를 나타내며 인식을 위한 계산량이 적은 장점이 있지만 인식률을 계산했을 때 상대적으로 낮은 단점이 있다. 이를 개선하기 위하여 HMM(Hidden Markov Model) 모델 최적화를 이용한 베이시안 기법 인식률 향상을 제안한다. 본 논문은 HMM 어휘 인식에서 인식을 위한 모델 구성을 가우시안 믹스쳐 모델로 최적화한 인식 모델을 생성하였으며 베이시안 기법인 사전확률과 사후확률을 이용한 인식률을 향상시켰다. 본 논문에서 제안한 방법을 적용한 결과 어휘인식률에서 97.9%의 인식률을 나타내었다.

H.264/AVC에서 비트율 제어와 시각 인지도를 고려한 영상화질 개선 기법 (Improving Video Quality with Bitrate Control and Visual Recognition in H.264/AVC)

  • 안수민;김강석;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.971-974
    • /
    • 2014
  • H.264/AVC 영상 부호화기의 비트율(Bitrate) 제어에 사람의 눈에 잘 인식되는 부분의 화질을 향상하고 인식률이 낮은 부분의 화질을 낮추어 상대적으로 향상된 화질을 얻기 위한 방법을 연구하였다. 먼저 H.264/AVC 영상 부호화기에서, 장면 변화로 인한 참조 프레임의 비트 낭비를 막기 위해 GOP(Group of Pictures) 단위로 장면 변화를 검출한 후, 검출된 장면 변화에 대해 GOP를 적용 시킨다. 해당 GOP 내에서 시각 인지도에 기초하여 물체의 움직임으로 인한 인식률이 높은 부분을 검출하고, 인식률이 높은 부분에 대해 QP(Quantization Parameter)의 재분배로 비트율을 높임으로써 화질을 향상시키고, 인식률이 낮은 부분에 대해서는 비트율을 적게 분배한다. 그 결과 한정된 대역폭을 갖는 전송 환경에서 영상을 향상된 화질로 이용할 수 있는 방법을 제안한다.

비트맵 파라미터를 이용한 온라인 필기체 문자인식 (Online Cursive Handwriting Character Recognition Using a Bitmap Parameter)

  • 석수영;김민정;정호열;정현열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.421-424
    • /
    • 2001
  • 개별적인 인식기를 하나의 단일 인식 시스템으로 구성하여 음성과 문자를 인식할 수 있는 공용인식시스템의 성능향상을 위해 온라인 필기에서 전역적인 정보를 추출할 수 있는 비트맵 파라미터 추출 방법을 제안하였다. 제안된 방식에서는 고속의 파라미터 추출을 위해 보간법을 이용한 재샘플링 과정 대신에 새로운 시간열을 구성하는 방식을 이용한다. 제안한 비트맵 파라미터를 본 연구실에서 개발한 음성/문자 공용인식 시스템에 적용하기 위하여 67개의 자소를 5상태 10천이 CHMM(Continuous Hidden Markov Model)모델로 구성한 다음 인식알고리즘으로서는 상태단위로 지속 시간 정보를 제어하는 OnePassDP법을 이용하였다. 실험결과, 제안한 방법을 이용한 경우, 자소인식률은 61.3%에서 85.3%로 24%의 인식률 향상을 가져왔으며, 글자인식률은 64.3%에서 82.2%로 17.9%의 인식률 향상을 가져와 제안한 방법의 유효성을 확인할 수 있었다.

  • PDF

무선 통신망에서 음성인식률 개선을 위한 보상기법 연구 (Compensation Method for Improvement of Speech Recognition in Wireless Communication Network)

  • 서진호;박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.65-68
    • /
    • 2004
  • 이동통신 기술의 발전으로 이동통신 사용이 폭발적으로 증가하였고 그에 따라 이동통신망을 이용한 많은 서비스가 제공되고 있다. 이동통신망에서의 음성 인식 서비스에서 음성 인식기에 입력되는 음성신호는 통신망을 통해 음성 압축기를 거치게 되고 이에 음성신호가 왜곡되어 인식기의 인식성능이 저하된다. 본 논문에서는 무선통신 환경에서 음성인식기의 성능을 개선하기 위한 보상 방법을 제안한다. 기존의 제안된 방법은 음성 데이터에 의존하는 방법을 사용하나 본 논문에서는 음성 데이터와는 독립적 방법인 음성 압축기에 의해 손상된 입력 신호의 스펙트럼 보상방법과 Cepstrum 보정방법을 통해 인식률을 향상시키는 방법을 제안한다. 즉, 음성 압축기에 의하여 왜곡된 스펙트럼을 단계적 방법으로 보상하고 그를 토대로 왜곡된 신호에서 만들어진 Cepstrum을 보정하여 음성 인식기의 성능을 향상시키는 방법을 연구하였으며, 그 견과 손상된 음성신호의 인식률 $64.88\%$에 대하여, 본 논문에서 제안하는 보상 방법을 적용한 음성신호의 인식률은 $79.73\%$로서 $14.85\%$가 향상된 결과를 얻을 수 있었다.

  • PDF

K-L 동적 계수를 이용한 단어 인식 (Word Recognition Using K-L Dynamic Coefficients)

  • 김주곤
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.103-106
    • /
    • 1998
  • 본 논문에서는 음성인식 시스템의 인식 정도의 향상을 위해서 동적 특징으로서 K-L(Karhanen-Loeve)계수를 이용하여 음소모델을 구성하는 방법을 제안하고, 음소, 단어, 숫자음 인식 실험을 통하여 그 유효성을 검토하였다. 인식 실험을 위한 음성자료는 한국 전자통신 연구소에서 채록한 445단어와 국어정보공학연구소에서 채록한 4연속 숫자음을 사용하였으며, K-L계수 동적 특징의 유효성을 확인하기 위해 정적 특징으로서 멜-켑스트럼과 동적 특징으로서 K-L계수 및 회귀계수를 추출한 후 음소, 단어, 숫자음 인식 실험을 수행하였다. 인식의 기본 단위로는 48개의 유사음소단위(Phoneme Likely Unite ; PLUs)를 음소모델로 사용하였으며, 단어와 숫자음 인식을 위해서는 유한상태 오토마타(Finite State Automata; FSA)에 의한 구문제어를 통한 OPDP(One Pass Dynamic Programming)법을 이용하였다. 인식 실험 결과, 음소인식에 있어서는 정적특징인 멜-켑스트럼을 사용한 경우 39.8%, K-L 동적 계수를 사용한 경우가 52.4%로 12.6%의 향상된 인식률을 얻었다. 또한, 멜-켑스트럼과 회수계수를 사용한 경우 60.1%, K-L계수와 회귀계수를 결합한 경우에 있어서도 60.4%로 높은 인식률은 얻었다. 이 결과를 단어인식에 확장하여 인식 실험을 수행한 결과, 기존의 멜-켑스트럼 계수를 사용한 경우 65.5%, K-L계수를 사용한 경우 75.8%로 10.3% 향상된 인식률을 얻었으며, 멜-켑스트럼과 회귀계수를 결합한 경우 91.2%, K-L계수와 회귀계수를 결합한 경우 91.4%의 높은 인식률을 보였다. 도한, 4연속 숫자음에 적용한 경우에 있어서도 멜-켑스트럼을 사용한 경우 67.5%, K-L계수를 사용한 경우 75.3%로 7.8%의 향상된 인식률을 보였으며 K-L계수와 회귀계수를 결합한 경우에서도 비교적 높은 인식률을 보여 숫자음에 대해서도 K-L계수의 유효성을 확인할 수 있었다.

  • PDF

HMM을 기반으로 한 사전 확률의 문제점을 해결하기 위해 베이시안 기법 어휘 인식 모델에의 사후 확률을 융합한 잡음 제거 (Noise Removal using a Convergence of the posteriori probability of the Bayesian techniques vocabulary recognition model to solve the problems of the prior probability based on HMM)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권8호
    • /
    • pp.295-300
    • /
    • 2015
  • 사전 확률분포를 모델링하는 HMM을 사용하는 어휘 인식에서 인식 어휘의 모델들의 대한 인식 확률이 이산적인 분포를 나타내며 인식을 위한 계산량이 적은 장점이 있지만 인식률을 계산했을 때 상대적으로 낮은 단점이 있다. 이를 개선하기 위하여 베이시안 기법 어휘 인식 모델을 융합한 잡음 제거 인식률 향상을 제안한다. 본 논문은 베이시안 기법 어휘 인식을 위한 모델 구성을 베이시안 기법의 최적화한 인식 모델을 구성하였다. HMM을 기반으로 한 사전 확률 방법과 베이시안 기법인 사후확률을 융합하여 잡음을 제거하고 인식률을 향상시켰다. 본 논문에서 제안한 방법을 적용한 결과 어휘 인식률에서 98.1%의 인식률을 나타내었다.

독립성분분석을 이용한 강인한 음성인식 (Robust Speech Recognition Using Independent Component Analysis)

  • 임형규;이창기
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권2호
    • /
    • pp.269-274
    • /
    • 2004
  • 기존 음성 인식의 실세계 적용에서 큰 문제점은 잡음이다. 본 논문에서는 잡음이 섞인 음성 신호로부터 잡음 성분을 분리해 내는 방법을 제안한다. 이 방법은 잡음이 섞인 음성 신호에 독립성분분석(ICA:Independent Component Analysis)을 사용한 암묵신호 분리(blind source separation)를 적용하여 잡음 성분을 제거하게 된다. 잡음이 혼합된 음성 신호에 독립성분분석을 전처리(preprocessing) 과정에 이용함으로써 인식성능을 향상시킬 수 있다. 깨끗한 음성 신호에 음악과 거리잡음을 섞었을 경우 인식률이 잡음 없는 음성의 인식률보다 각각 최대 14.98%, 13.78%까지 저하되었다. 그러나 독립성분분석으로 복원된 음성의 경우 잡음 없는 음성의 인식률 수준(각각 97.39%, 96.49%)으로 나타났으며, 독립성분분석을 이용한 음성의 잡음 제거가 인식률 향상에 좋은 결과를 가져옴을 확인 할 수 있다.

  • PDF

잡음 환경에서 음성 인식률 향상에 필요한 MEMS 장치 개발에 관한 연구 (The research on the MEMS device improvement which is necessary for the noise environment in the speech recognition rate improvement)

  • 양기웅;이형근
    • 한국정보통신학회논문지
    • /
    • 제22권12호
    • /
    • pp.1659-1666
    • /
    • 2018
  • 입력된 소리가 음성과 음향이 혼재된 경우 잡음의 영향으로 음성 인식률이 저하됨을 알 수 있으며 S/W적 처리 한계를 극복코자 H/W 장치인 MEMS 장치를 개발하여 음성 인식률을 향상시켰다. MEMS 마이크로폰 장치는 음성을 입력하는 장치로서 다양한 모양으로 구현되어 사용된다. 기존 MEMS 마이크로폰은 일반적으로 우수한 성능을 발휘하나 잡음 과 같은 특수 환경에선 음성과 음향이 혼재되어 처리 성능이 저하되는 문제점이 발생됨을 알 수 있었다. 이러한 문제점을 개선코자 초기 입력장치에 음성 특성을 구분하여 검출할 수 있는 신규 고안된 MEMS 장치를 사용하여 향상시켰다.