• Title/Summary/Keyword: 인식률 향상

Search Result 906, Processing Time 0.034 seconds

On a Study of the Improvement of Speech Recognition with Formant Information (포만트 정보를 이용한 음성인식률 개선에 관한 연구)

  • 신동성;이윤주;송종희;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2000.06d
    • /
    • pp.88-91
    • /
    • 2000
  • 개인용 컴퓨터가 멀티미디어 환경으로 변함에 따라서 인식률 향상과 처리시간 단축을 요구하고 있다. 본 논문은 기준패턴의 수가 증가함에 따라 발생하는 처리시간 증가 문제의 해결과 인식률 향상에 관한 것이다. 기준패턴의 수를 줄이기 위한 방법으로 각 모음별 포만트 정보를 구한 뒤 시험패턴과 비교할 후보자를 미리 정하여 인식률을 향상시키는 방법을 제안하고자 한다. 위와 같은 방법으로 모의 실험한 결과 전체 시스템 인식률이 기존의 방법에 비하여 0.5% 정도 향상되었고, 처리시간은 10%정도 감소하였다.

  • PDF

On a Study of Relation Between Glottal Spectrum and Speaker Identification Parameter (Glottal Spectrum 과 화자식별 Parameter와의 상관 관계에 관한 연구)

  • 이윤주;신동성;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.793-796
    • /
    • 2001
  • 음성인식 시스템은 인간의 의사소통 수단인 음성을 기계가 인지할 수 있게 하는 것이다. 이러한 음성 인식 알고리즘 개발은 현재 활발히 진행되고 있다. 올바른 음성인식 시스템의 구현을 위해서는 높은 인식률 구현과 적은 처리시간이 요구된다. 또한 인식률 향상을 위해서는 그 구현 알고리즘이 복잡해지고 이에 따라 많은 처리 시간이 요구된다. 본 논문에서는 성문 특성에 따른 Glottal Spectrum에 적응적인 필터계수를 적용하여 인식률 향상을 도모하였다. 제안한 알고리즘을 모의 실험한 결과 전체 인식률이 2% 향상되었다.

  • PDF

Bayesian Method Recognition Rates Improvement using HMM Vocabulary Recognition Model Optimization (HMM 어휘 인식 모델 최적화를 이용한 베이시안 기법 인식률 향상)

  • Oh, Sang Yeon
    • Journal of Digital Convergence
    • /
    • v.12 no.7
    • /
    • pp.273-278
    • /
    • 2014
  • In vocabulary recognition using HMM(Hidden Markov Model) by model for the observation of a discrete probability distribution indicates the advantages of low computational complexity, but relatively low recognition rate. Improve them with a HMM model is proposed for the optimization of the Bayesian methods. In this paper is posterior distribution and prior distribution in recognition Gaussian mixtures model provides a model to optimize of the Bayesian methods vocabulary recognition. The result of applying the proposed method, the recognition rate of 97.9% in vocabulary recognition, respectively.

Improving Video Quality with Bitrate Control and Visual Recognition in H.264/AVC (H.264/AVC에서 비트율 제어와 시각 인지도를 고려한 영상화질 개선 기법)

  • Ahn, Soomin;Kim, Kangseok;Kim, Jai-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.971-974
    • /
    • 2014
  • H.264/AVC 영상 부호화기의 비트율(Bitrate) 제어에 사람의 눈에 잘 인식되는 부분의 화질을 향상하고 인식률이 낮은 부분의 화질을 낮추어 상대적으로 향상된 화질을 얻기 위한 방법을 연구하였다. 먼저 H.264/AVC 영상 부호화기에서, 장면 변화로 인한 참조 프레임의 비트 낭비를 막기 위해 GOP(Group of Pictures) 단위로 장면 변화를 검출한 후, 검출된 장면 변화에 대해 GOP를 적용 시킨다. 해당 GOP 내에서 시각 인지도에 기초하여 물체의 움직임으로 인한 인식률이 높은 부분을 검출하고, 인식률이 높은 부분에 대해 QP(Quantization Parameter)의 재분배로 비트율을 높임으로써 화질을 향상시키고, 인식률이 낮은 부분에 대해서는 비트율을 적게 분배한다. 그 결과 한정된 대역폭을 갖는 전송 환경에서 영상을 향상된 화질로 이용할 수 있는 방법을 제안한다.

Online Cursive Handwriting Character Recognition Using a Bitmap Parameter (비트맵 파라미터를 이용한 온라인 필기체 문자인식)

  • 석수영;김민정;정호열;정현열
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.421-424
    • /
    • 2001
  • 개별적인 인식기를 하나의 단일 인식 시스템으로 구성하여 음성과 문자를 인식할 수 있는 공용인식시스템의 성능향상을 위해 온라인 필기에서 전역적인 정보를 추출할 수 있는 비트맵 파라미터 추출 방법을 제안하였다. 제안된 방식에서는 고속의 파라미터 추출을 위해 보간법을 이용한 재샘플링 과정 대신에 새로운 시간열을 구성하는 방식을 이용한다. 제안한 비트맵 파라미터를 본 연구실에서 개발한 음성/문자 공용인식 시스템에 적용하기 위하여 67개의 자소를 5상태 10천이 CHMM(Continuous Hidden Markov Model)모델로 구성한 다음 인식알고리즘으로서는 상태단위로 지속 시간 정보를 제어하는 OnePassDP법을 이용하였다. 실험결과, 제안한 방법을 이용한 경우, 자소인식률은 61.3%에서 85.3%로 24%의 인식률 향상을 가져왔으며, 글자인식률은 64.3%에서 82.2%로 17.9%의 인식률 향상을 가져와 제안한 방법의 유효성을 확인할 수 있었다.

  • PDF

Compensation Method for Improvement of Speech Recognition in Wireless Communication Network (무선 통신망에서 음성인식률 개선을 위한 보상기법 연구)

  • Seo Jin-Ho;Park Ho-Chong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.65-68
    • /
    • 2004
  • 이동통신 기술의 발전으로 이동통신 사용이 폭발적으로 증가하였고 그에 따라 이동통신망을 이용한 많은 서비스가 제공되고 있다. 이동통신망에서의 음성 인식 서비스에서 음성 인식기에 입력되는 음성신호는 통신망을 통해 음성 압축기를 거치게 되고 이에 음성신호가 왜곡되어 인식기의 인식성능이 저하된다. 본 논문에서는 무선통신 환경에서 음성인식기의 성능을 개선하기 위한 보상 방법을 제안한다. 기존의 제안된 방법은 음성 데이터에 의존하는 방법을 사용하나 본 논문에서는 음성 데이터와는 독립적 방법인 음성 압축기에 의해 손상된 입력 신호의 스펙트럼 보상방법과 Cepstrum 보정방법을 통해 인식률을 향상시키는 방법을 제안한다. 즉, 음성 압축기에 의하여 왜곡된 스펙트럼을 단계적 방법으로 보상하고 그를 토대로 왜곡된 신호에서 만들어진 Cepstrum을 보정하여 음성 인식기의 성능을 향상시키는 방법을 연구하였으며, 그 견과 손상된 음성신호의 인식률 $64.88\%$에 대하여, 본 논문에서 제안하는 보상 방법을 적용한 음성신호의 인식률은 $79.73\%$로서 $14.85\%$가 향상된 결과를 얻을 수 있었다.

  • PDF

Word Recognition Using K-L Dynamic Coefficients (K-L 동적 계수를 이용한 단어 인식)

  • 김주곤
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.103-106
    • /
    • 1998
  • 본 논문에서는 음성인식 시스템의 인식 정도의 향상을 위해서 동적 특징으로서 K-L(Karhanen-Loeve)계수를 이용하여 음소모델을 구성하는 방법을 제안하고, 음소, 단어, 숫자음 인식 실험을 통하여 그 유효성을 검토하였다. 인식 실험을 위한 음성자료는 한국 전자통신 연구소에서 채록한 445단어와 국어정보공학연구소에서 채록한 4연속 숫자음을 사용하였으며, K-L계수 동적 특징의 유효성을 확인하기 위해 정적 특징으로서 멜-켑스트럼과 동적 특징으로서 K-L계수 및 회귀계수를 추출한 후 음소, 단어, 숫자음 인식 실험을 수행하였다. 인식의 기본 단위로는 48개의 유사음소단위(Phoneme Likely Unite ; PLUs)를 음소모델로 사용하였으며, 단어와 숫자음 인식을 위해서는 유한상태 오토마타(Finite State Automata; FSA)에 의한 구문제어를 통한 OPDP(One Pass Dynamic Programming)법을 이용하였다. 인식 실험 결과, 음소인식에 있어서는 정적특징인 멜-켑스트럼을 사용한 경우 39.8%, K-L 동적 계수를 사용한 경우가 52.4%로 12.6%의 향상된 인식률을 얻었다. 또한, 멜-켑스트럼과 회수계수를 사용한 경우 60.1%, K-L계수와 회귀계수를 결합한 경우에 있어서도 60.4%로 높은 인식률은 얻었다. 이 결과를 단어인식에 확장하여 인식 실험을 수행한 결과, 기존의 멜-켑스트럼 계수를 사용한 경우 65.5%, K-L계수를 사용한 경우 75.8%로 10.3% 향상된 인식률을 얻었으며, 멜-켑스트럼과 회귀계수를 결합한 경우 91.2%, K-L계수와 회귀계수를 결합한 경우 91.4%의 높은 인식률을 보였다. 도한, 4연속 숫자음에 적용한 경우에 있어서도 멜-켑스트럼을 사용한 경우 67.5%, K-L계수를 사용한 경우 75.3%로 7.8%의 향상된 인식률을 보였으며 K-L계수와 회귀계수를 결합한 경우에서도 비교적 높은 인식률을 보여 숫자음에 대해서도 K-L계수의 유효성을 확인할 수 있었다.

  • PDF

Noise Removal using a Convergence of the posteriori probability of the Bayesian techniques vocabulary recognition model to solve the problems of the prior probability based on HMM (HMM을 기반으로 한 사전 확률의 문제점을 해결하기 위해 베이시안 기법 어휘 인식 모델에의 사후 확률을 융합한 잡음 제거)

  • Oh, Sang-Yeob
    • Journal of Digital Convergence
    • /
    • v.13 no.8
    • /
    • pp.295-300
    • /
    • 2015
  • In vocabulary recognition using an HMM model which models the prior distribution for the observation of a discrete probability distribution indicates the advantages of low computational complexity, but relatively low recognition rate. The Bayesian techniques to improve vocabulary recognition model, it is proposed using a convergence of two methods to improve recognition noise-canceling recognition. In this paper, using a convergence of the prior probability method and techniques of Bayesian posterior probability based on HMM remove noise and improves the recognition rate. The result of applying the proposed method, the recognition rate of 97.9% in vocabulary recognition, respectively.

Robust Speech Recognition Using Independent Component Analysis (독립성분분석을 이용한 강인한 음성인식)

  • 임형규;이창기
    • Journal of the Korea Computer Industry Society
    • /
    • v.5 no.2
    • /
    • pp.269-274
    • /
    • 2004
  • Noisy speech recognition is one of most important problems in speech recognition. In this paper, a method which efficiently removes the mixed noise with speech, is proposed. The proposed method is based on the ICA to separate the mixed noise. ICA(Independent component analysis) is a signal processing technique, whose goal is to express a set of random variables as linear combinations of components that are statistically as independent from each other as possible.

  • PDF

The research on the MEMS device improvement which is necessary for the noise environment in the speech recognition rate improvement (잡음 환경에서 음성 인식률 향상에 필요한 MEMS 장치 개발에 관한 연구)

  • Yang, Ki-Woong;Lee, Hyung-keun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.22 no.12
    • /
    • pp.1659-1666
    • /
    • 2018
  • When the input sound is mixed voice and sound, it can be seen that the voice recognition rate is lowered due to the noise, and the speech recognition rate is improved by improving the MEMS device which is the H / W device in order to overcome the S/W processing limit. The MEMS microphone device is a device for inputting voice and is implemented in various shapes and used. Conventional MEMS microphones generally exhibit excellent performance, but in a special environment such as noise, there is a problem that the processing performance is deteriorated due to a mixture of voice and sound. To overcome these problems, we developed a newly designed MEMS device that can detect the voice characteristics of the initial input device.