• 제목/요약/키워드: Recognition Improvement

검색결과 1,496건 처리시간 0.036초

베이시안 기법과 선택적 음성특징 추출을 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using the Convergence of Bayesian method and Selective Speech Feature)

  • 황재천
    • 한국융합학회논문지
    • /
    • 제7권6호
    • /
    • pp.7-11
    • /
    • 2016
  • 일반적인 어휘 인식 시스템은 백색 잡음과 음성을 인식하는 환경에서 여러 음성의 혼재되어 정확한 음성을 인식하지 못하고 있다. 따라서 본 논문은 효율적인 음성 인식을 위해 잡음 음성으로 부터 원하는 음성만 선택적으로 추출하기 위한 방법과 베이시안 기법을 융합 방법을 제안한다. 음성의 선택적 추출을 위해 필터 뱅크 주파수 응답 계수를 사용한다. 하며, 이를 위해 모든 가능한 두 관측치의 조합에 대해 변수 관측치를 사용하며, 음성 신호 정보를 가지고 선택적 음성 특징 추출을 위해 잡음은 출력에 대한 에너지 비율을 구한다. 이것은 음성 특징을 추출하는 방법을 제안하며, 이를 베이시안 기법의 어휘 인식을 융합하여 잡음을 제거하고 인식률을 향상시켰다. 본 논문에서 기존의 HMM과 CHMM 방법과 비교한 결과 잡음 환경에서의 인식률이 2.3% 향상됨을 확인하였다.

지정맥 인식을 위한 특징 검출 알고리즘 개발 (Development of Feature Extraction Algorithm for Finger Vein Recognition)

  • 김태훈;이상준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권9호
    • /
    • pp.345-350
    • /
    • 2018
  • 본 연구는 지정맥 인식에 중요한 정맥 패턴 특징검출을 위한 알고리즘이다. 특징검출 알고리즘은 패턴인식 시 인식결과에 많은 영향을 끼치므로 중요하다. 인식률은 손가락 위치 변화에 따라 기준도 변화되므로 저하되는 특징을 가지고 있다. 또한, 손가락에 적외선 광을 조사하여 획득한 영상은 영상 배경과 혈관 패턴을 분리하기에 어렵고, 영상 전처리과정을 수행하므로 검출시간이 증대되는 특징을 가지고 있다. 이를 위해, 제시하는 알고리즘은 영상 전처리과정이 없이 수행되어 검출 시간을 줄일 수 있고, 지정맥 영상에 SWDA(Shifted Waveform Data Analysis) 알고리즘을 적용하여 손가락 마디 위치 및 정맥 패턴 검출이 가능한 특징을 가지고 있다. 적외선 투과율이 낮아 상대적으로 어두운 정맥 영상도 검출 오류 최소화가 가능한 특징을 보였다. 또한, 손가락 마디 위치는 분류 단계에서 기준으로 활용하면 인식률 저하를 보완할 수 있는 특징을 가지고 있다. 추후 손바닥, 손목 등 신체 여러 인식분야에 제안하는 알고리즘을 적용한다면 생체 특징 검출 정확도 향상 및 인식 수행 시간 감소에 기여할 것으로 기대된다.

A Study on Design and Implementation of Speech Recognition System Using ART2 Algorithm

  • Kim, Joeng Hoon;Kim, Dong Han;Jang, Won Il;Lee, Sang Bae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권2호
    • /
    • pp.149-154
    • /
    • 2004
  • In this research, we selected the speech recognition to implement the electric wheelchair system as a method to control it by only using the speech and used DTW (Dynamic Time Warping), which is speaker-dependent and has a relatively high recognition rate among the speech recognitions. However, it has to have small memory and fast process speed performance under consideration of real-time. Thus, we introduced VQ (Vector Quantization) which is widely used as a compression algorithm of speaker-independent recognition, to secure fast recognition and small memory. However, we found that the recognition rate decreased after using VQ. To improve the recognition rate, we applied ART2 (Adaptive Reason Theory 2) algorithm as a post-process algorithm to obtain about 5% recognition rate improvement. To utilize ART2, we have to apply an error range. In case that the subtraction of the first distance from the second distance for each distance obtained to apply DTW is 20 or more, the error range is applied. Likewise, ART2 was applied and we could obtain fast process and high recognition rate. Moreover, since this system is a moving object, the system should be implemented as an embedded one. Thus, we selected TMS320C32 chip, which can process significantly many calculations relatively fast, to implement the embedded system. Considering that the memory is speech, we used 128kbyte-RAM and 64kbyte ROM to save large amount of data. In case of speech input, we used 16-bit stereo audio codec, securing relatively accurate data through high resolution capacity.

다층회귀신경예측 모델 및 HMM 를 이용한 임베디드 음성인식 시스템 개발에 관한 연구 (A Study on Development of Embedded System for Speech Recognition using Multi-layer Recurrent Neural Prediction Models & HMM)

  • 김정훈;장원일;김영탁;이상배
    • 한국지능시스템학회논문지
    • /
    • 제14권3호
    • /
    • pp.273-278
    • /
    • 2004
  • 본 논문은 주인식기로 흔히 사용되는 HMM 인식 알고리즘을 보완하기 위한 방법으로 회귀신경회로망(Recurrent neural networks : RNN)을 적용하였다. 이 회귀신경회로망 중에서 실 시간적으로 동작이 가능하게 한 방법인 다층회귀신경예측 모델 (Multi-layer Recurrent Neural Prediction Model : MRNPM)을 사용하여 학습 및 인식기로 구현하였으며, HMM과 MRNPM 을 이용하여 Hybrid형태의 주 인식기로 설계하였다. 설계된 음성 인식 알고리즘을 잘 구별되지 않는 한국어 숫자음(13개 단어)에 대해 화자 독립형으로 인식률 테스트 한 결과 기존의 HMM인식기 보다 5%정도의 인식률 향상이 나타났다. 이 결과를 이용하여 실제 DSP(TMS320C6711) 환경 내에서 최적(인식) 코드만을 추출하여 임베디드 음성 인식 시스템을 구현하였다. 마찬가지로 임베디드 시스템의 구현 결과도 기존 단독 HMM 인식시스템보다 향상된 인식시스템을 구현할 수 있게 되었다.

바이어스 보상과 차원별 Eigenvoice 모델 평균을 이용한 고속화자적응의 성능향상 (Performance Improvement of Rapid Speaker Adaptation Using Bias Compensation and Mean of Dimensional Eigenvoice Models)

  • 박종세;김형순;송화전
    • 한국음향학회지
    • /
    • 제23권5호
    • /
    • pp.383-389
    • /
    • 2004
  • 본 논문에서는 훈련 및 인식 환경이 다른 상황에서 eigenvoice 기반 고속화자적응의 성능향상을 위하여 바이어스 보상을 적용한 eigenvoice 적응방식과 차원별 eigenvoice 모델 평균 가중합 방식을 제안하였다. PBW 452 DB를 사용한 어휘독립 단어인식 실험 결과에서 적은 양의 적응데이터를 사용했을 때 제안된 방식이 기존의 eigenvoice 방식에 비하여 많은 성능향상을 얻을 수 있었다. 적응단어 수를 1개에서 50개로 변경시키면서 바이어스 보상을 적용한 eigenvoice 적응방식을 사용한 경우 기존 eigenvoice 방식보다 단어 오인식률이 약 22∼30% 감소하였다. 또한 차원별 eigenvoice 모델 평균을 이용한 eigenvoice 적응방식에서는 1개의 단어를 적응데이터로 사용했을 경우에 기존 eigenvoice 방식보다 단어 오인식률이 최고 41%까지 감소하였다.

작업환경측정제도 규제 순응 실태 (Regulatory Compliance for the Working Environment Measurement System in Korea)

  • 변상훈;이관형;유계묵;피영규
    • 한국산업보건학회지
    • /
    • 제19권3호
    • /
    • pp.233-239
    • /
    • 2009
  • The regulatory recognition, regulatory approval, and observance for employer, inspector, and worker groups were investigated for the Korean measurement system in working environments. The employer, worker, and inspector showed an agreement of 90~97 % for the measurement of working environments. This survey showed that the measurement system of working environments has been settled in Korea. However, this survey showed an agreement of 81~87 % for reporting the results of working environment, involvement of worker representative, improvement of working environment, and holding presentations for working environment measurement. The employer recognized well for the measurement of working environments, involvement of worker representative, improvement of working environment, and holding presentations for working environment measurement, but the employee did not recognize well them as much as the employer did. Thus, the improvements for the recognition for involvement of worker representative, improvement of working environment, and holding presentations for working environment measurement by the employee are needed.

경주 지역 대학생의 황남빵에 대한 인식 및 개선 방향 (The Recognition and Improvement of the Hwangnamppang Available to University Students in the Gyeongju Area)

  • 이종숙;정인창
    • 동아시아식생활학회지
    • /
    • 제18권6호
    • /
    • pp.899-906
    • /
    • 2008
  • The purpose of this study was to investigate the recognition and need for improvement of the Hwangnamppang provided to university students in the Gyeongju area of Korea. To accomplish this, we surveyed 195 university students by questionnaire. The consumption frequency rate revealed that 49.7% of students consumed Hwangnamppang $1{\sim}2$ times a year, while 32.8% consumed it $2{\sim}3$ times per six months and 16.4% consumed it $1{\sim}3$ times a month. Furthermore, the results revealed that 45.6% of the students purchased Hwangnamppang to give as a present. Moreover, 55% of the respondents thought that Hwangnamppang was a suitable gift, but that it was too expensive. In addition, 47.7% of the respondents felt that there were not enough varieties of the product and 26.7% for factor that do not increase Hwangnamppang's consumption respond. Finally, 90% of the respondents felt that there was a need to diversify the red-bean paste used in Hwangnamppang, and felt that the best pieces contained chestnuts (3.66/5 score) or sweet potato (3.62/5 score). Overall, the results of this study revealed that Hwangnamppang requires further development to increase the varieties available and improve the overall acceptability.

  • PDF

병원직원의 의료시장개방에 대한 인식조사 (Study on Hospital Staff's Recognition toward Opening of Medical Services Market)

  • 류향진;유승흠;박은철;김정인;손태용
    • 한국병원경영학회지
    • /
    • 제11권3호
    • /
    • pp.56-72
    • /
    • 2006
  • This study aims to deal with hospital staff's recognition on the opening of the medical services market, their attitude to the opening - agreement and disagreement, and their intention to use a foreign hospital or to consult its doctors again. It was conducted for 450 employees of one university hospital located in Gyeonggi Province, Korea with systemized questionnaires. The main results of this study are as follows: First, Medical technicians showed the highest level recognition on the opening of the medical services market. Second, The percentage of agreement to the opening was the highest for medical technicians and lowest for doctors while that of agreement was the highest for doctors and lowest for nurses. For residents, among doctors, the percentage of disagreement was the lower than that of agreement. Third, the intention to use a foreign hospital and to consult its doctor again was the lowest for medical engineers and the highest for doctors. Fourth, The most urgent task for local hospitals to accomplish in response to the opening was the improvement of the diagnosis and treatment technologies for nurses, and the improvement of the service provided by the hospital staff for the others. For doctors, in particular, the improvement of the diagnosis and treatment technologies was just the fourth urgent task. In conclusion, the result varies to the type of occupation. Apparent difference was found for doctors, in particular, that seem to be directly affected by the opening of medical services market. Local hospitals and doctors, therefore, should make efforts together to improve the diagnosis and treatment technologies. All the hospital employees of every type of occupation, meanwhile, need to prepare for the opening with medical service of improved quality.

  • PDF

모수 추정을 위한 베이시안 기법과 바타차랴 알고리즘을 융합한 어휘 인식 성능 향상 (Vocabulary Recognition Performance Improvement using a convergence of Bayesian Method for Parameter Estimation and Bhattacharyya Algorithm Model)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권10호
    • /
    • pp.353-358
    • /
    • 2015
  • 어휘 인식 시스템은 학습 모델을 구성하여 인식하므로 구성되어진 모델에서 벗어난 어휘의 입력과 유사한 어휘의 입력은 인식하지 못하거나 유사한 어휘로 인식되어 인식률 저하가 나타난다. 이런 경우 인식 모델을 확장할 수 있도록 재구성하거나 인식 모델 구성 시 확장성을 반영하므로 해결할 수 있다. 본 논문에서는 모델 구성 시 확장성을 반영할 수 있는 모수 추정을 위한 베이시안 기법을 사용하여 바타차랴 알고리즘 음성 인식 학습 모델 구성 방법을 융합하여 제안하였다. 음소가 갖는 특징을 기반으로 학습 데이터의 음소에 모수 추정을 위한 베이시안 기법을 이용하였고 유사한 학습 모델은 바타챠랴 알고리즘을 이용하여 정확한 학습 모델로 인식하도록 하였다. 바타챠랴 알고리즘 인식 모델을 구성하여 인식 성능을 평가하였다. 본 논문에서 제안한 시스템을 적용한 결과 어휘 인식률에서 97.5%의 인식률과 1.2초의 학습 시간을 나타내었다.

SURF(Speeded Up Robust Features)와 Kalman Filter를 이용한 컬러 객체 추적 속도 향상 방법 (Improvement Method of Tracking Speed for Color Object using Kalman Filter and SURF)

  • 이희재;이상국
    • 한국멀티미디어학회논문지
    • /
    • 제15권3호
    • /
    • pp.336-344
    • /
    • 2012
  • 객체 인식(recognition)과 추적(tracking)은 컴퓨터 비전의 중요 분야로써 작게는 동작 인식으로부터 크게는 우주 항공까지 그 활용 가능성이 무궁무진하다. 객체 인식의 정확도를 향상시키는 방법 중 하나는 회전, 스케일 그리고 가려짐에 강건한 컬러를 이용하는 것이다. 컬러를 이용함으로써 더 많은 특징점들을 추출하기 위한 계산 비용을 감소시킬 수 있다. 또한, 빠른 객체 인식을 위해 알고리즘의 정확도를 낮추는 것보다 객체의 위치를 예측하고 좀 더 작은 영역에서 인식을 수행하는 것이 더욱 효과적이다. 본 논문은, 인식 정확도를 향상시키기 위해 대표적인 객체 인식 알고리즘인 SURF와 컬러모델을 적용한 기술자(descriptor)를 사용하고, 움직임 예측 알고리즘인 Kalman filter를 결합하여 빠른 객체 추적 방법을 제안한다. 그 결과, 제안하는 방법은 다른 컬러를 갖는 같은 패턴의 객체들을 구분하고, 객체의 향후 움직임을 미리 예측한 관심영역(ROI)에서 인식을 수행함으로써 빠른 추적 결과를 보였다.