Search | Korea Science

Implementation of Speaker Independent Speech Recognizer in Noise Environment based on DSP (DSP기반의 잡음환경에 강인한 화자 독립 음성 인식기 구현)

박진영;권호민;박정원;김창근;허강인
- Proceedings of the IEEK Conference
- /
- 2003.11a
- /
- pp.69-72
- /
- 2003
본 논문에서는 범용 DSP를 이용한 잡음환경에 강인한 음성인식 시스템을 구현하였다. 구현된 시스템은 TI사의 범용 DSP인 TMS320C32를 이용하였고, 실시간 음성 입력을 위한 음성 Codec과 외부 인터페이스를 확장하여 인식결과를 출력하도록 구성하였다. 또한, 기존의 음성 인식 시스템에 사용한 파라메터에 대한 고찰과 ICA를 이용하여 잡음 환경에 강인한 음성 특징 파라메터를 제안하고 성능 비교 실험을 하였다. 제안된 ICA 파라메터를 적용하여 음성인식 시스템을 구현하였다. 그리고, 독립적으로 동작 가능한 음성인식 시스템의 응용 예로 무선자동차에 적용시켜 실험했다.
PDF

A Gerber-Character Recognition System with Multiple Recognizers and a Verifier (다중 인식기 및 검증기를 갖는 거버문자 인식 시스템)

Oh, Hye-Won;Park, Tae-Hyoung
- Journal of the Korean Institute of Intelligent Systems
- /
- v.14 no.1
- /
- pp.20-27
- /
- 2004
We propose the character recognition system for Gerber files. The Gerber file is the vector-formatted drawing file for PCB manufacturing, which includes various symbols, figures and characters. Also, the characters are written in horizontal, vertical, and reverse-vortical directions. In this paper, we newly propose the Gerber-character recognition system to recognize all of component names located in PCB. To improve the performance, we develop the multiple recognizers by neural networks and the verifier considering the structural features. The developed system has been installed to the auto-programming software for PCB assembly and inspection machines.
https://doi.org/10.5391/JKIIS.2004.14.1.020 인용 PDF KSCI

Development of Emotion-Based Human Interaction Method for Intelligent Robot (지능형 로봇을 위한 감성 기반 휴먼 인터액션 기법 개발)

Joo, Young-Hoon;So, Jea-Yun;Sim, Kee-Bo;Song, Min-Kook;Park, Jin-Bae
- Journal of the Korean Institute of Intelligent Systems
- /
- v.16 no.5
- /
- pp.587-593
- /
- 2006
This paper is to present gesture analysis for human-robot interaction. Understanding human emotions through gesture is one of the necessary skills for the computers to interact intelligently with their human counterparts. Gesture analysis is consisted of several processes such as detecting of hand, extracting feature, and recognizing emotions. For efficient operation we used recognizing a gesture with HMM(Hidden Markov Model). We constructed a large gesture database, with which we verified our method. As a result, our method is successfully included and operated in a mobile system.
https://doi.org/10.5391/JKIIS.2006.16.5.587 인용 PDF KSCI

A Study on Speaker Normalization using VTN (VTN을 이용한 화자 정규화에 관한 연구)

손창희;손종목;배건성
- Proceedings of the IEEK Conference
- /
- 2001.09a
- /
- pp.499-502
- /
- 2001
본 연구에서는 화자에 따라 서로 다른 성도의 길이에 의해 발생하는 음성인식 시스템의 성능 저하를 줄이기 위하여, VTN(Vocal Tract Normalization)을 음성인식 시스템에 적용하고, 주소 인식 실험을 통하여 인식 성능을 평가하였다. 또, VTN을 CMN과 동시에 적용하여 인식 실험을 하였다. 실험에서는 화자간 성도길이의 차이를 반영하기 위하여 13개의 Warping 계수에 대해 필터 뱅크를 이용한 선형 Warping 방법을 적용하였다. 실험결과, Baseline 인식 시스템에 비하여 VTN을 적용하면, WER(Word Error Rate)이 1.24% 감소하였고, CMN과 VTN을 동시에 적용한 실험에서는 Baseline 인식 시스템과 비교하여 WER이 0.33% 감소 하였지만 VTN을 적용한 실험결과와 비교하면 오히려 0.91% 증가하였다.
PDF

Robust Speech Recognition for Application to Mobile Phone (휴대폰 단말기에 적용을 위한 강인한 음성인식)

손종목;정성윤;배건성
- Proceedings of the IEEK Conference
- /
- 2001.09a
- /
- pp.495-498
- /
- 2001
최근 음싱인식이 인간과 기계 사이의 자연스러운 통신을 위한 가장 중요한 수단으로 인식되어 이와 관련된 연구가 구준히 이루어져 왔으며, 일부 응용 분야에서는 성공적으로 적용되고 있다. 하지만, 좀 더 다양한 응용분야에 적용하기 위해서는 실제 환경에 존재하는 여러가지 주변잡음에 강인한 특성을 가지는 인식 시스템이 요구된다. 본 연구에서는 음성인식 시스템을 휴대전화에 적용하기 위해 도메인 적응 기법, LDA (Linear Discriminant Analysis) 기법 등을 도입하여 시스템 DB의 크기를 줄이고 잡음에 대한 강인성을 높이고자 하였으며, HMM (Hidden Markov Model)에 기반한 음싱인식 시스템을 사용하여 각 기법의 적용에 따른 인식성능을 평가하였다.
PDF

A Study on Speaker Adaptation in Continuous Digits Speech Recognition (연속숫자 음성인식에서 화자 적응에 관한 연구)

최광표
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06e
- /
- pp.319.2-322
- /
- 1998
본 논문에서는 반음절 단위 HMM을 이용한 연속 숫자 음성인식 시스템의 2단계로 이루어지는 화자 적응 알고리즘을 수행하였다. 음성인식 시스템에서 사용되는 훈련데이터의 양이 많더라도 발성속도, 발성크기 등의 화자 발성 습관에 따라 화자독립 음성인식 시스템에서는 많은 문제점들이 발생하게 된다. 불특정 화자를 대상으로 한 음성 인식에 있어서 개인차에 의한 변동을 대처하는 방법으로 유효한 음향적 특성을 추출하기 위해 스펙트럼의 동적인(Dynamic) 특성을 주로 이용하고 있다. 따라서 본 논문에서는 화자 적을 기법의 하나인 frequency warped spectral matching 방법을 연속숫자 음성 인식시스템에 적용하였으며, 이때 인식에 의한 적절한 화자별 스케일링 계수 선정 방법을 수행하여 오인식률이 감소함을 확인하였다.
PDF

Isolated Word Recognition Based on Finite-State Vector Quantization (유한상태 벡터양자화를 이용한 격리단어인식)

윤원식;은종관
- The Journal of the Acoustical Society of Korea
- /
- v.5 no.3
- /
- pp.50-57
- /
- 1986
유한상태 벡터양자화 방법을 이용한 격리단어인식에 관하여 기술하고 있다. 이 인식시스템은 codebook과 next-state function 으로 구성된 일종의 finite-state machine으로 볼 수 있다. 유한상태 벡 터양자화방법을 이용한 격리단어 인식시스템은 일반적인 벡터양자화방법을 이용한 인식시스템에 비하여 소요시간이 감소하며 입력음성을 분할할 필요도 없는 한편 두 시스템의 인식율은 비슷한 것으로 나타났 다. Next-state function을 구하는 방법에는 conditional histogram 방법과 omniscient design 방법이 있 으며, 이 방법들의 성능비교를 위해 영부터 구까지의 한국어 숫자음성에 대한 인식실험을 수행하였다.
PDF

Study on the panorama image processing using the SURF feature detector and technicians. (Emgu CV를 이용한 자동차 번호판 자동 인식 프로그램 구현에 관한 연구)

Kim, Nam-woo;Hur, Chang-Wu
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2016.05a
- /
- pp.830-833
- /
- 2016
자동차 번호판 인식은 대중적인 감시 기술 중의 한 종류로서, 주어진 비디오나 영상 내 광학문자 인식을 수반한다. 고속도로나 국도 상에 과속 단속 시스템, 재형 건물이나 유통센서 및 주차장 등에서 주차 정산 시스템, 고속도로 톨 게이트에서 hi-pass 에러 및 불법 도주 차량 잔속 시스템, 전국 주요 도로 불법 주 정차 단속 시스템, 공공기관, 기업 출퇴근 시간 확인 및 외부 차양 안내 시스템 등의 지능형 교통 시스템(ITS)이나 국도 상에 범위 차량 검거 시스템, 사건 발생 시 주요 도로상에 설치된 CCTV를 통해 용의 차량 이동 추적 시스템, 이동식 범죄 차량 조회, 버스에 탑재된 버스 전용차선 위반 단속들의 지능형 방범 시스템 등에 활용하고 있다. 번호판 인식은 자동차 번호판 국부화, 번호판의 크기, 차원, 명암대비, 밝기를 조정하는 정규화, 개별문자를 얻어내는 문자 분할, 문자를 인식하는 광학 문자 인식, 번호판의 형태, 크기, 위치 들이 연도별, 지역별로 차이가 있는 번호판들의 데이터베이스를 비교하여 구문 분석을 하는 절차를 거친다. 본 논문에서는 EmguCV를 이용하여 구현한 번호판 감지를 수행하여 위치를 찾아내고, 오픈 소스 광학 문자 인식 엔진으로 잘 알려져 있는 테서렉트 OCR을 이용하여 번호판의 문자를 인식하는 자동 인식 프로그램을 구현하고 기술하였다.
PDF

The study on the object recognition using Fuzzy Classification system based on Support Vector (서포트 벡터 기반 퍼지 분류 시스템을 이용한 물체 인식)

Kim, Sung-Jin;Won, Sang-Chul
- Proceedings of the KIEE Conference
- /
- 2003.11b
- /
- pp.167-170
- /
- 2003
본 논문에서는 패턴 인식의 전형적인 경우인 보이기 기반 물체 인식(Appearance based object recognition)을 수행하기 위하여, 일반적인 퍼지 분류 모델과, 서포트 벡터 머신을 하이브리드(hybrid) 하게 연결한 서포트 벡터 기반 퍼지 분류 시스템이라는 새로운 방법을 제안하고 이에 대하여 연구한다. 일반적인 분류(classification)문제의 경우 두 클래스로 구분하는데 최적의 성능을 가지고 있는 서포트 벡터 머신이 다중클래스(Multiclass)의 경우 발생 하는 계산량의 증가 문제를 해 결하기 위하여 다중 클래스 분류(Multiclass classification)에 장점을 가진 퍼지 분류 시스템을 도입, 서포트 벡터 머신에 연결함으로써 단점을 보완하는 시스템을 제안한다. 즉 서포트 벡터 머신을 통해 퍼지 시스템의 구조를 러닝(learning)하는데 사용하여 최종 적으로는 퍼지 분류 시스템(Fuzzy Classifier)이 나오도록 하는 것이다. 이 시스템의 성능을 확인하고자 여러 가지 물체들에 대한 이미지를 가지고 있는 COIL(Columbia Object Image Library) 데이터 베이스를 사용하여 보이기 기반 물체 인식(Appearance based Object Recognition)을 수행 하였으며 이를 순수한 서포트 벡터 머신만을 이용하여 물체 인식을 수행한 경우와 정확도 및 인식 시간에 대하여 비교하였다.
PDF

A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment (실시간 윈도우 환경에서 DMS 모델을 이용한 자동 음성 제어 시스템에 관한 연구)

남동선
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06e
- /
- pp.361-364
- /
- 1998
본 논문은 인식 속도의 개선을 위해 단어의 지속시간에 따라 Section의 수를 변경한 가변섹션 수 DMS모델을 사용한 실시간 인식 시스템을 연구하고 인식된 결과를 실제 수행하도록 하는 시스템을 구현하는 것이 목적이다. 이러한 윈도우 음성 제어 시스템 구현을 위해 음성의 자동 검출, 윈도우 제어 모듈 구현, 동적 모델 재구성을 이용하여 적용된 단어 단위인식 시스템의 단점을 장점으로 수용하는 시스템을 구현하였고 본 시스템의 이름은 “VocManagerII”라 명명하였다. 구현된 시스템의 성능 평가 결과 인식 및 제어 수행 속도는 1초이내에 이루어지며 인식율은 66개의 기본 명령어에 대하여 화자 종속 99.36%, 화자 독립 99.08%의 좋은 인식율을 보여 주었다.
PDF

Search Result 10,301, Processing Time 0.038 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)