• 제목/요약/키워드: 인식

Search Result 43,246, Processing Time 0.053 seconds

Word Recognition Using K-L Dynamic Coefficients (K-L 동적 계수를 이용한 단어 인식)

  • 김주곤
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.103-106
    • /
    • 1998
  • 본 논문에서는 음성인식 시스템의 인식 정도의 향상을 위해서 동적 특징으로서 K-L(Karhanen-Loeve)계수를 이용하여 음소모델을 구성하는 방법을 제안하고, 음소, 단어, 숫자음 인식 실험을 통하여 그 유효성을 검토하였다. 인식 실험을 위한 음성자료는 한국 전자통신 연구소에서 채록한 445단어와 국어정보공학연구소에서 채록한 4연속 숫자음을 사용하였으며, K-L계수 동적 특징의 유효성을 확인하기 위해 정적 특징으로서 멜-켑스트럼과 동적 특징으로서 K-L계수 및 회귀계수를 추출한 후 음소, 단어, 숫자음 인식 실험을 수행하였다. 인식의 기본 단위로는 48개의 유사음소단위(Phoneme Likely Unite ; PLUs)를 음소모델로 사용하였으며, 단어와 숫자음 인식을 위해서는 유한상태 오토마타(Finite State Automata; FSA)에 의한 구문제어를 통한 OPDP(One Pass Dynamic Programming)법을 이용하였다. 인식 실험 결과, 음소인식에 있어서는 정적특징인 멜-켑스트럼을 사용한 경우 39.8%, K-L 동적 계수를 사용한 경우가 52.4%로 12.6%의 향상된 인식률을 얻었다. 또한, 멜-켑스트럼과 회수계수를 사용한 경우 60.1%, K-L계수와 회귀계수를 결합한 경우에 있어서도 60.4%로 높은 인식률은 얻었다. 이 결과를 단어인식에 확장하여 인식 실험을 수행한 결과, 기존의 멜-켑스트럼 계수를 사용한 경우 65.5%, K-L계수를 사용한 경우 75.8%로 10.3% 향상된 인식률을 얻었으며, 멜-켑스트럼과 회귀계수를 결합한 경우 91.2%, K-L계수와 회귀계수를 결합한 경우 91.4%의 높은 인식률을 보였다. 도한, 4연속 숫자음에 적용한 경우에 있어서도 멜-켑스트럼을 사용한 경우 67.5%, K-L계수를 사용한 경우 75.3%로 7.8%의 향상된 인식률을 보였으며 K-L계수와 회귀계수를 결합한 경우에서도 비교적 높은 인식률을 보여 숫자음에 대해서도 K-L계수의 유효성을 확인할 수 있었다.

  • PDF

Development of a Visitor Recognition System Using Open APIs for Face Recognition (얼굴 인식 Open API를 활용한 출입자 인식 시스템 개발)

  • Ok, Kisu;Kwon, Dongwoo;Kim, Hyeonwoo;An, Donghyeok;Ju, Hongtaek
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.6 no.4
    • /
    • pp.169-178
    • /
    • 2017
  • Recently, as the interest rate and necessity for security is growing, the demands for a visitor recognition system are being increased. In order to recognize a visitor in visitor recognition systems, the various biometric methods are used. In this paper, we propose a visitor recognition system based on face recognition. The visitor recognition system improves the face recognition performance by integrating several open APIs as a single algorithm and by performing the ensemble of the recognition results. For the performance evaluation, we collected the face data for about five months and measured the performance of the visitor recognition system. As the results of the performance measurement, the visitor recognition system shows a higher face recognition rate than using a single face recognition API, meeting the requirements on performance.

Machine Printed Character Recognition Based on the Combination of Recognition Units Using Multiple Neural Networks (다중 신경망을 이용한 인식단위 결합 기반의 인쇄체 문자인식)

  • Lim, Kil-Taek;Kim, Ho-Yon;Nam, Yun-Seok
    • The KIPS Transactions:PartB
    • /
    • v.10B no.7
    • /
    • pp.777-784
    • /
    • 2003
  • In this Paper. we propose a recognition method of machine printed characters based on the combination of recognition units using multiple neural networks. In our recognition method, the input character is classified into one of 7 character types among which the first 6 types are for Hangul character and the last type is for non-Hangul characters. Hangul characters are recognized by several MLP (multilayer perceptron) neural networks through two stages. In the first stage, we divide Hangul character image into two or three recognition units (HRU : Hangul recognition unit) according to the combination fashion of graphemes. Each recognition unit composed of one or two graphemes is recognized by an MLP neural network with an input feature vector of pixel direction angles. In the second stage, the recognition aspect features of the HRU MLP recognizers in the first stage are extracted and forwarded to a subsequent MLP by which final recognition result is obtained. For the recognition of non-Hangul characters, a single MLP is employed. The recognition experiments had been performed on the character image database collected from 50,000 real letter envelope images. The experimental results have demonstrated the superiority of the proposed method.

Enhancing Korean Alphabet Unit Speech Recognition with Neural Network-Based Alphabet Merging Methodology (한국어 자모단위 음성인식 결과 후보정을 위한 신경망 기반 자모 병합 방법론)

  • Solee Im;Wonjun Lee;Gary Geunbae Lee;Yunsu Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.659-663
    • /
    • 2023
  • 이 논문은 한국어 음성인식 성능을 개선하고자 기존 음성인식 과정을 자모단위 음성인식 모델과 신경망 기반 자모 병합 모델 총 두 단계로 구성하였다. 한국어는 조합어 특성상 음성 인식에 필요한 음절 단위가 약 2900자에 이른다. 이는 학습 데이터셋에 자주 등장하지 않는 음절에 대해서 음성인식 성능을 저하시키고, 학습 비용을 높이는 단점이 있다. 이를 개선하고자 음절 단위의 인식이 아닌 51가지 자모 단위(ㄱ-ㅎ, ㅏ-ㅞ)의 음성인식을 수행한 후 자모 단위 인식 결과를 음절단위의 한글로 병합하는 과정을 수행할 수 있다[1]. 자모단위 인식결과는 초성, 중성, 종성을 고려하면 규칙 기반의 병합이 가능하다. 하지만 음성인식 결과에 잘못인식된 자모가 포함되어 있다면 최종 병합 결과에 오류를 생성하고 만다. 이를 해결하고자 신경망 기반의 자모 병합 모델을 제시한다. 자모 병합 모델은 분리되어 있는 자모단위의 입력을 완성된 한글 문장으로 변환하는 작업을 수행하고, 이 과정에서 음성인식 결과로 잘못인식된 자모에 대해서도 올바른 한글 문장으로 변환하는 오류 수정이 가능하다. 본 연구는 한국어 음성인식 말뭉치 KsponSpeech를 활용하여 실험을 진행하였고, 음성인식 모델로 Wav2Vec2.0 모델을 활용하였다. 기존 규칙 기반의 자모 병합 방법에 비해 제시하는 자모 병합 모델이 상대적 음절단위오류율(Character Error Rate, CER) 17.2% 와 단어단위오류율(Word Error Rate, WER) 13.1% 향상을 확인할 수 있었다.

  • PDF

The Development of Sensibility Recognition Model based on Multi Layer Perceptron (MLP에 기반한 감성인식 모델개발)

  • Lee Dong-Hun;Kim Dae-Uk;Sim Gwi-Bo
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.172-175
    • /
    • 2006
  • 최근 다양한 게임 문화가 급속도로 성장함에 따라 보다 새로운 개념의 게임을 찾는 사용자의 요구가 증대 되고 있다. 기존의 게임은 획일화 되고 일방적인 사용자 환경으로 사용자가 일방적으로 게임을 하는 방식이었다. 때문에 사용자의 감성 데이터를 이용하여 사용자에게 게임 환경이 맞춰지는 "사용자 맞춤형" 게임은 기존의 게임에서 보다 진보한 새로운 방식이 될 것이다. 이 방식을 사용하기 위해서는 우선 사용자의 생체 데이터나 감성데이터를 포함한 뇌파를 획득하는 방법이 필요하며 다음으로 획득된 뇌파를 통하여 현재 사용자의 감성 상태를 규명하는 패턴인식 기법이 중요한 문제가 된다. 본 논문에서는 뇌파를 통하여 현재 사용자의 감성 상태를 규명하고 인식할 수 있는 패턴인식 기법으로 Multi Layer Perceptron(MLP)을 사용한 감성인식모델을 제안한다. 본 논문에서 제안한 감성인식 모델의 실험을 위하여 특정 공간 내에서 여러 사용자의 감정별 뇌파를 측정하고 실험을 통하여 획득한 데이터로 감정 DB를 구축한다. 구축된 DB를 본 논문에서 제안한 감성인식 모델로 학습을 하고 학습이 완료된 후 새로운 사용자의 뇌파를 입력 받은 후 현재 사용자의 감성을 인식한다. 감성인식과 더불어 집중도를 측정 하는 실험도 병행 한다. 본 논문에서 제안한 감성인식 모델의 성능을 측정하기 위하여 사용자의 수에 따른 감성 인식률을 측정함으로서 본 논문에서 제안한 감성인식 모델의 성능을 확인한다.

  • PDF

Handwritten Numeral Recognition Using Karhunen-Loeve Transform Based Subspace Classifier and Combined Multiple Novelty Classifiers (Karhunen-Loeve 변환 기반의 부분공간 인식기와 결합된 다중 노벨티 인식기를 이용한 필기체 숫자 인식)

  • 임길택;진성일
    • Journal of the Korean Institute of Telematics and Electronics C
    • /
    • v.35C no.6
    • /
    • pp.88-98
    • /
    • 1998
  • Subspace classifier is a popular pattern recognition method based on Karhunen-Loeve transform. This classifier describes a high dimensional pattern by using a reduced dimensional subspace. Because of the loss of information induced by dimensionality reduction, however, a subspace classifier sometimes shows unsatisfactory recognition performance to the patterns having quite similar principal components each other. In this paper, we propose the use of multiple novelty neural network classifiers constructed on novelty vectors to adopt minor components usually ignored and present a method of improving recognition performance through combining those with the subspace classifier. We develop the proposed classifier on handwritten numeral database and analyze its properties. Our proposed classifier shows better recognition performance compared with other classifiers, though it requires more weight links.

  • PDF

Recognition Time Reduction Technique for the Time-synchronous Viterbi Beam Search (시간 동기 비터비 빔 탐색을 위한 인식 시간 감축법)

  • 이강성
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.6
    • /
    • pp.46-50
    • /
    • 2001
  • This paper proposes a new recognition time reduction algorithm Score-Cache technique, which is applicable to the HMM-base speech recognition system. Score-Cache is a very unique technique that has no other performance degradation and still reduces a lot of search time. Other search reduction techniques have trade-offs with the recognition rate. This technique can be applied to the continuous speech recognition system as well as the isolated word speech recognition system. W9 can get high degree of recognition time reduction by only replacing the score calculating function, not changing my architecture of the system. This technique also can be used with other recognition time reduction algorithms which give more time reduction. We could get 54% of time reduction at best.

  • PDF

Full-Body Motion Recogniton Using Principal Component based Target Reduction (패턴 성분 기반 인식 범위 축소에 의한 전신 동작 인식)

  • Koh, Jane;Nam, Yang-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.873-876
    • /
    • 2004
  • 사람의 동작을 인식하는 것에 대한 연구는 게임, 유비쿼터스 컴퓨팅 등의 발전에 따라 그 중요성이 증가하고 있다. 그러나, 대부분의 기존 연구에서는 극히 소수의 동작만을 정의하거나 특정 부위의 동작만을 다루므로 실제 응용에 적용하기에는 적합하지 않다. 본 논문에서는 특정 도메인의 사용 없이, 카메라 영상 입력으로 취득된 동작 패턴 정보만을 이용하여 40종 전신 연속 동작을 구분하는 동작인식 방법을 연구하였다. 인식에 사용된 입력 데이터는 동작자 관절들의 위치 및 회전 값들이며, 다수의 동작들을 인식하기 위해서는 기존의 인식 알고리즘들인 특징기반 인식, HMM, 신경망(Neural Network)등을 사용하여 복합적인 인식 엔진을 구성하여야 했다. 입력 데이터별로 적합한 인식 모듈을 거치게 하기 위해서는, 동작에 의한 입력 데이터에서 동작자 움직임의 주요 신체 부위를 추출함으로써 입력 데이터가 해당 그룹의 인식 모듈로 자동적으로 분류되게 하는 방법을 사용한다. 이는 다층의 인식 레이어 중 복잡도가 증가하는 하위 레이어일수록 자동 분류에 의해 걸러진 데이터만을 취급하게 되므로 효과적이다. 전체 실험 결과 단계별로 약 79~97%의 인식률을 보였다. 이는 향후 특정 컨텍스트 정보와 결합할 때 매우 높은 인식률을 기대할 수 있게 하는 수치이다.

  • PDF

A Study on Digital Epistemology and Christian Education based on Media Theory (매체이론적 관점에서 보는 디지털 인식론과 기독교교육에 관한 연구)

  • Yang, Kum Hee
    • Journal of Christian Education in Korea
    • /
    • v.71
    • /
    • pp.23-59
    • /
    • 2022
  • This paper explored the effect of digital epistemology on Christian education. The media of an era determines the type and form of the epistemology of that era, which in turn has a decisive influence on the direction of Christian education in that era. Therefore, it consists of three parts. First, an investigation on the relationship between media and epistemology, second, an investigation on digital epistemology, and third, an investigation on the effect of digital epistemology on Christian education. In this paper, first, from the perspective of McLuhan's media theory, it was discovered that media go beyond simply expanding the our senses and change our perception through creating a new environment and way of life. This paper could characterize digital epistemology in the following four ways through comparison with the traditional epistemology of the print media era: namely "from linguistic to omnisensory epistemology", "from causality to relational epistemology", "from historical to post-historical thinking", and "from interpretive to performative epistemology". In addition, it examined the effects of that digital epistemology on Christian education. Through this study, it found that digital media can act both positively and negatively on the essence of Christian education. Therefore, the task of Christian education in the digital age is to make it a positive function rather than a dysfunctional one, and an opportunity rather than a challenge.

지문인식시스템 보안기능 평가 방법론 연구

  • 염흥렬;박준우;심상옥
    • Review of KIISC
    • /
    • v.13 no.6
    • /
    • pp.16-24
    • /
    • 2003
  • 생체정보를 이용한 인식 기술의 사회적 요구가 빠르게 증대함에 따라 생체인식 기술에 대한 신뢰성에 대한 요구 역시 급속하게 증대되고 있다. 생체인식 기술에 대한 신뢰성은 생체인식시스템의 인식률에 대한 시험과 생체인식시스템에 대한 보안성 시험을 통해 보장될 수 있다. 보안성 시험은 크게 시스템 내부 및 외부 공격에 대한 안전성 등에 대한 일련의 항목들에 대해 시험을 한다. 이러한 보안성 시험에 대해 국외의 경우 자국기준 또는 공통평가기준에 따라 지문인식시스템을 포함한 생체인식시스템에 대한 보안성 시험을 수행되고 있으나 국내에서는 이에 대한 연구가 아직 미진한 상태이다. 본 연구에서는 제시하는 지문인식시스템의 보안성 평가 방법론은 지문인식시스템을 시험할 때 어떤 면을 고려하여 시험해야 하는지에 대한 지침을 제공하기 위한 것이라 할 수 있다.