• 제목/요약/키워드: 연결 인식 알고리즘

검색결과 210건 처리시간 0.023초

연결 단어 음성 인식기 학습용 음성DB 녹음을 위한 최적의 대본 작성 알고리즘 (The Optimal and Complete Prompts Lists Generation Algorithm for Connected Spoken Word Speech Corpus)

  • 유하진
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.187-191
    • /
    • 2004
  • 연결 단어 인식기, 특히 연결 숫자음 인식기를 제작하기 위한 음성 데이터베이스를 구축하는데 있어서 완전하고 효율적인 발성목록을 작성하기 위한 알고리즘을 제안한다. 기존의 음성 DB에서 사용되는 목록은 주로 난수 발생기에 의하여 만들어지거나 사용자의 전화번호, 우편번호 등을 이용하여 만들어져 왔으므로 다양한 환경의 음소 또는 단어를 균일하게 포함하고 있지 못하다. 따라서 본 논문에서는 하나의 단어에 대하여 전후에 모든 단어가 연결되는 조합을 모두 한번씩 포함하는 목록을 만드는 효율적인 알고리즘을 제안한다. 본 알고리즘으로 7연 숫자 목록을 만들면 200개의 문장으로 모든 조합을 포함할 수 있게 된다. 본 논문에서는 알고리즘 예제와 본 알고리즘의 완전성과 효율성에 대하여 기술하였다.

특징점의 융선 연결정보를 이용한 지문 인식 (Fingerprint Recognition Using Connected Ride-line Inforamtion of Minutiae)

  • 김현철;이준재;김중수;심재창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.556-558
    • /
    • 2000
  • 본 논문은 지문 특징점 들에서 서로 연결되어진 구조 정보를 활용한 지문 매칭 알고리즘에 대해 연구하였다. 매칭에 이용한 특징은 분기점, 단점 그리고 융선의 방향 등이다. 한 융선 위에 존재하는 여러 특징점들의 연결정보를 찾고, 이를 저장하여 기준좌표축(한쌍의 특징)을 검출한다. 서로 일치하는 한 쌍의 특징을 이용해 입력지문을 이동하고 회전하여 원본지문과 일치시킨 후 각 특징들의 위치, 융선 방향이 일치하는 개수에 따라 지문의 동일여부를 판단하였다. 제안된 알고리즘은 회전과 이동에 무관한 지문인식이 가능하며, 처리 속도가 빨라 실시간 지문인식에 적용할 수 있다.

  • PDF

실시간 음성 다이얼링 시스템 구현을 위한 연결어 인식에 관한 연구 (A Study on Connected Word Recognition for the Implementation of a Real-Time Voice Dialing System)

  • 김천영;양진우;유형근;이형준;홍진우;이강성;안태옥
    • 한국음향학회지
    • /
    • 제12권3호
    • /
    • pp.13-25
    • /
    • 1993
  • 본 논문은 음성 다이얼링 시스템을 구현하기 위한 연결어 인식에 관한 연구이다. 적용된 인식 알고리즘은 기준패턴을 생성할 때 DMS 모델을 이용한 One-stage DMS/DP 알고리즘이고, 인식 대상어는 광운대학교 부서명 150 단어이다. 연결어 인식을 실시간으로 처리하기 위한 방법으로써 본 논문에서는 음절과 단어 단위의 DMS 템플리트를 구성하여 실험하였고 이 실험결과로부터 실시간과 인식률을 고려한 최적의 인식은 단어단위 템플리트에서 20 구간의 DMS 템플리트를 구성하여 실험하였고 이 실험결과로부터 실시간과 인식률을 고려한 최적의 인식은 단어단위 템플리트에서 20구간의 DMS 모델을 적용하였을 때 수행되었고, 이때 다중화자종속과 화자독립의 인식률은 각각 97.2%, 86.8%이다. 실험된 결과를 이용하여 음성 다이얼링 모델 시스템을 DSP 전용칩인 TMS320C30 프로세서를 내장한 DSP 보오드, 486 PC와 DIAL 모뎀을 이용해서 구현하였고, 전체 다이얼링 시간은 약 7~14초가 소요되었다.

  • PDF

효과적인 패턴 인식을 위한 개선된 Counterpropagation 알고리즘 (An Enhanced Counterpropagation Algorithm for Effective Pattern Recognition)

  • 김태형;우영운;조재현;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.422-426
    • /
    • 2007
  • CP(Counterpropagation) 알고리즘은 Kohonen의 경쟁 네트워크와 Grossberg의 아웃스타(outstar) 구조의 결합으로 이루어진 것으로 패턴 매칭, 패턴 분류, 통계적인 분석 및 데이터 압축 등 활용분야가 다양하고, 다른 신경망 모델에 비해 학습이 매우 빠르다는 장점이 있다. 하지만 CP 알고리즘은 충분한 경쟁층의 수가 설정되지 않아 경쟁층에서 학습이 불안정하고, 여권 코드와 같이 다양한 패턴으로 그성된 경우에는 패턴들을 정확히 분류할 수 없는 단점이 있다. 그리고 CP 알고리즘은 출력층에서 연결강도를 조정할 때, 학습률에 따라 학습 및 인식 성능이 좌우된다. 따라서 본 논문에서는 패턴 인식 성능을 개선하기 위해 다수의 경쟁층을 설정하고, 입력 벡터와 숭자 뉴런의 대표 벡터간의 차이와 숭자 뉴런의 빈도수를 학습률 조정에 반영하여 학습률을 동적으로 조정하여 경쟁층에서 안정적으로 학습되도록 하고, 출력층의 연결강도 조정시 이전 연결 강도 변화량을 반영하는 모멘텀(momentum)학습법을 적용한 개선된 CP 알고리즘을 제안한다. 학습 성능을 확인하기 위해서 실제 여권에서 추출된 개별 코드를 대상으로 실험한 결과, 본 논문에서 개선한 CP 알고리즘이 기존의 CP 알고리즘보다 패턴 분류의 정확성과 인식 성능이 개선된 것을 확인하였다.

  • PDF

발음 속도에 따른 지속시간 제한 값의 보상 (A Compensation of the Duration Bounds According to Speaking Speed)

  • 양태영;이충용;윤대희;차일환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.193-196
    • /
    • 2000
  • 본 논문에서는 제한 지속시간 모델링(bounded duration modeling)의 지속시간 제한 값(duration bound)을 화자의 발음 속도에 따라 조절해주는 발음 속도 보상 알고리즘을 제안한다. 제안된 알고리즘은 두 번의 인식 과정을 수행하는데, 1차 인식 과정은 화자의 발음 속도를 추정하기 위한 과정이고, 2차 인식 과정이 인식 결과를 얻기 위한 과정이다. 1차 인식 과정에서 추정된 화자의 발음 속도에 따라, 지속시간 제한 값을 증가, 또는 감소시킨 후, 2차 인식과정에 사용한다. 제안된 알고리즘은 CHMM 기반의 한국어 연결 숫자음 인식 시스템에 적용되었으며, KAIST에서 제작된 4-7자리 연결 숫자음 데이터베이스인 DigitDB를 대상으로 성능을 평가하였다. 인식 실험 결과, 제안된 발음 속도 보상 알고리즘이 적용된 인식 시스템에서는 $96.26\% 단어 인식률을 얻어, 제안된 알고리즘이 적용되지 않은 인식 시스템의 $94.72\%보다 $1.54\% 향상된 인식 성능을 얻을 수 있었다.

  • PDF

8-이웃 연결값에 의한 병렬세선화 알고리즘 (A Parallel Thinning Algorithm by the 8-Neighbors Connectivity Value)

  • 원남식;손윤구
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.701-710
    • /
    • 1995
  • 세선화 알고리즘은 문자 인식에서 인식율을 높이기 위한 매우 중요한 과정이 된다. 본 연구는 다양한 문자 인식에 적용 가능한 8-이웃 연결값을 이용한 병렬세선화 알고 리즘을 제안한다. 제안된 알고리즘의 특징은 병렬성 구현이 용이하며, 세선화된 결과 는 완전 8연결이 되고, 수치 정보로 표현된다. 특히 곡선 선분의 골격이 정확하게 표 현되므로 영문, 일어 등 곡선이 많은 문자에 더욱 적합함을 보인다. 성능 평가는 기준 골격선과 유사도 측정 방법에 의해 수행되었다.

  • PDF

Levelbuilding 알고리즘을 이용한 참조패턴의 자동생성 알고리즘에 관한 연구 (A Study On the Automatic Generation Algorithm of Reference Pattern Using Levelbuilding Algorithm.)

  • 김윤중
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.79-82
    • /
    • 1998
  • 본 연구에서는 연결단어 음성인식 상에서 올바른 참조 패턴을 생성하기 위해 Levelbuilding 알고리즘을 이용하여 인식대상 단어의 표본 집합(훈련패턴 집합)으로부터 참조 패턴을 자동적으로 생성하는 알고리즘을 개발하였다. 본 연구는 분한 K-Mans 훈련방법에 기초하고 있으며, Levelbuilding 알고리즘을 이용하여 훈련패턴으로부터 참조 패턴을 생성하는 것이다. 먼저 초기화 과정에서 훈련 패턴을 그에 포함된 단어 수만큼 등간격 분리하여 분리된 단어들을 소속 Cluster로 분류하고 각 Cluster의 Center들로 초기 참조패턴을 구성한다. 그리고 참조패턴, 제어정보 및 Levelbuilding 알고리즘을 이용하여 각 훈련패턴을 분리하고, 분리된 단어들을 소속 Cluster로 분류하여 단어 Cluster집합을 구성한 후 DTW 및 minimax알고리즘을 이용해 각 Cluster의 Center를 구하여 참조 패턴을 생성한다. 참조패턴 구성에 변화가 없을 때까지 전 단계의 참조패턴과 본 알고리즘을 반복 수행하여 최적의 참조패턴을 생성한다. 본 알고리즘을 이용하여 3개 숫자의 연결단어 집합으로부터 영('0')에서 구('9')까지 숫자음에 대한 참조패턴을 자동 생성하였다. 참조패턴 생성과정에서 가정 중요한 처리인 훈련패턴 분리과정을 분석하기 위하여 각 반복과정에서 분리된 정보를 그래프로 도시화하여 확인하였다.

  • PDF

HMM의 교정 학습과 후처리를 이용한 연결 숫자음 인식에 관한 연구 (A Study on the Recognition of the Connected Digits Using CorrectIve Trammg WIth HMM and Post Processing)

  • 우인봉
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.161-165
    • /
    • 1994
  • HMM은 좋은 결과를 보이면서 현재 음성 인식 분야에서 널리 사용되는 알고리즘이다. 그러나, 이 HMM의 학습방법인 maimum like-ihood estimation 은 인식률을 극대화하는 모델의 파라메터 값을 생성하지 못하는 단점이 있다. 이러한 문제점을 보와하기 위하여 연결어 인식 알고리즘인 Segmental K-means의 학습과정에 교정 학습법을 도입하여 모델 파라메터 값을 재조정 해 준다. 한국어 연속 숫자음은 영어 연속 숫자음과 달리 연음 현상의 영향을 많이 받는다. Level building 과정에서 연음에 의한 오류를 감소시키기 위해 연음에 의해 발생할 수 있는 단어를 별도의 모델로 추가했다. 이렇게 추가된 단어 모델들에 대한 몇가지 규픽을 인식 결과에 적용하여 출력을 다시 조정한다. 본 시스템은 TMS320C30 프로세서 내장한 DSP 보드와 IBM PC 사엥서 구현되었고, 표준 패턴은 실험실 잡음 환경에서 남성화자 3명을 대상으로 작성하였다. 인식 결과 21종 전화번호 252개 데이터에 대하여 화자 종속으로 92.1% 인식률을 나타내었다.

  • PDF

형태론적 형태 분해 요소를 이용한 손짓 인식 알고리즘 (Hand-Gesture Algorithm using Morphological Shape Decomposition Elements)

  • 김정훈;윤용인;최종수;김태은
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.103-106
    • /
    • 2001
  • 최근 들어 인간의 의지를 컴퓨터에 전달하기 위한 수단으로 컴퓨터 시각기반 방식으로 제스처를 인식하고자 하는 연구가 널리 진행되고 있다. 제스처 인식에서 가장 중요한 문제는 실시간 처리로 알고리즘의 단순화와 처리시간의 감소이다. 이러한 문제를 해결하기 위해서 본 연구에서는 기하학적 집합론에 근거하고 있는 수학적 형태론을 적용하였다. 형태론적 형상분해를 적용하여 얻은 손짓 형상의 원시형상 요소들의 방향성은 손짓에 관한 중요한 정보를 내포하고 있으며 이러한 특징에 근거하여 본 연구에서는 주 원시형상 요소와 부 원시형상원소의 중심점을 연결하는 직선으로부터 특징벡터를 이용한 형태론적 제스처 인식 알고리즘을 제안하고 실험을 통하여 그 유용성을 증명한다.

  • PDF

한국어 연결 숫자음 인식을 일한 최대 사후 Eigenvoice에 근거한 자기적응 기법 (Self-Adaptation Algorithm Based on Maximum A Posteriori Eigenvoice for Korean Connected Digit Recognition)

  • 김동국;전형배
    • 한국음향학회지
    • /
    • 제23권8호
    • /
    • pp.590-596
    • /
    • 2004
  • 본 논문에서는 한국어 연결 숫자음 인식을 위한 최대 사후 eigenvoice을 사용한 자기적응 기법을 제안한다. 제안된 최대 사후 eigenvoice 기법은 eigenvoice 계수에 대한 확률 밀도 함수를 가정함으로 구성된다. 제안된 알고리즘은 기존 eigenvoice 추정 과정에 선 분포 모델을 포함하는 일반적인 해를 제공하는 구조를 갖는다. 인식할 한 문장만을 사용하는 자기 적응 시스템을 위해 매우 강인한 특성을 갖는 최대 사후 eigenvoice 적응 기법을 사용하였다. 한국어 연결 숫자음에 대한 일련의 자기 적응 실험결과 제안된 알고리즘의 성능은 매우 적은 량의 적응 데이터에 대해 기존 eigenvoice 알고리즘에 비해 우수한 성능을 나타냈었다.