• Title/Summary/Keyword: In Word Probability

검색결과 114건 처리시간 0.029초

다층퍼셉트론의 출력 노드 수 증가에 의한 성능 향상 (Performance Improvement of Multilayer Perceptrons with Increased Output Nodes)

  • 오상훈
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.123-130
    • /
    • 2009
  • 일반적으로 다층퍼셉트론을 패턴인식 문제에 적용할 경우 클래스 당 하나의 출력 노드를 배정하고, 이 출력 노드의 인덱스가 입력 패턴의 클래스를 뜻하도록 한다. 이 논문에서는 이와 달리 다층퍼셉트론의 성능 향상을 위하여 클래스 당 출력노드 수를 증가시키는 방법을 제안한다. 두 개의 클래스 문제를 대상으로 클래스 발생확률이 동일하고 각 클래스 내에서 출력노드가 균일분포를 지닌다는 가정 하에, 이 방법의 효용성을 확률론적인 유도를 통하여 증명하였다. 그리고, 50개의 고립단어 인식의 시뮬레이션으로 출력노드를 증가 시킬 경우 성능이 향상됨을 확인하였다.

이중채널 잡음음성인식을 위한 공간정보를 이용한 통계모델 기반 음성구간 검출 (Statistical Model-Based Voice Activity Detection Using Spatial Cues for Dual-Channel Noisy Speech Recognition)

  • 신민화;박지훈;김홍국;이연우;이성로
    • 말소리와 음성과학
    • /
    • 제2권3호
    • /
    • pp.141-148
    • /
    • 2010
  • In this paper, voice activity detection (VAD) for dual-channel noisy speech recognition is proposed in which spatial cues are employed. In the proposed method, a probability model for speech presence/absence is constructed using spatial cues obtained from dual-channel input signal, and a speech activity interval is detected through this probability model. In particular, spatial cues are composed of interaural time differences and interaural level differences of dual-channel speech signals, and the probability model for speech presence/absence is based on a Gaussian kernel density. In order to evaluate the performance of the proposed VAD method, speech recognition is performed for speech segments that only include speech intervals detected by the proposed VAD method. The performance of the proposed method is compared with those of several methods such as an SNR-based method, a direction of arrival (DOA) based method, and a phase vector based method. It is shown from the speech recognition experiments that the proposed method outperforms conventional methods by providing relative word error rates reductions of 11.68%, 41.92%, and 10.15% compared with SNR-based, DOA-based, and phase vector based method, respectively.

  • PDF

Homogeneous Centroid Neural Network에 의한 Tied Mixture HMM의 군집화 (Clustering In Tied Mixture HMM Using Homogeneous Centroid Neural Network)

  • 박동철;김우성
    • 한국통신학회논문지
    • /
    • 제31권9C호
    • /
    • pp.853-858
    • /
    • 2006
  • 음성인식에서 TMHMM(Tied Mixture Hidden Markov Model)은 자유 매개변수의 수를 감소시키기 위한 좋은 접근이지만, GPDF(Gaussian Probability Density Function) 군집화 오류에 의해 음성인식의 오류를 발생시켰다. 본 논문은 TMHMM에서 발생하는 군집화 오류를 최소화하기 위하여 HCNN(Homogeneous Centroid Neural Network) 군집화 알고리즘을 제안한다. 제안된 알고리즘은 CNN(Centroid Neural Network)을 TMHMM상의 음향 특징벡터에 활용하였으며, 다른 상태에 소속된 확률밀도가 서로 겹쳐진 형태의 이질군집 지역에 더 많은 코드벡터를 할당하기 위해서 본 논문에서 새로 제안이 제안되는 이질성 거리척도를 사용 하였다. 제안된 알고리즘을 한국어 고립 숫자단어의 인식문제에 적용한 결과, 기존 K-means 알고리즘이나 CNN보다 각각 14.63%, 9,39%의 오인식률의 감소를 얻을 수 있었다.

부등비트오율이 고려된 DPCM의 신호대 잡음비 (SNR of DPCM with the Property of Unequal Bit - Error - Probability)

  • 최윤철;박영구;문상재
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.186-189
    • /
    • 1988
  • In transmission of DPCM signals, it is desired to protect the more significant digits from more errors than the less significant digits. The SNR of DPCM is examined in the case that bit error rates of individual digits consisting of the information word are different each other. The examination shows a better DPCM coding.

  • PDF

스트룹 간섭에 의한 시각작업기억의 왜곡 현상 (Distortion of the Visual Working Memory Induced by Stroop Interference)

  • 김대규;현주석
    • 인지과학
    • /
    • 제26권1호
    • /
    • pp.27-51
    • /
    • 2015
  • 장기기억 분야와 달리 시각작업기억에 대한 기억왜곡 연구사례는 흔치 않다. 본 연구는 시각작업기억 표상이 하향적 간섭에 의해 왜곡될 가능성을 관찰하고자 하였다. 기억표상의 질적 특성에 대한 직접적인 관찰을 위해서는 기억용량과 선명도를 추정하는 것이 중요하다. 본 연구에서는 색상환 과제를 통해 스트룹 단어의 색상에 대한 단기 회상을 요구하는 과정에서 발생하는 오류시행에 대한 분석을 통해 단어의 명칭에 의한 시각작업기억 표상의 왜곡 가능성을 조사하였다. 참가자들은 과제에서 500ms 동안 제시되는 1, 2, 3 혹은 6개의 스트룹 단어 항목의 색상을 기억하였다. 1초의 기억지연 시간 후, 기억이 요구된 스트룹 단어 중 단서가 지정하는 특정 단어의 색상을 회상해 색상환에서 선택 보고하였다. 색상환에서 회상이 요구된 자극의 실제 색상으로부터 ${\pm}45^{\circ}$ 이내의 색상을 선택했을 경우 정반응으로 간주 되었으며, 그 밖의 경우는 오반응으로 간주되었다. 오반응 시행에 대해 색상 선택의 분포 패턴을 분석한 결과, 보고 대상의 명칭 색상 범주에 기초한 회상 오류가 시행 전반에서 사용된 명칭 기반 평균 회상 오류를 상회하였다. 또한 항목개수 증가로 인한 기억부담의 증가는 이와 같은 스트룹 간섭에 의한 기억왜곡의 발생 확률에 큰 영향을 주지 않는 것으로 나타났다. 본 연구의 결과, 스트룹 자극에 대한 시각작업기억 표상에 대하여 자극의 명칭색상에 의한 체계적 왜곡 가능성이 관찰되었다. 이는 비교적 짧은 기간 활용되는 시각작업기억 수준의 표상 역시 장기기억과 마찬가지로 간섭에 의해 왜곡될 수 있음을 시사한다.

효과적인 외래어 이형태 생성을 위한 확률 문맥 의존 치환 방법 (A Probabilistic Context Sensitive Rewriting Method for Effective Transliteration Variants Generation)

  • 이재성
    • 한국콘텐츠학회논문지
    • /
    • 제7권2호
    • /
    • pp.73-83
    • /
    • 2007
  • 완전 일치 방법을 주로 사용하는 정보 검색 시스템에서 외래어 이형태를 검색할 수 있도록 위해서는 외래어 이형태를 자동 생성하는 전처리나 질의어 확장이 필요하다. 본 연구에서는 하나의 외래어가 입력되면, 이를 근거로 실제 사용될 만한 외래어 이형태들을 효과적으로 생성하기 위한 방법을 제안한다. 혼동 자소를 단순하게 치환하는 방법은 불필요한 이형태를 과도하게 생성하므로, 본 연구에서는 실제 문서에 사용된 외래어 이형태들로부터 혼동 패턴을 학습하고, 이를 확률로 계산하여 생성 순서를 조절하였다. 특히, 혼동 패턴에서 좌우문맥을 고려하고 지역 치환 확률과 전역 치환 확률을 계산하여 조기에 많이 사용하는 이형태를 생성하도록 하였다. KT SET 2.0에서 추출한 이형태 데이터에 대해 실험한 결과, 상위 20개의 생성으로도 평균 80% 이상 찾아내어 이 방법이 매우 효과적임을 보였다.

어절 N-gram을 이용한 문맥의존 철자오류 교정 (Context-sensitive Spelling Error Correction using Eojeol N-gram)

  • 김민호;권혁철;최성기
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1081-1089
    • /
    • 2014
  • 문맥의존 철자오류의 교정 방법은 크게 규칙을 이용한 방법과 통계 정보에 기반을 둔 방법으로 나뉘며, 이중 통계적 오류 교정 방법을 중심으로 연구가 진행되었다. 통계적 오류 방법은 문맥의존 철자오류 문제를 어의 중의성 해소 문제로 간주한 방법으로서, 교정 대상 어휘와 대치 후보 어휘로 이루어진 교정 어휘 쌍을 문맥에 따라 분류하는 방법이다. 본 논문에서는 본 연구진의 기존 연구 결과인 교정 어휘 쌍을 이용한 확률 모델의 성능 향상을 위해 어절 n-gram 모델을 기존 모델에 결합하는 방법을 제안한다. 본 논문에서 제안하는 결합 모델은 각 모델을 통해 계산된 문장의 확률을 보간(interpolation)하는 방법과 각각의 모델을 차례대로 적용하는 방법이다. 본 논문에서 제안한 두 가지 결합 모델 모두 기존 모델이나 어절 n-gram만 이용한 모델보다 높은 정확도와 재현율을 보인다.

가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델 (A Korean Homonym Disambiguation Model Based on Statistics Using Weights)

  • 김준수;최호섭;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1112-1123
    • /
    • 2003
  • 본 논문은 한국어 정보처리에서 발생하는 어휘 중의성 문제 중 한국어에서 그 심각성이 큰 동형이의어 중의성을 해결하기 위하여, 사전 뜻풀이 말뭉치에서 구축한 의미정보(Semantic Information)와 이를 이용한 기존의 통계기반 동형이의어 분별 모델에 대한 실험 결과를 분석하여, 정확률 향상을 위한 새로운 동형이의어 NPH(New Prior Probability of Homonym sense) 가중치 및 인접 어절에 대한 거리 가중치 적용 모델을 제안한다. 사전 뜻풀이 말뭉치의 상위 고빈도 동형이의어 200개 중 중의성이 높은 46개(명사 30개, 동사 16개)를 선별하고, 21세기 세종 계획에서 제공하는 350만 어절 품사 부착 말뭉치에서 이들 동형이의어를 포함하는 47,977개의 문장을 추출하여 실험을 하였다. 기존의 통계기반 동형이의어 분별 모델에서는 72.08%(명사78.12%, 동사 62.45%)의 정확률을 나타냈으나, NPH 가중치를 부여한 실험 결과 정확률이 평균 1.70% 향상되었으며, NPH와 거리 가중치를 함께 이용한 결과 평균 2.01% 정확률이 향상되었다.

대용량 음성인식을 위한 인식기간 감축 알고리즘 (A Recognition Time Reduction Algorithm for Large-Vocabulary Speech Recognition)

  • 구준모;은종관
    • 한국음향학회지
    • /
    • 제10권3호
    • /
    • pp.31-36
    • /
    • 1991
  • 본 논문에서는 대용량 음성인식 시스템의 인식시간을 감축하기 위하여 후보단어를 선정하는 효과적인 방법을 제안하고 이 방법의 성능을 향상시키기 위하여 spectral smoothing과 temporal smoothing을 사용하는 것에 관하여 연구하였다. 제안된 방법은 사전내의 각 단어에 대하여 음성인식 단위의 음성 spectrum관찰확률과 길이정보를 이용하여 대강의 관찰확률을 계산하여 후보단어를 선정한다. 제안된 방법을 음소단위의 HMM을 이용하는 1160단어 인식 시스템에 적용한 결과, 전체 계산량의 74% 가량을 감축할 수 있었으며 이때 인식율의 감소는 매우 작았다. 또한 제안된 대감의 likelihood점수 계산방법은 Viterbi방법에 의하여 계산되는 likelihood 점수를 잘 추정함을 알 수 있었다.

  • PDF

비동기 FH/MFSK 반복전송 시스템의 성능분석 (A Study on the Performance Analysis of Asynchronous Repeated FH/MFSK System)

  • 지영호;한영렬
    • 한국통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.120-126
    • /
    • 1988
  • 본 논문은 부호분할 다중통신을 위한 비동기 FH/MFSK(Frequency Hopping-Multilevel Frequency Shift Keying) 반복전송 시스템의 성능에 관한 연구이다. 잡음(Noise)과 페이딩(Multipath propagation)이 없고 사용자 상호간의 간섭(Interference)만 존재한다고 가정하고 사용자수 M이 주어졌을 때 실제상황을 모델로 하여 시뮬레이션(Simulation)하여 구한 간섭량과 Random Coding때의 간섭량과 비교하여 거의 차이가 없음을 보였다. 또한 비동기 FH/MFSK 반복전송 시스템의 Bound 형태로 표현된 워드 에러(Word error)확률의 식으로 계산한 값과 실제상황을 모델로 해서 시뮬레이션하여 나온 결과가 잘 일치하고 있음을 보였다.

  • PDF