• 제목/요약/키워드: Data Codebook

검색결과 80건 처리시간 0.021초

FSVQ, 퍼지 개념 및 이중 스펙트럼 특징을 이용한 HMM에 기초를 둔 음성 인식 (HMM-based Speech Recognition using FSVQ, Fuzzy Concept and Doubly Spectral Feature)

  • 정의봉
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권4호
    • /
    • pp.491-502
    • /
    • 2004
  • 본 논문은 화자 독립의 단독어 인식에 관한 연구로써, FSVQ(first section vector quantization), 퍼지 이론 및 이중 스펙트럼 특징을 이용한 HMM(hidden Markov model) 모델을 제안한다. 제안된 연구 방법에서, 이중 특징 파라메타로써 LPC ?스트럼과 LPC 스트럼의 회귀 계수를 사용한다. 학습 데이터는 몇 개의 구간으로 나누어지며, 첫 번째 구간의 코드북(codebook)을 만든 후, 첫 번째 구간의 코드북으로 부터, 퍼지 개념을 도입하여 확률 값이 큰 순서에 의해 다중 관측열을 구한다. 그 다음, 첫 번째 구간의 관측열을 학습시키고, 같은 방법으로 확률 값을 얻은 단어가 인식되어 진다. 제안된 방법에 의한 인식 실험을 수행하는 것 이외에도 비교를 위하여 다른 방법의 인식 실험을 같은 조건하에서 같은 데이터로 수행하였다. 실험 결과, 본 연구에서 제안한 방법이 다른 방법들보다 인식률이 우수함을 입증하였다. 입증하였다.

  • PDF

DMS 모델과 퍼지 개념을 이용한 HMM에 기초를 둔 음성 인식 (HMM-based Speech Recognition using DMS Model and Fuzzy Concept)

  • 안태옥
    • 한국산학기술학회논문지
    • /
    • 제9권4호
    • /
    • pp.964-969
    • /
    • 2008
  • 본 논문은 화자 독립의 음성인식을 위한 연구로서, DMS(Dynamic Multi-Section) 모델에 의한 DMSVQ(Dynamic Multi-Section Vector Quantization) 코드북과 퍼지 개념을 이용한 HMM(Hidden Markov Model) 음성인식 방법을 제안한다. 제안된 인식 방법에서는 학습 데이터를 동적으로 몇 개의 구간(section)으로 분할한 후, 각 구간마다 DMSVQ 코드북(codebook)으로 부터 거리값이 작은 순으로 퍼지 법칙을 적용함으로써 적당한 확률값을 준 다중 관측열(multi-observation sequences)을 구한다. 그런 다음, 이 다중 관측열을 이용하여 HMM을 작성하고, 인식시에는 관측 확률값이 가장 높은 것을 인식된 것으로 선택한다. 제안된 방법에 의한 인식 실험은 기존의 다양한 인식 실험들과 비교를 위해 동일한 조건하에서 같은 데이터로 수행 하였다. 실험 결과로서, 본 연구에서 제안한 방법이 기존의 방법들보다 우수한 방법임을 입증하였다.

Vector Quantization for Medical Image Compression Based on DCT and Fuzzy C-Means

  • Supot, Sookpotharom;Nopparat, Rantsaena;Surapan, Airphaiboon;Manas, Sangworasil
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.285-288
    • /
    • 2002
  • Compression of magnetic resonance images (MRI) has proved to be more difficult than other medical imaging modalities. In an average sized hospital, many tora bytes of digital imaging data (MRI) are generated every year, almost all of which has to be kept. The medical image compression is currently being performed by using different algorithms. In this paper, Fuzzy C-Means (FCM) algorithm is used for the Vector Quantization (VQ). First, a digital image is divided into subblocks of fixed size, which consists of 4${\times}$4 blocks of pixels. By performing 2-D Discrete Cosine Transform (DCT), we select six DCT coefficients to form the feature vector. And using FCM algorithm in constructing the VQ codebook. By doing so, the algorithm can make good time quality, and reduce the processing time while constructing the VQ codebook.

  • PDF

벡터양자화를 이용한 웨이브렛 영상데이터 압축 (Wavelet Image Data Compression Using Vector Quantization)

  • 최유일;조창호;이상효;조도현;이종용
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2287-2290
    • /
    • 2003
  • In this paper, an image vector quantization method is proposed not only to improve the compression ratio but also to reduce the computation cost. The proposed method could save the computation cost of codebook generation and encoding by using the modified LBG algorithm of Partial Search Partial Distortion (PSPD) in wavelet domain, by which the code book was constructed together with the partial codebook search, the partial code vector elements, and the interruption criterion. We have designed and implemented the vector quantizer to verify the improvement in reducing compression ratio in encoding processing and reducing the computation cost.

  • PDF

GAVQ를 이용한 음성인식에 관한 연구 (A Study on Speech Recognition using GAVQ(Genetic Algorithms Vector Quantization))

  • 이상희;이재곤;정호균;김용연;남재성
    • 산업기술연구
    • /
    • 제19권
    • /
    • pp.209-216
    • /
    • 1999
  • In this paper, we proposed a modofied genetic algorithm to minimize misclassification rate for determining the codebook. Genetic algorithms are adaptive methods which may be used solve search and optimization problems based on the genetic processes of biological organisms. But they generally require a large amount of computation efforts. GAVQ can choose the optimal individuals by genetic operators. The position of individuals are optimized to improve the recognition rate. The technical properties of this study is that prevents us from the local minimum problem, which is not avoidable by conventional VQ algorithms. We compared the simulation result with Matlab using phoneme data. The simulation results show that the recognition rate from GAVQ is improved by comparing the conventional VQ algorithms.

  • PDF

Content-based Image Indexing Using PCA

  • Yu, Young-Dal;Jun, Min-Gun;Kim, Daijij;Kang, Dae-Seong
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -2
    • /
    • pp.827-830
    • /
    • 2000
  • In this paper, we propose the method using PCA(principal component analysis) algorithm when proposed algorithm performs multimedia information indexing. After we extract DC coefficients of DCT from MPEG video stream which is an international standard of moving picture compression coding, we apply PCA algorithm to image made of DC coefficients and extract the feature of each DC image. Using extracted features, we generate codebook and perform multimedia information indexing. The proposed algorithm Is very fast when indexing and can generate optimized codebook because of using statistical feature of data

  • PDF

Iterative LBG Clustering for SIMO Channel Identification

  • Daneshgaran, Fred;Laddomada, Massimiliano
    • Journal of Communications and Networks
    • /
    • 제5권2호
    • /
    • pp.157-166
    • /
    • 2003
  • This paper deals with the problem of channel identification for Single Input Multiple Output (SIMO) slow fading channels using clustering algorithms. Due to the intrinsic memory of the discrete-time model of the channel, over short observation periods, the received data vectors of the SIMO model are spread in clusters because of the AWGN noise. Each cluster is practically centered around the ideal channel output labels without noise and the noisy received vectors are distributed according to a multivariate Gaussian distribution. Starting from the Markov SIMO channel model, simultaneous maximum ikelihood estimation of the input vector and the channel coefficients reduce to one of obtaining the values of this pair that minimizes the sum of the Euclidean norms between the received and the estimated output vectors. Viterbi algorithm can be used for this purpose provided the trellis diagram of the Markov model can be labeled with the noiseless channel outputs. The problem of identification of the ideal channel outputs, which is the focus of this paper, is then equivalent to designing a Vector Quantizer (VQ) from a training set corresponding to the observed noisy channel outputs. The Linde-Buzo-Gray (LBG)-type clustering algorithms [1] could be used to obtain the noiseless channel output labels from the noisy received vectors. One problem with the use of such algorithms for blind time-varying channel identification is the codebook initialization. This paper looks at two critical issues with regards to the use of VQ for channel identification. The first has to deal with the applicability of this technique in general; we present theoretical results for the conditions under which the technique may be applicable. The second aims at overcoming the codebook initialization problem by proposing a novel approach which attempts to make the first phase of the channel estimation faster than the classical codebook initialization methods. Sample simulation results are provided confirming the effectiveness of the proposed initialization technique.

FSVQ와 퍼지 개념을 이용한 HMM에 기초를 둔 음성 인식 (HMM-based Speech Recognition using FSVQ and Fuzzy Concept)

  • 안태옥
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.90-97
    • /
    • 2003
  • 본 논문은 FSVQ(first section vector quantization)와 퍼지 개념을 이용한 HMM(hidden Markov model)에 기초를 둔 음성인식을 제안한다. 제안된 연구 방법에서는 첫 번째 구간의 코드북(codebook)을 만든 후, 첫 번째 구간의 코드북으로부터, 퍼지 개념을 도입하여 확률값이 큰 순서에 의해 다중 관측열을 구한다. 그 다음, 코드북으로부터 첫 번째 구간의 관측열을 학습시키고 인식할 때에도 같은 개념으로 첫 번째 구간에서의 확률 값이 가장 높은 단어를 인식된 단어로 선택한다. 인식 대상 어휘로는 전철역명을 선택하였으며, 특징 파라메타로는 LPC ?스트럼을 사용하였다. 제안된 방법에 의한 인식 실험을 수행하는 것 이외에도 비교를 위하여 이전에 실험한 몇 가지 방법의 인식 실험을 같은 조건하에서 같은 데이터로 수행한다. 실험 결과, 본 연구에서 제안한 FSVQ와 퍼지 개념을 이용한 HMM에 기초를 둔 방법이 다른 음성 인식방법들보다 인식률이 우수함을 입증하였다.

DMS 모델과 이중 스펙트럼 특징을 이용한 HMM에 의한 음성 인식 (HMM-based Speech Recognition using DMS Model and Double Spectral Feature)

  • 안태옥
    • 한국산학기술학회논문지
    • /
    • 제7권4호
    • /
    • pp.649-655
    • /
    • 2006
  • 본 논문은 화자 독립의 음성인식을 위한 연구로써, DMS 모델에 의한 DMSVQ(Dynamic Multi-Section Vector Quantization) 코드북과 이중 스펙트럼 특징을 이용한 HMM(Hidden Markov Model) 음성인식 방법을 제안한다. 정적 스펙트럼 특징으로서는 LPC ?S스트럼 계수를 이용하였고, 동적 스펙트럼 특징으로는 LPC ?S스트럼의 회귀계수를 사용하였다. 이들 두개의 스펙트럼 특징들을 각각 VQ 코드북으로 양자화되고, DMS 모델을 이용한 HMM은 입력으로써 정적 스펙트럼 특징과 동적 스펙트럼 특징을 받아드림으로써 모델링된다. 제안된 방법에 의한 인식 실험은 기존의 다양한 인식 방법에 의한 인식 실험들과 비교를 위해 동일한 데이터와 조건 하에서 수행하였다. 실험 결과, 본 연구에서 제안한 방법이 기존의 방법들보다 우수한 방법임을 입증하였다.

  • PDF

PCA에 기반한 압축영역에서의 MPEG Video 검색기법 (PCA-Based MPEG Video Retrieval in Compressed Domain)

  • 이경화;강대성
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.28-33
    • /
    • 2003
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 스트림으로부터 DCT DC 계수를 추출하구 이들로 구성된 DE 영상으로부터 장면 전환 검출을 수행한 후 대표 프레임을 추출한다. 또한 추출된 대표 프레임을 PCA(Principal Component Analysis) 방법을 이용하여 데이터베이스의 색인 정보로 저장한 후 입력된 질의 영상과 가장 유사한 대표 영상들을 검색하는 방법에 대해 제안한다. 즉, 추출된 대표 프레임에 대해 주성분해석 기법을 적용하여 통계적인 특성을 가진 데이터를 특징으로 추출함으로써 코드워드의 수에 따른 코드북을 생성하고 이를 데이터베이스의 색인 정보로 저장한다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 나타내고 또한 통계적인 데이터의 특성을 이용하기 때문에 처리 시간과 상당한 양의 메모리 공간을 줄일 수 있음을 확인하였다.