• 제목/요약/키워드: 코드북 모델

검색결과 33건 처리시간 0.023초

배경 모델 갱신을 통한 코드북 기반의 전배경 분할 (Codebook-Based Foreground-Background Segmentation with Background Model Updating)

  • 정재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권5호
    • /
    • pp.375-381
    • /
    • 2016
  • 최근 코드북 기반의 전 배경 분리 알고리즘에 대한 연구가 활발히 진행되고 있다. 코드북은 입력 영상 시퀀스로부터 화소당 하나씩 만들어 지는데, 코드북 내의 각 코드워드는 동일 위치의 훈련 화소들을 대상으로 양자화를 수행한 클러스터 대표 벡터이다. 일반적인 코드북 기반 방법들은 초기 배경 모델 생성을 위하여 긴 시간동안 훈련 샘플들의 학습 과정을 거친다. 본 논문에서는 초기 몇 장의 프레임으로 부터 간단한 중위수 연산을 통하여 초기 배경 모델을 생성하고, 시간의 흐름에 따라 변화된 배경 정보를 포함할 수 있도록 코드워드의 사용 빈도수에 기반하여 배경 모델을 갱신한다. 제안한 알고리즘을 OpenCV 3.0과 연동하여 C언어로 구현하여 몇 개의 PETS2009 데이터에 적용 실험하였다. 해당 데이터는 준-주기적 움직임을 갖는 영상 시퀀스, 이동 물체의 일시 정지 등의 시나리오를 포함하고 있다. 실험을 통하여 제안한 방식이 GMM 알고리즘, 표준 코드북 알고리즘에 비하여 우수한 성능을 나타내고 있음을 확인하였다.

VQ와 HMM을 이용한 음성인식에서 화자적응에 관한 연구 (Speaker Adaptation in VQ and HMM Based Speech Recognition)

  • 이대룡
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1991년도 학술발표회 논문집
    • /
    • pp.54-57
    • /
    • 1991
  • 본 논무에서는 HMM과 VQ를 이용한 고립단어에 대한 화자종속 및 화자독립 음성인식시스템을 만들고 여기에 화자적응을 하는 방법에 대한 연구를 했다. 화자적응방법에는 크게 VQ코드북을 적응시키는 방법과 HMM패러미터블 적응시키는 방법이 있다. 코드북적응을 하는 방법으로서 기존코드북에 대해 새로운화자의 적응음성을 양자화한 뒤 각 코드벡터에 해당하는 적응음성의 평균을 구해서 새로운 화자의 코드북을 구해주는 방법과 기준코드북에 대해 새로운화자의 적응음성을 양자화할 때 HMM의 각 상태에서 각각의 코드벡터를 발생할 확률을 거리오차의 계산에서 고려해 비록 거리오차는 크지만 그 코드벡터를 발생할 확률이 매우 높으면 적응음성이 그 코드벡터에 index되게해서 각 코드벡터에 해당하는 모든 적응음성데이타의 평균을 새로운 코드북으로 하는 두가지 알고리즘을 제안한다. 이렇게 함으로써 기존의 기준코드북을 초기 코드북으로해서 LBG알고리즘을 사용해서 적응음성데이타에 대한 새로운 코드북을 만드는 방법에 비해 5-10배의 계산시간을 감소하게 된다. 이 새로운 코드북으로 적응음성데이타를 다시 index해서 이 index된 음성렬로 HMM패러미터를 적응했다. 제안된 알고리즘이 코드북적응을 하는 경우에 기존의 적응방법에 비해 5-10배의 계산 시간을 단축하면서 인식률에서는 더 나은결과를 얻었다. 또 같은 적응방법에 대해서 화자종속모델 보다는 화자독립모델에 대해서 화자적응하는 것이 더 나은 인식결과를 보여주었다.

  • PDF

한국어 음소 HMM 모델 결정을 위한 파라미터 비교 연구 (A Comparative Study on Parameter for Korean Phoneme-based HMM Model Decision)

  • 권혁제
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.302-305
    • /
    • 1998
  • 음소의 확률적 분포를 이용하는 음소 HMM 모델을 결정하기 위한 여러 가지 거리 측정방법에 대한 연구이다. 음소 HMM 모델 결정을 위해서 LPC 계수를 이용하고, 거리 측정자를 LPC 계수, LPC 스첵트럼, LPC 켑스트럼 등의 파라미터를 이용하고, 또한 양자화 과정은 k-means 와 LBG 알고리즘을 혼합한 하이브리드 알고리듬을 사용하였다. LPC 코드북을 구성하기 위해 세 가지 파라미터를 유클리디안 거리로 거리측정에 이용하였다. 이렇게 양자화한 파라미터의 평균과 분산을 구하고, 양자화한 파라미터 코드북의 확률갑승ㄹ 비교해 한국어 음소 HMM 모델 결정을 위한 거리 측정 파라미터를 비교하였으며, 그 결과 LPC 계수를 주파수 영역으로 변환하여 유클리디안 거리를 이용한 코드북의 분산이 작으므로 상대적으로 높은 확률을 가짐을 보았다.

  • PDF

공간 채널 모델의 통계적 특성을 활용하는 MIMO 시스템의 코드북 결정 및 성능 평가 (Determination and Performance Evaluation of a Codebook for MIMO Systems Utilizing Statistical Properties of The Spatial Channel Model)

  • 서준엽;강호식;성원진
    • 전자공학회논문지
    • /
    • 제52권7호
    • /
    • pp.22-30
    • /
    • 2015
  • LTE (long-term evolution) MIMO 시스템에서는 제한된 피드백 환경 하에서 추정된 채널 정보를 활용하기 위한 코드북이 사용되고 있으며, 이와 관련된 연구도 활발히 진행되었다. 기존에 활용된 방식으로는 VQ (vector quantization) 기반 및 DFT(discrete fourier transform) 기반으로 생성된 코드벡터를 활용하는 코드북이 있으며, LTE 표준에서도 이를 변형한 방식을 최대 8개의 송신 안테나에 대해 적용할 수 있게 규정하고 있다. 그러나 안테나 개수가 추가적으로 증가하고, 공간 채널 모델이 LTE 시스템 전송 성능 평가에 기본적인 모델로 활용됨에 따라, 이에 따른 새로운 빔포밍 방안 및 코드북 설계가 필요하다. 본 논문에서는 LTE 전송 성능 평가에 활용되는 3차원 공간 채널 모델 (3D Spatial Channel Model; 3D-SCM)의 구현을 통해 생성된 채널의 핵심적인 통계적 특성을 분석하고, 이에 따른 코드북 설계의 방향성을 제시하고자 한다. 특히 DFT 기반 코드 북 활용 시, 기존의 균일위상 DFT 코드북을 개선한 비균일위상 DFT 코드북을 제안하고, 주어진 SCM 환경에서 성능을 평가한다. 코드벡터 설계에 필요한 인접한 안테나 원소 간의 위상차의 통계적 특성의 경우 SCM에서 뚜렷한 경향성이 존재하며, 이를 적절히 활용함으로써 기존 방식 대비 이득을 발생시킬 수 있다.

삼각 부등식을 이용한 온라인 VQ 코드북 생성 방법 (Online VQ Codebook Generation using a Triangle Inequality)

  • 이현진
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권3호
    • /
    • pp.373-379
    • /
    • 2015
  • 본 논문에서는 실시간으로, 문서, 웹 페이지, 블로그, tweet 등 텍스트 정보와 센서, 머신데이터등 IoT의 데이터가 생성되는 상황에서 새로 추가되는 데이터들을 기존에 만들어진 VQ 코드북에 추가시키면서, 기존 VQ 코드북 모델을 실시간으로 갱신하기 위한 온라인 VQ 코드북 생성 방법을 제안한다. 기존에 일괄 작업으로 만들어진 VQ 코드북의 성능을 저하시키지 않으면서, 새로 추가된 데이터를 활용하여 VQ 코드북을 점진적으로 수정하는 방식으로 삼각 부등식을 활용하여 높은 정확도와 속도를 보일 수 있었다. 테스트 데이터에 적용한 결과 일괄 작업과 유사한 성능을 보이면서, 다른 온라인 K-Means 보다 빠른 속도를 보였다.

연속적인 배경 모델 학습을 이용한 코드북 기반의 전경 추출 알고리즘 (Codebook-Based Foreground Extraction Algorithm with Continuous Learning of Background)

  • 정재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권4호
    • /
    • pp.449-455
    • /
    • 2014
  • 이동 물체의 검출은 비디오 감시, 보행자의 행동 분석과 같은 컴퓨터 시각 분야에서 매우 중요한 전처리 작업이다. 이는 실제 외부 환경을 대상으로 할 때, 영상 시퀀스에 존재하는 배경의 불규칙한 움직임, 조명 변화, 그림자, 배경 물체의 위상 변화 및 잡음 등으로 인하여 매우 어려운 작업이다. 본 논문에서는 코드북 기반의 전경 검출 알고리즘을 제안한다. 코드북은 입력 영상으로부터 얻어지는 배경화소에 대한 정보 데이터베이스이다. 먼저, 첫 번째 프레임을 배경 영상으로 가정하고 이를 입력 영상과 비교하여 차 영상을 구한다. 구해진 차 영상에는 순수한 이동 물체뿐만 아니라, 잡음까지 포함된다. 둘째로, 전경으로 검출된 화소의 색상과 밝기 값을 가지고 코드북을 조사하여 존재하는 경우 잘못 추출된 전경 화소로 판단하고 전경에서 제거한다. 마지막으로, 다음번 입력되는 프레임을 반복 처리하기 위하여 배경 영상을 새롭게 갱신하는데, 배경 화소로 검출된 화소의 경우에는 현재의 입력 영상으로부터 추정되며, 전경 화소로 검출된 경우에는 이전 배경 영상의 화소 값을 복사하여 사용한다. 제안한 알고리즘을 PETS2009 데이터에 적용한 결과를 GMM 알고리즘과 표준 코드북 알고리즘의 결과와 비교하여 보인다.

코드북과 VQ 최적화에 의한 음소/고립단어 인식률 분석 (Analysis of Phoneme/Isolated Word Recognition Rate Using Codebook and VQ Optimization)

  • 안홍진;주상현;진원;김기두
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.675-678
    • /
    • 1999
  • 본 논문에서는 음소별 코드북 개수의 선택과 벡터 양자화에 따른 음소 인식률과 고립단어 인식률에 대하여 다룬다. 음성모델은 이산 확률 밀도를 갖는 DHMM(Discrete Hidden Markov Model)을 사용하였으며, 코드북 생성과 벡터 양자화 알고리즘으로는 K-means 알고리즘과 LBG(Linde, Buzo, Gray) 알고리즘을 사용하였다 음소별 코드북 개수와 벡터 양자화를 최적화함으로써 음소 인식률을 향상시킬 수 있으며, 그 결과 안정된 고립단어 인식률을 얻을 수 있다.

  • PDF

음소단위 코드북간의 확률적 전이 모델을 이용한 한국어 숫자음 인식에 관한 연구 (Isolated Korean Digits Recognition Using Stochasitc Transition Models With Phoneme-based VQ Codebooks)

  • 최환진;오영환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.149-157
    • /
    • 1993
  • 음성인식을 위해 다양한 방법들이 제안되어 있다. 본 연구에서는 음소단위 각각의 벡터 양자화된 코드북의 색인을 학습하는 HMM을 이용하여 한국어 숫자음을 대상으로 인식 실험을 수행하였다. 실험결과, 기존의 단어단위 HMM과 음소단위로 이루어진 유한상태기계(FSM)구조의 인식기에 비해 높은 인식율을 보였다.

  • PDF

LTE-Advanced 시스템의 선부호화된 상향 링크 성능 분석 (Performance Analysis of Precoded LTE-Advanced Uplink System)

  • 김상구;이신;김영주
    • 대한전자공학회논문지TC
    • /
    • 제48권5호
    • /
    • pp.8-15
    • /
    • 2011
  • LTE-Advanced 시스템은 하향링크에서 1Gbps 상향링크에서 500Mbps 데이터 송신율을 목표로 한다. 이는 100MHz 이상의 스펙트럼 할당과 상향링크에서의 진보한 MIMO 안테나 기법에 의해 이루어진다. 본 논문은 LTE-A에서 정의하는 SC-FDMA 시스템 모델에서 LTE 하향링크의 코드북, SVD 코드북, EGT 코드북을 포함하는 상향링크 선부호화 기법을 분석한다. 마지막으로 SC-FDMA 기법에서도 발생하는 PAPR을 컴퓨터 시뮬레이션으로 분석하여, 비선형 전력 증폭기를 송신부에 고려한 채널 모델에서 동 이득 전송 기법이 다른 선 부호화 기법보다 우수함을 증명한다.

공간 채널 모델의 통계적 특성을 반영한 다중 랭크 코드북의 설계 및 성능 이득 평가 (Design and Performance Gain Evaluation of a Multi-Rank Codebook Utilizing Statistical Properties of the Spatial Channel Model)

  • 김창현;성원진
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.723-731
    • /
    • 2016
  • 5G 이동무선통신에서 요구되는 증가된 데이터 속도를 제공하기 위한 핵심적인 기술 축은 대규모 어레이를 활용하는 MIMO 전송을 통한 주파수 효율의 향상이다. MIMO 전송을 위해서는 CSI-RS (channel state information-reference signaling)를 이용하는 채널 추정 및 추정 결과에 적합한 빔포밍이 필요하며, 따라서 빔포밍 벡터를 정의하는 코드북의 설계는 매우 중요한 이슈이다. 본 논문에서는 공간채널모델을 이용하여 생성된 채널의 통계적인 특성을 활용하여 DFT (discrete Fourier transform) 행렬 기반 다중 랭크 코드북의 설계 방안을 제안하였다. 제안 방식은 인접한 안테나 원소 간 위상차의 분포와 전송 레이어 별 선택되는 코드벡터의 특징을 고려하여 PMI (precoding matrix indicator)의 구조 변경을 하였으며, LTE (long-term evolution) 시스템에서 사용 중인 3GPP 표준 코드북과의 성능 비교를 통하여 제안 방식의 이득을 산출하고 검증하였다.