• 제목/요약/키워드: 벡터양자화

검색결과 318건 처리시간 0.022초

벡터 양자화를 위한 학습 알고리즘을 이용한 음성 전송 기술에 관한 연구 (A study on the competitive learning algorithm for robust vector qantization to transmit speech signal)

  • 홍강유;박상희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 G
    • /
    • pp.3150-3152
    • /
    • 1999
  • The efficient representation and encoding of signals with limited resources, e.g., finite storage capacity and restricted transmission bandwidth, is a fundamental problem in technical information processing systems. Typically under realistic circumstances, the encoding and communication of message has to deal with different sources of noise and disturbances. In this paper, I propose a unifying approach to data compression by robust vector quantization, which explicitly deals with channel noise, and random elimination of prototypes. The resulting algorithm is able to limit the detrimental effect of noise in a very general communication scenario. In this paper, based on the robust vector quantization I have an experiment about speech coding.

  • PDF

영상 기반 로붓 제어 시스템을 위한 벡터 양자화 최적 퍼지 시스템 설계 (A Design of Vector Quantization Optimal Fuzzy Systems for Vision-Based Robot Control Systems)

  • 김영중;김영락;김범수;임묘택
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 D
    • /
    • pp.2447-2449
    • /
    • 2003
  • In this paper, optimal fuzzy systems using vector quantization and fuzzy logic controllers are designed for vision-based robot control systems. The complexity of the optimal fuzzy system for vision-based control systems is so great that it can not be applied to real vision-based control systems or it can not be useful, because there are so many input-output pairs. Therefore, we generally use the clustering of input-output pairs, in order to reduce the complexity of optimal fuzzy systems. To increase the effectiveness of the clustering, a vector quantization clustering method is proposed. In order to verify the effectiveness of the proposed method experimentally, it is applied to a vision-based arm robot control system.

  • PDF

화면 간 예측에서 인코딩 정보를 고려한 딥러닝 기반 인루프 필터 (Considering Encoding Information for CNN based In-loop Filter in Inter Video Coding)

  • 김양우;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.143-144
    • /
    • 2020
  • VVC (Versatile Video Coding)는 HEVC이후 차세대 표준 비디오 코딩으로 JVET(Joint Video Exploration)에 의해 2018년 표준화를 시작하였다. VVC에는 복원픽쳐의 변환-양자화에러에 의해 발생한 블로어, 블로킹, 링잉 아티팩트를 감소시키기 위하여 deblocking filter (DF), sample adaptive offset (SAO), adaptive loop filter(ALF)와 같은 모듈을 사용한다. 한편 CNN (Convolutional Neural Network)은 최근 이미지와 비디오 복원에 높은 성능을 보이고 있다. VVC에서 픽쳐는 CTU (Coding Tree Unit)으로 분할되고 각 CTU는 다시 CU (Coding Unit)으로 분할된다. 그리고 인코딩을 위한 중요한 정보들이 Picture, CTU, CU단위로 디코더에 전송된다. 이 논문에서는 화면 간 예측으로 인코딩 된 픽처에서 블록과 픽처정보를 이용한 딥러닝 기반의 인루프 필터 모델을 제안한다. 제안하는 모델은 화면 간 예측에서 QP, 4×4 블록단위의 모션벡터, 참조블록과의 시간적거리, CU의 깊이를 모델에 추가적인 정보로 이용한다.

  • PDF

밀리미터파를 이용한 빔 조향 기반의 에너지 전송 기술 (Millimeter Wave Energy Transfer based on Beam Steering)

  • 한용규;정상원;이충용
    • 전자공학회논문지
    • /
    • 제54권4호
    • /
    • pp.10-15
    • /
    • 2017
  • 무선 주파수 에너지 전송에 있어 최적의 전처리 기법으로 알려진 전-디지털 에너지 빔포밍은 벡터 양자화를 사용하므로 채널 피드백 부담이 크다. 이러한 피드백 부담을 줄이기 위해 스칼라 양자화를 사용해 채널을 피드백하는 빔 조향 기반의 에너지 전송 기술을 고려할 수 있다. 현재까지의 빔 조향 기반의 에너지 전송 기술에 대한 연구는 특수한 채널 환경 및 기지국이 채널 정보를 완벽히 알고 있는 상황에서 진행되었다. 본 논문에서는 현실성을 반영한 채널 모델을 사용하고 채널 추정 오차가 있는 환경에서 빔 조향 기법을 전-디지털 에너지 빔포밍과 비교하여 성능을 분석하였다. 모의실험을 통해 채널 환경, 기지국과 단말의 안테나 수 및 상호 간의 거리, 그리고 채널 추정 오차에 따른 성능을 확인하고 그 원인을 분석한다.

대역의 특성을 이용한 웨이블렛 기반 영상 압축 부호화 (Wavelet-Based Image Compression Using the Properties of Subbands)

  • 박성완;강의성;문동영;고성제
    • 방송공학회논문지
    • /
    • 제1권2호
    • /
    • pp.118-132
    • /
    • 1996
  • 본 논문에서는 웨이블렛 변환에 의해서 얻어진 고주파 대역에 웨이블렛 변환을 반복 적용하면 분해된 대역들이 필터링 방향에 따라서 대역 내의 웨이블렛 계수의 자승합으로 정의되는 에너지량을 다르게 갖는 특성을 이용하여 영상을 압축 부호화한다. 2차원 영상에 웨이블렛 변환을 적용하면 하나의 저해상도 영상과 세 개의 고주파 대역을 얻을 수 있다. 원영상에 포함되어 있는 고주파 성분은 웨이블렛 변환에 의해서 수평 방향, 수직 방향, 대각 방향의 윤곽선 형태로 세 개의 고주파 대역에 나뉘어서 존재하게 된다. 이러한 세 개의 고주파 대역에 다시 웨이블렛 변환을 적용하면, 윤곽선 방향과 동일한 방향으로 저역 통과 필터링되어 얻어진 대역에서는 에너지량이 크게 나타나지만, 윤곽선 방향과 동일한 방향으로 고역 통과 필터링되어 얻어진 대역에서는 에너지량이 적게 나타난다. 그러므로, 효율적인 압축을 위하여 에너지량이 적은 대역들을 부호화 과정에서 제외하며 제외되지 않은 나머지 대역들은 대역에 따라 DPCM 또는 임계값을 이용하여 양자화한 후에 엔트로피 부호화한다. 본 논문에서 제안한 방법은 압축률과 화질면에서 기존의 웨이블렛 변환과 벡터 양자화를 이용한 방법보다 우수한 성능을 보인다는 것을 실험을 통하여 제시하였다.

  • PDF

영역 특징벡터를 이용한 내용기반 영상검색 (Content-Based Image Retrieval using Region Feature Vector)

  • 김동우;송영준;김영길;안재형
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.47-52
    • /
    • 2006
  • 본 논문은 기존의 컬러 히스토그램 방법들의 단점을 극복하고자 영역 특징백터를 이용한 영상 검색 방법을 제안한다. 컬러 히스토그램 검색방법들은 양자화 오류 등의 이유로 정확성이 떨어지는 단점이 있다 이를 해결하기 위해 제안 방법은 색상 정보를 HSY 공간으로 변환하여 순수 색상 정보인 hue 성분만을 양자화하여 히스토그램을 구하고, 이를 명암, 이동, 회전등에 강인한 검색 특징으로 사용한다. 또한 컬러 히스토그램 방법들의 가장 큰 문제점인 공간 정보가 부족한 것은 영상을 16개 영역으로 나눠서 각 영역간의 비교를 통해 해결한다. 그리고 색상 검색에 추가적으로 모양 특징인 에지와 질감 특징인 DCT 변환의 DC를 이용하여 검색의 정확도를 높인다 1,000개의 컬러 영상을 사용해 실험한 결과 기존의 방법들 보다 좋은 정확성을 보인다.

MLT 여기신호를 이용한 광대역 음성 부호화기 설계 (Design of Wideband Speech Coder Using the MLT Residual Signal)

  • 오연선;신재현;이인성
    • 한국음향학회지
    • /
    • 제24권5호
    • /
    • pp.248-254
    • /
    • 2005
  • 본 논문에서는 대역분할 광대역 음성 부호화기의 구조와 음질 향상을 위한 새로운 고대역 구조를 제안한다. 대역분할 방식에 의해 광대역 음성은 저대역 ($O\~4kHz$) 음성과 고대역 ($4\~8kHz$) 음성으로 나뉘어 지고 각각 G.729E와 MLT(Modulated Lapped Transform) 여기모델을 적용하여 서로 독립된 방식으로 부호화한다. 4kbps의 낮은 전송률로 부호화되는 고대역에서는 MLT 여기모델을 효율적으로 이용하기 위하여 유 무성음을 구별하였고 유성음에 대해서는 저대역 피치주기를 이용한 MLT peak picking 방법을 적용하였다. 즉, MLT 변환된 여기신호는 주기적인 피크를 갖는 주기신호로 나타나며 이때의 피크값을 추출하여 양자화하여 전송한다. 무성음에 대해서는 에너지 값에 따라 비트를 달리 적용하고, 선형예측 스펙트럴 응답이 가중된 MLT 벡터 양자화 방법을 적용하였다. 제안된 15.8kbps 광대역 음성 부호화기의 성능평가는 주관적인 음질평가로 선호도 테스트를 수행하였다.

사상멤버쉽함수에 의한 화자적응 단어인식 (Speaker-adaptive Word Recognition Using Mapped Membership Function)

  • 이기영;최갑석
    • 한국음향학회지
    • /
    • 제11권3호
    • /
    • pp.40-52
    • /
    • 1992
  • 본논문에서는 불특정화자 음성인식의 문제점이 되는 개인차에 의한 변동을 흡수하기 위하여 사상멤버쉽함수에 의한 화자적응 단어인식 방법을 제안하였다. 이방법의 학습과정에서는 미지화자의 표준화자의 스펙트럼패턴 사이에서 작성된 사상코드북에 퍼지이론을 도입하여 사상멤버쉽함수를 작성하였으며, 인식과정에서는 미지화자의 음성패턴을 사상멤버쉽함수에 의해 표준화자의 음성패턴에 적응된 패턴으로 재구성하고 뉴럴-퍼지패턴매칭에 의해 단어를 인식하였다. 본 방법의 타당성을 평가하기 위하여, 28개의 DDD 지역명을 대상으로 실험한 결과, 종래의 사상코드북에 의한 벡터양자화 화자적응방법에서는 64.9[%], 퍼지벡터양자화 화자적응방법에서는 76.1[%]의 인식율을 얻었으나, 사상멤버쉽함수에 의한 화자적응방법에서는 95.4[%]의 향상된 인식율을 얻으므로써 인식성능의 우수함을 확인하였다. 또한 사상멤버쉽함수의 작성과정에서는 반복된 학습과정이 불피요하며, 기억용량과 계산량도 사상코드북에 의한 화자적응방법보다 각각 1/30, 1/500배 정도였다.

  • PDF

연속분포 HMM을 이용한 한국어 연속 음성 인식 시스템 개발 (On the Development of a Continuous Speech Recognition System Using Continuous Hidden Markov Model for Korean Language)

  • 김도영;박용규;권오욱;은종관;박성현
    • 한국음향학회지
    • /
    • 제13권1호
    • /
    • pp.24-31
    • /
    • 1994
  • 본 논문에서는 연속분포 hidden Markov모델을 이용한 화자독립 연속 음성 인식 시스템에 관해 기술한다. 연속분포 모델은 평균과 분산 벡터로 구성되며 음성신호를 직접 모델링하여 양자화 왜곡이 없어진다. 특징벡터는 filter bank 계수 및 그 1, 2차 미분계수를 사용하여 음성신호의 동적 특성을 반영하였다. Segmental K-means 알고리즘을 이용하여 학습하였으며, 연속어 인식에서 가장 문제가 되는 조음화 현상으로 인한 인식률 저하를 막기 위해 앞뒤의 음소를 고려해주는 triphone을 인식단위로 사용하였다. Search 알고리즘으로는 시간 면에서 효율이 좋은 one-pass search 알고리즘을 사용하였다 성능 평가를 위한 회자 독립인식 실험에서 문법이 없을 경우 $83\%$, finite state network을 적용한 경우에는 $94\%$의 인식률을 나타내었다.

  • PDF

맵리듀스를 사용한 디컴바인드 분산 VQ 코드북 생성 방법 (Decombined Distributed Parallel VQ Codebook Generation Based on MapReduce)

  • 이현진
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권3호
    • /
    • pp.365-371
    • /
    • 2014
  • 빅 데이터(Big Data)시대로 접어들면서 기존의 IT 환경에서 만들어진 알고리즘들은 하둡과 같은 분산 아키텍처에 그대로 적용할 수 없거나 효율이 떨어진다. 따라서, 맵리듀스와 같은 분산 프레임워크를 적용한 새로운 알고리즘들이 필요하다. 벡터 양자화에 많이 사용되는 Lloyd의 알고리즘도 맵리듀스를 사용하여 개발이 이루어지고 있다. 본 논문에서는 기존의 맵리듀스를 사용한 분산 VQ 코드북 생성 알고리즘을 수정하여 좀 더 빠른 분석 결과를 보일 수 있는 디컴바인드 분산 VQ 코드북 생성 알고리즘을 제안하였다. 제안하는 알고리즘을 빅 데이터에 적용한 결과 기존 방법보다 높은 성능을 보인 것을 확인할 수 있었다.