• Title/Summary/Keyword: 벡터양자화

검색결과 318건 처리시간 0.019초

고차 통계를 이용한 잡음 환경에서의 화자식별 (Speaker Identification Using Higher-Order Statistics In Noisy Environment)

  • 신태영;김기성;권영욱;김형순
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.25-35
    • /
    • 1997
  • 음성 신호 처리에 널리사용되어 온 2차 통계에 의한 음성 분석 방법은 잡음 환경에서 성능이 크게 저하되는 단점을 지닌다. 이에 반하여 고차 통계 방법은 Gaussian 잡음 등을 억제하는 특성을 가지고 있어서 잡음 환경에 상대적으로 강인한 음성 특징 추출을 가능하게 한다. 본 논문에서는 고차 통계에 의한 음성 분석 방법을 이용하여 백색 및 유색 잡음 환경에서의 문맥 독립형(text-independent) 화자식별 시스템을 제안하고, 기존의 2차 통계에 의한 방식과 성능을 비교하였다. 본 논문에서의 화자식별 시스템은 벡터 양자화 방법에 기반을 두고 있으며, 고차 통계 방법에 의한 유성음/무성음 판별을 통해 non-Gaussian 특징을 가지면서도 화자 정보가 집중되어 있는 유성음 부분에 대해서만 음성 특징을 추출하여 인식에 사용하였다. 50명의 화자를 대상으로 한 화자식별 실험 결과, 고차 통계 방법이 2차 통계에 의한 방법보다 잡음 환경에서 상대적으로 우수한 인식 성능을 나타냄을 확인하였다.

  • PDF

이동 보상과 분류 벡터 양자화기를 이용한 영상 부호화에 관한 연구 (Ⅱ: 하드웨어 실현) (A Study on the Interframe Image Coding Using Motion Compensated and Classified Vector Quantizer (Ⅱ : Hardware Implementation))

  • 전중남;신태민;최성남;박규태
    • 대한전자공학회논문지
    • /
    • 제27권3호
    • /
    • pp.21-30
    • /
    • 1990
  • 본 논문은 MC-CVQ(motion compensated and classified vector quantization) 알고리듬의 하드웨어 실현에 관한 것으로, $128{\times}128$화소로 구성된 흑백영상을 64Kbps채널로 1초에 약 10장의 화면을 전송할 수 있는 화면간 부호화장치의 제작에 대하여 설명하였다. 위의 조건하에서 보호화를 수행하기 위하여, 시스템을 MC부, CVQ부, 보호화부로 구분하여 마이크로프로그램 제어에 의한 멀티프로세서 구조로 구성하였다. 그리고 MC부와 CVQ부에서 최소 거리 오차를 효율적으로 계산하기 위하여 연산부에는 3~단 파이프라인 구조를 채택하였다. 시스템 제작 후 성능을 평가한 결과, 본 시스템의 화면전송율은 영상신호의 상대적 이동량에 따라 1초에 6~15장 정도임을 확인하였다.

  • PDF

셀룰러 네트워크에서 D2D 통신을 고려한 빔 형성 및 스케줄링 기법 (Beamforming and User Scheduling for Device-to-Device Underlaying Cellular Networks)

  • 박성수;방극준;홍대식
    • 대한전자공학회논문지TC
    • /
    • 제49권2호
    • /
    • pp.9-16
    • /
    • 2012
  • 본 논문에서는 Device-to-Device (D2D) 통신 시스템이 셀룰러 단말기들과 하향 링크의 주파수 자원을 공유할 때 D2D 통신으로 인한 간섭을 완화하기 위한 빔 형성 및 스케줄링 기법을 제안한다. 유니터리 행렬을 이용한 빔 형성 기법과 양자화된 채널 상태 정보의 되먹임 방식을 사용하는 셀룰러 기지국이 D2D 수신 단말기에 미치는 간섭이 최소화되도록 전송 가중치 행렬과 셀룰러 단말기를 선택한다. 기지국으로부터 D2D 수신 단말기에 미치는 간섭을 줄여 D2D 송신 단말기의 전송 전력을 줄임으로써 D2D 통신이 셀룰러 단말기에 미치는 간섭을 최소화한다. 이때 가중치 행렬의 선택을 제한함으로써 발생하는 셀룰러 단말기들의 총 전송률의 저하를 개선하기 위하여 각 코드 벡터가 1개 이상의 유니터리 행렬에 포함되도록 코드북을 구성한다. 모의실험을 통해 제안하는 방식이 D2D 통신으로 인한 간섭을 완화시킬 뿐만 아니라 개선된 코드북을 사용함으로써 셀룰러 단말기의 총 전송률도 향상시킬 수 있음을 보인다.

효율적인 하모닉-CELP 구조를 갖는 저 전송률 음성 부호화기 (Efficient Harmonic-CELP Based Low Bit Rate Speech Coder)

  • 최용수;김경민;윤대희
    • 한국음향학회지
    • /
    • 제20권5호
    • /
    • pp.35-47
    • /
    • 2001
  • 본 논문에서는 하모닉 부호화기와 CELP(Code Excited Linear Prediction) 부호화기의 장점을 고려한 효율적인 저 전송률 하모닉-CELP 음성 부호화기를 제안한다. 제안된 하모닉-CELP 부호화기에서는 프레임 단위 유/무성음 판별에 따라 무성음 구간에서는 고속 CELP방식으로 부호화하고 유성음 구간에서는 개선된 하모닉 부호화를 수행한다. 제안된 부호화기는 무성음 부호화를 위한 RP-VSELP(Regular Pulse Vector Sum Excited Linear Prediction), 유성음 부호화를 위한 간단한 정수 피치 검색, 정수 단위 피치에서의 고속 하모닉 추정, 가변 차원 하모닉 벡터 양자화, 주파수 해상도를 반영한 인지 가중치, 고속 하모닉 합성, 대역별 유성음 정도에 따른 자연성 제어, 다중 모드 등을 주요한 특징으로 하며, 이러한 특징들로 인해 기존의 HVXC(Harmonic Vector eXeited Coder) 부호화기에 비해서 매우 낮은 복잡도를 갖는다. 주관적인 음질 평가 결과, 제안된 2.4 kbps 하모닉-CELP 부호화기는 낮은 지연과 적은 계산량으로 양호한 음질을 얻을 수 있음을 확인하였다.

  • PDF

HEVC를 위한 깊이 영상 고속 모드 결정 방법 (Fast Mode Decision Method for HEVC in Depth Video)

  • 윤다현;호요성
    • 한국통신학회논문지
    • /
    • 제37권1A호
    • /
    • pp.51-56
    • /
    • 2012
  • HEVC는 성능 향상과 더불어 복잡도 또한 크게 증가했다. 본 논문은 깊이 영상의 복잡도를 줄이기 위해 깊이 영상의 특성을 이용한 조기 SKIP과 인터 예측의 고속 모드 결정 알고리즘을 제안한다. 이 알고리즘은 동차 영역에서 SKIP 모드가 자주 발생한다는 점을 이용해 설계됐다. 동차 영역의 SKIP에서 발생한 비용값이 양자화 매개변수에 적응적인 문턱값과, 평균 SKIP의 비용값의 곱보다 작다면 조기 SKIP 모드를 발생시킨다. 그렇지 않은 경우 인터 $2N{\times}2N$의 비용값을 구한 뒤 인터 $2N{\times}2N$의 움직임 벡터가 0이고 부호화 단위의 분산이 인터 예측을 위한 문턱값보다 작다면 인터 $2N{\times}N$과 인터 $N{\times}2N$의 탐색을 수행하지 않는다. 조기 SKIP과 인터 예측을 위한 문턱값은 실험을 통해 결정이 됐고, 실험 결과는 기존의 HEVC와 비교하였을 때 BDBR이 0.24%, BDPSNR이 -0.011 dB로 비트율과 화질의 큰 변화 없이 부호화 시간은 최소 39%에서 최대 82%까지 줄였다.

워터마크를 이용한 전송 채널 에러의 검출 및 은닉 (Error Detection and Concealment of Transmission Error Using Watermark)

  • 박운기;전병우
    • 한국통신학회논문지
    • /
    • 제29권2C호
    • /
    • pp.262-271
    • /
    • 2004
  • 전송 채널에서의 잡음은 시간적으로 연속적인 동영상의 정상적인 복원을 어렵게 하고, 수신측의 복원 영상의 질을 크게 저하시키므로 전송 채널 에러를 정확하게 검출하여 에러에 대한 영향을 최소화 할 수 있는 방법이 필요하다. 본 논문에서는 전송 채널에 의해 발생한 오류를 찾아내고 제거할 수 있도록 전송 데이터 내에 워터마크를 삽입하는 방법을 제안한다. 제안된 방법은 부호화기에서 동영상 압축 데이터의 일부분인 양자화된 DCT 계수의 LSB에 특정한 패턴을 삽입하며, 복호화기에서는 이러한 LSB의 특정한 패턴을 검사함으로써 전송된 데이터의 신뢰성을 확인할 수 있다. 또한 에러에 의해 손상된 부분을 효과적으로 복원하기 위해 움직임 추정 벡터의 유사도 정보를 삽입함으로써 에러가 발생된 블록의 복원 능력을 향상시킬 수 있도록 한다. 제안하는 방법은 에러에 쉽게 노출되는 무선 환경 하의 휴대용 단말기와 같은 동영상 전송ㆍ수신 시스템에 효과적으로 사용될 수 있다.

확률적 방법을 이용한 음성 개성 변환 (Voice Personality Transformation Using a Probabilistic Method)

  • 이기승
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.150-159
    • /
    • 2005
  • 본 논문에서는 임의의 음성을 특정 화자가 발성한 것처럼 들리도록 변환하는 음성 개성 변환 알고리즘에 대해 연구하였다. 제안된 기법은 화자의 음성을 LPC 켑스트럼, 피치, 발성 속도를 사용하여 표현하였으며 각각에 대한 변환 규칙을 생성하여 변환을 수행하였다. LPC 켑스트럼은 혼합 가우시안 모델을 이용한 확률적으로 모델링하고, 두 화자간의 대응관계를 조건 확률로 나타내었다. 확률적인 모델링에 필요한 각종 파라메터들을 얻기 위해 최대 가능도 기법이 사용되었으며, 변환 LPC 켑스트럼은 최소 자승 오차 방법에 근거하여 얻어지도록 하였다. 운율 변환을 위한 변수로 본 논문에서는 피치와 발성 속도를 사용하였으며, 두 음성간의 평균값 비율을 사용하여 운율 변환을 수행하였다. 제안된 기법은 기존 벡터 양자화 기반의 기법과 비교에서, 객관적인 척도로 사용한 평균 켑스트럼 거리 감소율, 가능도 증가율 면에서 우수한 성능을 나타내었다. 주관적인 테스트에서도 기존의 방법과 유사한 인식율을 얻었으며 특히 완만하게 변화하는 스펙트럼 궤적에 따른 고음질이 얻어짐을 확인할 수 있었다.

배경 모델 갱신을 통한 코드북 기반의 전배경 분할 (Codebook-Based Foreground-Background Segmentation with Background Model Updating)

  • 정재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권5호
    • /
    • pp.375-381
    • /
    • 2016
  • 최근 코드북 기반의 전 배경 분리 알고리즘에 대한 연구가 활발히 진행되고 있다. 코드북은 입력 영상 시퀀스로부터 화소당 하나씩 만들어 지는데, 코드북 내의 각 코드워드는 동일 위치의 훈련 화소들을 대상으로 양자화를 수행한 클러스터 대표 벡터이다. 일반적인 코드북 기반 방법들은 초기 배경 모델 생성을 위하여 긴 시간동안 훈련 샘플들의 학습 과정을 거친다. 본 논문에서는 초기 몇 장의 프레임으로 부터 간단한 중위수 연산을 통하여 초기 배경 모델을 생성하고, 시간의 흐름에 따라 변화된 배경 정보를 포함할 수 있도록 코드워드의 사용 빈도수에 기반하여 배경 모델을 갱신한다. 제안한 알고리즘을 OpenCV 3.0과 연동하여 C언어로 구현하여 몇 개의 PETS2009 데이터에 적용 실험하였다. 해당 데이터는 준-주기적 움직임을 갖는 영상 시퀀스, 이동 물체의 일시 정지 등의 시나리오를 포함하고 있다. 실험을 통하여 제안한 방식이 GMM 알고리즘, 표준 코드북 알고리즘에 비하여 우수한 성능을 나타내고 있음을 확인하였다.

영상 부호화를 위한 새로운 사이드 매치 왜곡 함수를 이용한 적응 유한상태 벡터 양자화 기법 (An Adaptive Finite State Vector Quantization Method Using a New Side Match Distortion Function for Image Coding)

  • 이상운;이두수;임인칠
    • 전자공학회논문지S
    • /
    • 제35S권10호
    • /
    • pp.118-125
    • /
    • 1998
  • 본 논문에서는 새로운 사이드 매치 왜곡 함수를 이용한 적응 FSVQ(Finite State Vector Quantization)방법을 제안한다. 기존의 사이드 매치 왜곡 함수는 블럭 경계 사이의 휘도 천이를 부드럽게 해주고 블럭간의 상관 관계가 높은 평탄 영역에서는 적절한 상태 부호책을 작성할 수 있으나 블럭간의 상관 관계가 낮은 윤곽선 영역에서는 적절한 상태 부호책을 작성할 수 없다. 본 논문에서 제안한 왜곡 함수는 기존의 사이드 매치 왜곡 함수에 영상의 특징을 나타내줄 수 있는 분산 값을 가중치로 사용하여 기존의 사이드 매치 왜곡 함수보다 적절한 상태 부호책을 작성할 수 있도록 한다. 또한 상태를 잘못 예측하였을 경우 이를 정정한 후, 처리하게 함으로써 만족할만한 영상의 질을 얻을 수 있도록 한다.

  • PDF

Pan-Tilt-Zoom 카메라를 이용한 파노라마 배경 생성과 객체 추적 (Panorama Background Generation and Object Tracking using Pan-Tilt-Zoom Camera)

  • 백인호;임재현;박경주;백준기
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.55-63
    • /
    • 2008
  • 본 논문은 전 방향을 감시할 수 있는 Pan-Tilt-Zoom(PTZ) 카메라를 이용한 파노라마 배경 생성과 객체 추적 방법을 제안한다. 제안된 방법은 연속되는 두 영상의 외곽 영역에서 미리 정한 지역만 위상정합(phase correlation)을 하여 카메라의 지역 움직임을 빠르게 추정하고 벡터 양자화를 통하여 움직임 추정 오차를 최소화 한다. 추정된 움직임 값을 이용하여 겹침 영역이 존재하는 영상들을 획득하여 실린더에 투영시키고 영상을 재 정렬함으로써 파노라마 배경 영상을 생성할 수 있다. 객체 추적은 미리 생성된 파노라마 배경과 입력 영상의 차분 방법을 이용하여 배경과 객체를 분리하고 객체의 움직임을 추적한다. 제안된 객체 추적 방법은 PTZ 카메라를 이용하여 빠르고 안정적인 배경 생성이 가능하고, 전방향의 객체를 지속적으로 추적하는 것이 가능하다. 제안된 방법은 실시간 처리가 가능하며 넓은 감시 지역에서 객체의 형태를 추적하거나 얼굴인식과 같은 분야에서 이용될 수 있을 것이다.