• Title/Summary/Keyword: 양자화기

검색결과 253건 처리시간 0.021초

윤곽선 맵과 다중 면 사이드 매치 유한상태 벡터 양자화를 이용한 영상 압축 (Image Compression Using Edge Map And Multi-Sided Side Match Finite-State Vector Quantization)

  • 조성환;김응성
    • 한국산학기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.1419-1427
    • /
    • 2007
  • 본 논문에서는 영상의 윤곽선을 검출하여 배경 블록과 윤곽선 블록으로 분류하고 윤곽선 맵을 작성하여, 윤곽선 블록에 대해서는 다시 DCT의 AC 계수를 사용하여 16개로 세분화한 후, 다중 면 사이드 매치 유한상태 벡터양자화를 수행하는 알고리듬을 제안한다. 윤곽선 맵의 정보에 따라 각각 주 부호책으로부터 상태 부호책을 작성하며, 현재 블록의 B면 또는 3면에 대해 사이드 매치 계산을 수행한다. 전송 비트 수를 줄이기 위해 먼저 부호화되는 블록들 중 배경 블록에 한하여 주 부호책으로 부호화 할 것인지를 결정한다. 또한 복호화기로 전송하는 부호단어 인덱스의 할당 비트를 줄이기 위해서 가변 길이 부호화를 수행한다. Zelda, Lenna, Bridge, Peppers 영상에 대하여 본 알고리듬으로 영상을 부호화했을 때 SMVQ와 TSMVQ 알고리듬보다 더 좋은 영상의 화질을 얻을 수 있었다.

  • PDF

ATSC DTV 수신기를 위해 변형된 트렐리스 복호기를 사용하는 블라인드 판정 궤환 등화기 (Blind Decision Feedback Equalizer with a Modified Trellis Decoder for ATSC DTV Receivers)

  • 박성익;김형남;김승원;이수인
    • 방송공학회논문지
    • /
    • 제8권4호
    • /
    • pp.481-491
    • /
    • 2003
  • 본 논문에서는 ATSC DTV 수신기를 위한 준 최적화된 판정 궤환 등화기 (decision feedback equalizer; DFE)를 제안한다. 본 논문에서 제안하는 DFE는 TBD (Trellis Back Depth)가 1인 변형된 트렐리스 복호기 (modified trellis decoder; MTD)를 판정 장치로 사용함으로써 낮은 복잡도를 가질 뿐만 아니라 에러 전파가 없는 최적화된 DFE에 근접하는 성능을 보인다. MTD는 branch metric의 계산을 위해 ED (Euclidean Distance)의 자승 대신 AD (Absolute Distance)를 사용하기 때문에 낮은 복잡도를 가진다. 또한, 일반적으로 사용되는 판정 장치인 양자화기(slicer)에 비해 매우 낮은 판정 에러 확률을 가지며, ED를 사용하는 트렐리스 복호기 (trellis decoder: TD)와 비슷한 성능을 가진다. 판정 장치에서의 낮은 에러 확률은 수렴 속도와 잔류 에러 측면에서 우수한 수렴 성능을 야기시키며, 전산 실험을 통해 MTD를 가지는 블라인드 DFE의 성능을 검증한다.

QCELP에서 중첩된 코드북 검색의 개선 (Improvement of Overlapped Codebook Search in QCELP)

  • 박광철;한승진;이정현
    • 정보처리학회논문지C
    • /
    • 제8C권1호
    • /
    • pp.105-112
    • /
    • 2001
  • 본 논문에서는 이동통신 시스템에서 사용할 수 있는 잡음에 강인하면서 음질이 개선된 QCELP 코드북 검색을 제안한다. 기존 QCELP는 고정 코드 북을 한 번 검색하지만, 본 논문에서는 두 번에서 다섯 번까지 검색을 하고 이를 실험해 본 결과 두 번 검색이 전송률에 따른 음질향상이 최적임을 알게 되었다. 따라서 본 논문에서는 두 번의 정밀 양자화를 통해 여기신호를 상세히 나타내므로써 음질을 향상시키는 개선된 QCELP 부호화기를 제안한다. 실험에서 잡음을 고려하지 않은 환경(강의실, 가정집, 거리, 연구실 등)에서 얻은 음성을 입력자료로 사용하고, 음질은 SNR과 segSNR을 이용하여 측정하였다. 실험 결과, 개선된 QCELP는 기존 QCELP 보다 SNR, segSNR에서 각각 38.35%, 65.51% 향상되었다.

  • PDF

선형 변환망을 이용한 화자적응 음성인식 (Speaker Adaptation Using Linear Transformation Network in Speech Recognition)

  • 이기희
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.90-97
    • /
    • 2000
  • 본 논문에서는 불특정 화자의 음성에 대해서도 신뢰성 있는 인식이 이루어지도록 하는 음성인식 시스템을 구현하기 위한 화자적응 음성인식 기법을 제안한다. 제안한 화자적응 기법에 의한 음성인식 시스템은 표준화자의 음성특징을 1차선형 변환 망에 의해 새로운 화자의 음성특징에 선형적으로 적응하여 인식하며. 그 구성은 다층퍼셉트론을 퍼지 벡터양자화기로 사용하는 반연속 HMM을 기반으로 한다 구현한 인식시스템은 그 성능을 확인하기 위해 고립단어 인식실험을 수행하였다. 그 결과, 화자적응 인식인 경우가 화자적응 수행하지 않은 시스템에 비해 인식률이 개선됨을 보였다.

  • PDF

스테레오스코픽 3차원 지상파 방송을 위한 합동 비트율 제어 연구 (Joint Rate Control Scheme for Terrestrial Stereoscopic 3DTV Broadcast)

  • 장용준;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.14-17
    • /
    • 2010
  • 최근 3차원 영상 컨텐츠와 디스플레이의 증가에 따라 지상파 방송사들의 3차원 텔레비전(3DTV) 방송을 위한 준비가 시작되고 있다. 하지만 현재 지상파 방송사들이 비디오 전송을 위하여 사용하고 있는 약 18Mbps의 대역폭 제한 내에서는 고화질의 3차원 스테레오스코픽 영상을 전송하는 데 한계가 있다. 따라서 보다 고화질의 3D 영상 방송 서비스를 제공하는 동시에, 기존 2DTV 시청자를 위한 호환성을 유지하기 위하여 좌영상은 현재 지상파 방송에서 채택하고 있는 MPEG-2 기반, 그리고 우영상은 보다 압축 효율이 높은 H.264/AVC 기반의 비디오 압축 및 전송 시스템이 고려되고 있다. 본 연구에서는 이러한 지상파 3DTV 방송 조건 하에서, 이종 부호화기에서 산출되는 비트스트림의 양을 대역폭 제한에 맞게 조절하는 합동 비트율 제어 방법을 제안한다. 제안하는 합동 비트율 제어 방법은 H.264/AVC의 비트율 제어 방법인 이차 율-양자화 모델(quadratic rate-quantization model)을 MPEG-2 부호화 과정 내에 구현하여 압축된 두 비디오 비트스트림의 합이 대역폭 조건을 충족시키면서 화질왜곡을 최소화하는 양자화계수를 계산하도록 설계 되었다. 또한 좌영상과 우영상의 화질의 차이가 일정하게 유지되도록 최적화 문제에서 제약식을 추가하여 양자화계수를 계산하였다. 실험결과 제안한 지상파 스테레오스코픽 3DTV를 위한 합동 비트율 제어 알고리듬은 목표 비트율을 맞추는 동시에, MPEG-2 및 H.264/AVC의 기존 비트율 제어 알고리듬 방법에 비하여 좌/우 영상의 평균 화질 합은 비슷한 수준을 나타내었고, 화질 절대차의 평균 및 변동은 큰 수준으로 감소시켰다.

  • PDF

퍼지 벡터 양자화기 사상화와 신경망에 의한 화자적응 음성합성 (Speaker-Adaptive Speech Synthesis based on Fuzzy Vector Quantizer Mapping and Neural Networks)

  • 이진이;이광형
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.149-160
    • /
    • 1997
  • 본 연구에서는 퍼지사상화(fuzzy mapping)와 FLVQ(fuzzy learning vector quantization)에 의한 사상된(mapped)코드북을 사용하는 화자적용 음성합성 알고리즘 을 제안하고, 기존의 음성합성결과와 비교한다. 입력화자와 기준화자의 코드북은 FLVQ 방법으로 작성한다. 사상된 코드북은 퍼지 히스토그램을 작성하여 이들을 선형 결합함으로써 얻어지는 퍼지 사상화에 의하여 작성된다. 대응 코드벡터의 퍼지 히스 토그램은 동일 입력벡터에 대해 선택된 입력화자의 코드벡터와 기준화자의 코드벡터 사이의 DTW(dynamic time warping)을 행하여 대응하는 코드벡터들의 소속값 (membership value)을 누적하여 얻는다. 음성합성시에는 사상된 코드북을 사용하여 입력화자의 음성을 퍼지벡터 양자화한 다음, FCM(fuzzy c means) 합성규칙을 사용하 여 사상된 코드북내의 코드벡터가 아닌 새로운 하나의 합성벡터를 얻게 되어 좀 더 입력화자에 적응된 합성음을 얻게 된다. 이 기술의 성능평가는 성별이 서로 다른 화 자를 입력화자 및 기준화자로 선정하여 입력화자의 음성에 가까운 정도로 평가하였으 며 그 결과 기존의 음성합성보다 입력화자에 더 적용된 합성음을 얻었다.

  • PDF

깊이변화지도를 이용한 DIBR 공격의 강인성 블라인드 워터마킹 (Robust and Blind Watermarking for DIBR Using a Depth Variation Map)

  • 이용석;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.845-860
    • /
    • 2016
  • 본 논문에서는 시청자측에서 수신한 텍스처 영상과 그 깊이영상으로 임의의 시점 영상을 렌더링하여 시청하는 자유시점 2D 또는 3D 영상의 지적재산권 보호를 위한 디지털 워터마킹 기술을 제안한다. 이 경우 악의적이지는 않지만 시점이동공격이 필연적으로 발생되며, 여기에 삽입된 워터마크 정보를 제거하기 위한 악의적인 공격을 추가로 고려하여야 한다. 본 논문에서는 시점이동에 덜 민감한 부분을 찾기 위해 깊이영상을 이용하여 깊이변화지도를 생성하고, 원 영상을 3 레벨 2DDWT를 수행하여 각 레벨의 LH 부대역에서 깊이변화지도를 참조하여 워터마킹할 위치를 결정한다. 각 화소에 한 워터마크 비트를 삽입하는 방법은 선형 양자화기를 사용하는데, 양자화 스텝은 각 부대역의 에너지 값에 따라 결정한다. 워터마크 추출방법은 공격된 영상에서 원 워터마크 정보와의 상관도를 이용하여 가능한 후보들을 추출하고, 각 위치의 추출된 값들은 통계적인 방법으로 최종 추출된 워터마크로 결정한다. 제안한 방법을 다양한 영상으로 다양한 공격에 대해 실험하고 기존의 방법들과 비교하여 이 방법이 우수한 성능을 가졌음을 보인다.

히스토그램 기반의 비트율-왜곡 특성을 이용한 비트율 제어 (Bit-Rate Control Using Histogram Based Rate-Distortion Characteristics)

  • 홍성훈;유상조;박수열;김성대
    • 한국통신학회논문지
    • /
    • 제24권9B호
    • /
    • pp.1742-1754
    • /
    • 1999
  • 본 논문에서는 히스토그램 기반의 비트율-왜곡 (R-D) 추정 결과를 이용하여 이웃한 영상들간에 일관된 화질을 제공하는 비트율 제어방식을 제안한다. 히스토그램 기반의 R-D 추정 방식은 부호화에 사용되는 양자화 파라미터(QP)에 따라 한 영상에서 발생하는 비트량과 왜곡을 예측하거나, 역으로 발생하는 비트량이나 왜곡에 대한 QP 값을 예측할 수 있는 수학적 모델을 제공한다. 이 추정 방식의 가장 큰 장점은 추정을 위한 주 연산이 양자화기에 입력되는 DCT 계수에 대한 히스토그램 또는 가중 히스토그램을 구하는 것이므로 계산량이 적은 것이다. 또 실제 비디오 부호화에 적용할 수 있을 만큼 정확하다. 따라서 이 추정 모델을 이용하는 제안된 비트율 제어 방식은 저 지연과 저 복잡도를 요구하는 응용 분야에 적합하고, 정확한 제어를 수행한다. 제안된 비트율 제어방식은 비디오 버퍼 제한 조건을 만족시킴으로써 버퍼의 넘침이나 고갈이 발생하지 않도록 하고, 추가적으로 왜곡 제한에 의하여 이웃한 영상들간에 화질차이가 일정 범위를 벗어나지 않도록 한다. 그리고 하나의 영상에 대하여 하나의 QP를 사용하여 영상 내에서도 일관된 화질을 유지하며, 誰?영상과 비 기준 영상에 대한 버퍼 제한 조건을 차별화함으로써 기준 영상의 화질 열화에 의한 오류 전파를 감소시킨다. 제안된 방식과 MPEG-2의 TM5 (Test Model 5)에서 제안한 비트율 제어 방식의 성능을 비교한 실험으로부터 제안된 방식이 평균 PSNR을 0.521.84 dB 정도 향상시키고, 영상간 그리고 영상 내에서도 일관된 화질을 유지함을 확인하였다.

  • PDF

연결성 정보와 기하학 정보를 이용한 삼차원 메쉬 모델의 광학성 정보 압축 방법 (Photometry Data Compression for Three-dimensional Mesh Models Using Connectivity and Geometry Information)

  • 윤영석;호요성
    • 전자공학회논문지CI
    • /
    • 제45권3호
    • /
    • pp.160-174
    • /
    • 2008
  • 본 논문에서는 삼차원 메쉬 모델의 광학성 정보를 부호화하기 위한 새로운 방법을 제안한다. 색상 정보, 법선벡터 정보 및 텍스처 정보의 부호화 효율을 개선하기 위하여 제안한 방법들은 기하학 정보와 연결성 정보를 이용하여 광학성 정보를 예측 부호화한다. 먼저 연결성 정보를 이용하여 광학성 정보의 부호화 순서를 결정하고, 이를 통해 얻어진 인접한 꼭지점들의 기하학 정보를 이용하여 광학성 정보를 예측 부호화한다. 색상 정보는 기하 예측기를 사용하여 부호화하고, 법선벡터 정보는 거리 균등화기와 최적화 평면 발생기를 적용하여 부호화하며, 텍스처 정보는 삼차원 메쉬 모델 분석기, 텍스처 좌표 분석기, 텍스처 영상 재배열기와 예측 부호화기를 이용하여 부호화한다. 색상 정보는 현재 꼭지점과 인접한 꼭지점 사이에 기하학 정보를 고려하여 인접한 꼭지점들의 색상 정보의 가중치 합으로 계산할 수 있다. 또한 법선벡터 정보는 현재 꼭지점의 법선벡터를 예측하기 위해서 이등변 삼각형의 특성을 이용한 거리 균등화 기법과 상호연관성이 높은 인접한 꼭지점의 특징을 이용한 최적화 평면을 개발했으며 효율적으로 삼차원 좌표를 압축하기 위해서 구면 좌표계와 6-4분할 양자화 방법을 사용하였다. 마지막으로 텍스처 정보는 부호화 순서에 따라 텍스처 영상의 조각을 재배열하여 텍스처 좌표를 불연속성을 제거한다. 다양한 삼차원 메쉬 모델들에 대해 실험한 결과를 살펴보면 제안된 압축 방법이 이전의 방법보다 개선된 부호화 효율을 제공하였다.

움직임 벡터 정보를 이용한 SPIHT 부호화 기반의 디지털 비디오 워터마킹 (Digital Video Watermarking Based on SPIHT Coding Using Motion Vector Analysis)

  • 권성근;황의창;이미희;정태일;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제10권11호
    • /
    • pp.1427-1438
    • /
    • 2007
  • 비디오 워터마킹은 일반적으로 네 가지의 타입으로 분류되어진다. 첫 번째로는 원 비디오 신호에 워터마크를 삽입한 후 부호화하는 것으로 대부분의 비디오 워터마킹 기법이 이에 속한다. 두 번째로는 블록 DCT, 양자화 등의 부호화 과정에 워터마크를 삽입하는 것이고, 세 번째로는 부호화된 비트스트림에 워터마크를 삽입하는 것으로 이를 라벨링(labeling)이라고도 한다. 마지막으로 네 번째로는 움직임 벡터에 워터마크를 삽입하는 것으로, 이는 높은 복잡도가 요구되며 블록화 현상과 같은 화질 열화가 발생된다. 본 논문에서는 움직임 벡터 추정을 이용한 I 프레임 상에서 SPIHT 기반의 비디오 부호화에 워터마크를 삽입하는 방법을 제안한다. 이는 블록 DCT 기반의 부호화기에 발생되는 블록화 현상을 제거하고, 점진적 전송 특성을 가진다. 제안한 방법에서는 I 프레임 상에서 이전 P 또는 B 예측 프레임으로부터 움직임 벡터를 추정한 후에 이를 기반으로 워터마크 삽입 영역을 선택한다. 그리고 DWT를 수행하여 워터마크 삽입 영역 상에서 움직임 벡터의 방향과 동일한 부대역 상의 웨이브릿 계수를 HVS에 기반하여 워터마크를 삽입한다. 마지막으로 SPIHT 부호화기에 의하여 워터마크가 삽입된 비디오 비트스트림을 생성한다. 실험 결과로부터 제안한 방법이 객관적 및 주관적인 화질 측면에서 우수한 비가시성을 확인하였고, 다양한 압축률 및 MPEG 재부호화 등에 대하여 우수한 강인성을 확인하였다.

  • PDF