• 제목/요약/키워드: Model Quantization

검색결과 224건 처리시간 0.028초

저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상 (Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding)

  • 이창헌;강홍구
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.62-68
    • /
    • 2010
  • 본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.

항공 LiDAR 데이터를 이용한 건물추출과 상부구조물 특성분석 및 모델링 (Utilizing Airborne LiDAR Data for Building Extraction and Superstructure Analysis for Modeling)

  • 정형섭;임새봄;이동천
    • 한국측량학회지
    • /
    • 제26권3호
    • /
    • pp.227-239
    • /
    • 2008
  • 항공 레이저 스캐닝(ALS) 시스템으로부터 획득한 LiDAR 데이터를 미용하여 3차원 객체 모델링과 지형도 제작을 위해서는 데이터의 기하학적 및 의미적인 분할과 같은 체계적인 데이터 처리가 선행되어야 한다. ALS로 부터 활용 가능한 LiDAR 데이터를 획득하기 위해서는 GPS, INS 및 레이저 스캐너 데이터의 통합이 필수적이다. 본 연구에서는 건물추출과 지붕 구조물 분할을 위해서 LiDAR 데이터를 영상화하여 디지털 영상처리 기법을 적용하였다. 영상화된 데이터를 사용하는 주요 장점 중 하나는 기존의 다양한 영상처리 알고리즘을 사용할 수 있다는 점이다. 격자화 및 정량화를 거치는 영상화 과정에서 원시 LiDAR 데이터가 한정된 밝기값으로 변환되므로 평활화 및 상세 정보의 손실이 발생될 수 있지만. 평활화된 데이터는 표면분할과 모델링에 오히려 적합하다. 건물의 경계선은 윤곽선 추출 연산자를 이용하여 정확하게 추출하였으며, 건물 모양에 적합하도록 규격화하였다. 건물 지붕의 구조물의 분할은 영역확산을 기반으로 수행하였다. 이 결과 다양한 디지털 영상처리 기법을 복합적으로 적용하여 건물추출과 지붕 구조물의 면분할이 가능함을 보여주었다. 또한 지붕의 형태를 재현하기 위한 특성정보 추출에 관한 개념적 방법을 제안하였다. 지붕 데이터를 분할하고 모델링을 위해 통계적 및 기하적 특성을 이용하였으며. 제안한 방법에 의한 시뮬레이션 결과는 지붕면을 분할하고 모델링하는데 가능함을 보여주고 있다.

MPEG-2 비디오 부호화를 위한 정확한 비트율 제어 알고리즘 (An Accurate Bitrate Control Algorithm for MPEG-2 Video Coding)

  • 이정우;호요성
    • 대한전자공학회논문지SP
    • /
    • 제38권2호
    • /
    • pp.218-226
    • /
    • 2001
  • MPEG-2 비디오 부호화 과정에서 비트율 제어를 위해 MPEG-2 Test Model 5 (TM5) 알고리즘이 널리 사용되고 있지만, 실제로는 각 화면에 할당되는 목표 비트수와 실제 부호화된 비트수가 잘 맞지 않아 한 GOP의 마지막 부분에서 버퍼 넘침 현상과 화질의 급격한 열화 현상이 발생할 수 있다. 본 논문에서는 부호화하고자 하는 블록의 이전 블록에서 실제 발생된 비트수와 예측에 의한 비트수 사이의 관계를 이용하여 정확한 비트수를 할당함으로써, 각 화면의 목표 비트수와 실제 발생되는 부호화 비트수를 정합시키는 새로운 비트율 제어 알고리즘을 제안한다. 제안된 알고리즘은 화면내에서 일관된 화질을 유지하며, 실시간 처리도 가능하다.

  • PDF

FSVQ, 퍼지 개념 및 이중 스펙트럼 특징을 이용한 HMM에 기초를 둔 음성 인식 (HMM-based Speech Recognition using FSVQ, Fuzzy Concept and Doubly Spectral Feature)

  • 정의봉
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권4호
    • /
    • pp.491-502
    • /
    • 2004
  • 본 논문은 화자 독립의 단독어 인식에 관한 연구로써, FSVQ(first section vector quantization), 퍼지 이론 및 이중 스펙트럼 특징을 이용한 HMM(hidden Markov model) 모델을 제안한다. 제안된 연구 방법에서, 이중 특징 파라메타로써 LPC ?스트럼과 LPC 스트럼의 회귀 계수를 사용한다. 학습 데이터는 몇 개의 구간으로 나누어지며, 첫 번째 구간의 코드북(codebook)을 만든 후, 첫 번째 구간의 코드북으로 부터, 퍼지 개념을 도입하여 확률 값이 큰 순서에 의해 다중 관측열을 구한다. 그 다음, 첫 번째 구간의 관측열을 학습시키고, 같은 방법으로 확률 값을 얻은 단어가 인식되어 진다. 제안된 방법에 의한 인식 실험을 수행하는 것 이외에도 비교를 위하여 다른 방법의 인식 실험을 같은 조건하에서 같은 데이터로 수행하였다. 실험 결과, 본 연구에서 제안한 방법이 다른 방법들보다 인식률이 우수함을 입증하였다. 입증하였다.

  • PDF

GPU 가속기를 통한 비트 연산 최적화 및 DNN 응용 (Bit Operation Optimization and DNN Application using GPU Acceleration)

  • 김상혁;이재흥
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1314-1320
    • /
    • 2019
  • 본 논문에서는 소프트웨어 환경에서 비트연산을 최적화 하고 DNN으로 응용하는 방법을 제안한다. 이를 위해 비트연산 최적화를 위한 패킹 함수와 DNN으로 응용을 위한 마스킹 행렬 곱 연산을 제안한다. 패킹 함수의 경우는 32bit의 실제 가중치값을 2bit로 변환하는 연산을 수행한다. 연산을 수행할 땐, 임계값 비교 연산을 통해 2bit 값으로 변환한다. 이 연산을 수행하면 4개의 32bit값이 1개의 8bit 메모리에 들어가게 된다. 마스킹 행렬 곱 연산의 경우 패킹된 가중치 값과 일반 입력 값을 곱하기 위한 특수한 연산으로 이루어져 있다. 그리고 각각의 연산은 GPU 가속기를 이용해 병렬로 처리되게 하였다. 그 결과 HandWritten 데이터 셋에 환경에서 32bit DNN 모델에 비해 약 16배의 메모리 절약을 볼 수 있었다. 그럼에도 정확도는 32bit 모델과 비슷한 1% 이내의 차이를 보였다.

Coordinated Control Strategy and Optimization of Composite Energy Storage System Considering Technical and Economic Characteristics

  • Li, Fengbing;Xie, Kaigui;Zhao, Bo;Zhou, Dan;Zhang, Xuesong;Yang, Jiangping
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권3호
    • /
    • pp.847-858
    • /
    • 2015
  • Control strategy and corresponding parameters have significant impacts on the overall technical and economic characteristics of composite energy storage systems (CESS). A better control strategy and optimized control parameters can be used to improve the economic and technical characteristics of CESS, and determine the maximum power and stored energy capacity of CESS. A novel coordinated control strategy is proposed considering the coordination of various energy storage systems in CESS. To describe the degree of coordination, a new index, i.e. state of charge coordinated response margin of supercapacitor energy storage system, is presented. Based on the proposed control strategy and index, an optimization model was formulated to minimize the total equivalent cost in a given period for two purposes. The one is to obtain optimal control parameters of an existing CESS, and the other is to obtain the integrated optimal results of control parameters, maximum power and stored energy capacity for CESS in a given period. Case studies indicate that the developed index, control strategy and optimization model can be extensively applied to optimize the economic and technical characteristics of CESS. In addition, impacts of control parameters are discussed in detail.

연속분포 HMM을 이용한 한국어 연속 음성 인식 시스템 개발 (On the Development of a Continuous Speech Recognition System Using Continuous Hidden Markov Model for Korean Language)

  • 김도영;박용규;권오욱;은종관;박성현
    • 한국음향학회지
    • /
    • 제13권1호
    • /
    • pp.24-31
    • /
    • 1994
  • 본 논문에서는 연속분포 hidden Markov모델을 이용한 화자독립 연속 음성 인식 시스템에 관해 기술한다. 연속분포 모델은 평균과 분산 벡터로 구성되며 음성신호를 직접 모델링하여 양자화 왜곡이 없어진다. 특징벡터는 filter bank 계수 및 그 1, 2차 미분계수를 사용하여 음성신호의 동적 특성을 반영하였다. Segmental K-means 알고리즘을 이용하여 학습하였으며, 연속어 인식에서 가장 문제가 되는 조음화 현상으로 인한 인식률 저하를 막기 위해 앞뒤의 음소를 고려해주는 triphone을 인식단위로 사용하였다. Search 알고리즘으로는 시간 면에서 효율이 좋은 one-pass search 알고리즘을 사용하였다 성능 평가를 위한 회자 독립인식 실험에서 문법이 없을 경우 $83\%$, finite state network을 적용한 경우에는 $94\%$의 인식률을 나타내었다.

  • PDF

저 전송률 환경에서 선형예측 전처리기를 사용한 HE-AAC의 성능 향상 (Quality Improvement of Low Bitrate HE-AAC using Linear Prediction Pre-processor)

  • 이재성;이건우;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제34권8C호
    • /
    • pp.822-829
    • /
    • 2009
  • 본 논문은 선형예측 전처리기을 이용하여 저 전송률 환경에 적합한 HE-AAC의 구조를 제안한다. 저 전송률 환경에서는 HE-AAC의 적절하지 못한 비트 할당 알고리즘 때문에 많은 스펙트럴 홀(스펙트럼 홀)들이 발생을 하고 있으며, 그로 인해서 심각한 음질의 열화가 발생하고 있다. 이를 해결하기 위해서 선형예측 전처리기을 사용하여 저 전송률에서 비트가 적절하게 할당되도록 하였다. HE-AAC로 들어오는 입력신호는 선형예측 전처리기에 의해서 LP 계수와 레지듀얼 신호로 나눠지게 되며, AAC 부분은 분리된 레지듀얼 신호를 부호화하게 된다. 제안된 방법의 성능 평가를 위해서 지각적 잡음(Perceptual noise)의 측정을 통한 객관적인 실험과 MUSHRA 테스트를 통한 주관적인 실험을 하였고, 그 결과 저 전송률 환경에서 제안된 방법을 사용함으로써 성능을 향상시킬 수 있음을 확인하였다.

저전송률 비디오 압축을 위한 모델 기반 매크로블록 레이어 비트율 제어 (Model-based Macroblock Layer Rate Control for Low Bit Rate Video Coding)

  • 박상현
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.50-57
    • /
    • 2009
  • 본 논문에서는 저전송률 환경에서 목표 비트량에 맞게 영상을 압축하는 모델 기반 매크로블록 레이어 비트율 제어 알고리즘을 제안한다. H.264 비디오 압축 표준은 다양한 압축 모드 및 최적화 방법을 사용하여 압축률을 향상 시키지만 복잡한 인코더 구조는 저전송률 환경에서 정확한 트래픽 제어를 어렵게 한다. 제안된 알고리즘에서는 먼저 한 프레임의 모든 매크로블록에 대한 MAD 값을 예측하고 이를 바탕으로 각 매크로블록 압축 전에 목표 잔여 비트량을 설정한다. 설정된 목표 잔여 비트량과 실제 잔여 비트량의 차이가 임계치보다 크면 두 값의 차이가 감소하도록 양자화 파라미터 값을 조절하여 한 프레임에 대한 결과 비트량이 목표 비트량과 비슷하게 발생되게 한다. 제안하는 알고리즘과 기존 알고리즘간의 비교 실험은 제안하는 알고리즘이 기존 알고리즘에 비해 한 프레임에 대한 목표 비트량과 실제 비트량의 차이를 66% 이상 감소시키고 있으며 동시에 PSNR 성능에서 기존의 알고리즘 보다 우수함을 보여준다.

Evaluation of GaN Transistors Having Two Different Gate-Lengths for Class-S PA Design

  • Park, Jun-Chul;Yoo, Chan-Sei;Kim, Dongsu;Lee, Woo-Sung;Yook, Jong-Gwan
    • Journal of electromagnetic engineering and science
    • /
    • 제14권3호
    • /
    • pp.284-292
    • /
    • 2014
  • This paper presents a characteristic evaluation of commercial gallium nitride (GaN) transistors having two different gate-lengths of $0.4-{\mu}m$ and $0.25-{\mu}m$ in the design of a class-S power amplifier (PA). Class-S PA is operated by a random pulse-width input signal from band-pass delta-sigma modulation and has to deal with harmonics that consider quantization noise. Although a transistor having a short gate-length has an advantage of efficient operation at higher frequency for harmonics of the pulse signal, several problems can arise, such as the cost and export license of a $0.25-{\mu}m$ transistor. The possibility of using a $0.4-{\mu}m$ transistor on a class-S PA at 955 MHz is evaluated by comparing the frequency characteristics of GaN transistors having two different gate-lengths and extracting the intrinsic parameters as a shape of the simplified switch-based model. In addition, the effectiveness of the switch model is evaluated by currentmode class-D (CMCD) simulation. Finally, device characteristics are compared in terms of current-mode class-S PA. The analyses of the CMCD PA reveal that although the efficiency of $0.4-{\mu}m$ transistor decreases more as the operating frequency increases from 955 MHz to 3,500 MHz due to the efficiency limitation at the higher frequency region, it shows similar power and efficiency of 41.6 dBm and 49%, respectively, at 955 MHz when compared to the $0.25-{\mu}m$ transistor.