• 제목/요약/키워드: Model Quantization

검색결과 224건 처리시간 0.022초

Laplacian 분포 함수를 이용한 양자화 잡음 모델링 (Modeling Quantization Error using Laplacian Probability Density function)

  • 최지은;이병욱
    • 한국통신학회논문지
    • /
    • 제26권11A호
    • /
    • pp.1957-1962
    • /
    • 2001
  • 영상 압축 또는 영상 부호화에서 후처리, 복원, transcoding을 하는 경우, DCT 계수의 양자화 잡음 모델이 필요하다. 양자화 된 계수만 알고 있는 경우에는 양자화 되기 전의 분포를 구할 수 없다. 본 논문에서는 양자화 되기 전의 DCT 계수의 확률 분포함수를 Laplacian으로 가정하고, 양자화된 계수로부터 분산을 구하고 이를 사용하여 양자화 이전의 분산을 추정하는 방법을 제시하였다. 여러 영상을 사용한 실험을 통하여 제안된 방법의 결과가 기존의 방법에서는 분산이 작게 나오는 단점을 보완하는 것을 확인하였다.

  • PDF

H.264 동영상 표준 부호화 방식을 위한 변형된 가우시안 모델 기반의 저 계산량 전처리 필터 (A Modified Gaussian Model-based Low Complexity Pre-processing Algorithm for H.264 Video Coding Standard)

  • 송원선;홍민철
    • 한국통신학회논문지
    • /
    • 제30권2C호
    • /
    • pp.41-48
    • /
    • 2005
  • 본 논문에서는 H.264 표준 부호화 방식의 성능 향상 및 저 계산량을 위한 가우시안 모델 기반의 전처리 필터에 대해 제안한다. 일반적인 영상 획득 장치에서 첨가된 노이즈에 의해 훼손된 동영상은 다수의 고주파 성분으로 인하여 시각적으로 불편한 현상과 압축 효율의 저하를 초래한다. 본 논문에서는 필터링 과정에서 국부 통계적 특성과 양자화 매개변수를 이용하여, 주어진 양자화 스텝 사이즈에서 노이즈 성분을 제거하고 시각적인 효과와 비트율을 개선시켜 압축 효율을 개선하고자 한다. 또한 전처리 필터의 계산량을 줄이기 위하여 간단한 형태의 국부 통계적 특성을 재 정의하고 노이즈에 대한 매개변수를 H.264의 변환과 양자화 과정을 통하여 유추하여 적용하였다. 제안된 방식의 성능을 실험 결과로부터 확인할 수 있었다.

CNN 모델을 이용한 위해 식품 알림 애플리케이션의 개발 (Development of Hazardous Food Notification Application Using CNN Model)

  • 윤동언;이효상;오암석
    • 한국멀티미디어학회논문지
    • /
    • 제25권3호
    • /
    • pp.461-467
    • /
    • 2022
  • This research is to raise awareness of food safety by designing and supporting a hazard food information notification platform for consumers. To this end, the design was carried out by dividing the process into a data extraction process, an application screen design process, and a CNN-based food inference process. Data was collected through public data APIs and crawling, and it was sent to each activity screen designed for Android studios so that it could be output. As a result, when the platform is executed, information on hazardous food names, registration dates, food classification, manufacturing dates, recovery grades, recovery reasons, recovery methods, company names, barcode numbers, and packaging units can be intuitively and conveniently checked. In addition, CNN-based food inference processes allowed mobile cameras to infer harmful food and applied various quantization techniques such as Dynamic Range, Integer, and Float16 to compare the degree of improvement in inference performance. As a result, the group that applied basic quantization and treated device resources with GPU showed the greatest improvement in inference performance. Through this platform, it is expected that the reliability of food safety will be improved by making it more convenient for consumers to recognize food risks.

Compression of 3D Mesh Geometry and Vertex Attributes for Mobile Graphics

  • Lee, Jong-Seok;Choe, Sung-Yul;Lee, Seung-Yong
    • Journal of Computing Science and Engineering
    • /
    • 제4권3호
    • /
    • pp.207-224
    • /
    • 2010
  • This paper presents a compression scheme for mesh geometry, which is suitable for mobile graphics. The main focus is to enable real-time decoding of compressed vertex positions while providing reasonable compression ratios. Our scheme is based on local quantization of vertex positions with mesh partitioning. To prevent visual seams along the partitioning boundaries, we constrain the locally quantized cells of all mesh partitions to have the same size and aligned local axes. We propose a mesh partitioning algorithm to minimize the size of locally quantized cells, which relates to the distortion of a restored mesh. Vertex coordinates are stored in main memory and transmitted to graphics hardware for rendering in the quantized form, saving memory space and system bus bandwidth. Decoding operation is combined with model geometry transformation, and the only overhead to restore vertex positions is one matrix multiplication for each mesh partition. In our experiments, a 32-bit floating point vertex coordinate is quantized into an 8-bit integer, which is the smallest data size supported in a mobile graphics library. With this setting, the distortions of the restored meshes are comparable to 11-bit global quantization of vertex coordinates. We also apply the proposed approach to compression of vertex attributes, such as vertex normals and texture coordinates, and show that gains similar to vertex geometry can be obtained through local quantization with mesh partitioning.

JND 모델을 사용한 코딩 유닛 레벨 멀티-루프 인코딩 기반의 비디오 압축 방법 (Coding Unit-level Multi-loop Encoding Method based on JND for Perceptual Coding)

  • 임웅;심동규
    • 전자공학회논문지
    • /
    • 제52권5호
    • /
    • pp.147-154
    • /
    • 2015
  • 본 논문에서는 주변의 밝기에 대한 HVS의 민감도를 모델링한 JND (Just Noticeable Difference)를 비디오 코딩에 적용함으로써, JND 모델에 따른 임계치를 기준으로 현재 코딩 유닛에 적용 가능한 최대 양자화 파라미터를 결정하여 유사한 주관적 화질에서 비트율을 절감시키는 방법을 제안한다. 제안하는 방법은 입력된 현재 코딩 유닛에 대하여 기준이 되는 양자화 파라미터가 적용된 복원 신호 대비 더 높은 양자화 파라미터를 적용한 복원 신호가 JND 관점에서 유사하게 인지되는 경우에 더 높은 양자화 파라미터를 선택함으로써 비트율을 절감시킨다. 제안하는 알고리즘의 성능 검증을 위하여 최신 비디오 압축 표준인 HEVC (High Efficiency Video Coding)의 참조 소프트웨어인 HM16.0에 본 알고리즘을 적용하였으며, HM16.0을 통해 압축된 영상 대비 유사한 화질에서 최대 20.21%, 평균적으로 약 6.18%의 비트율 절감을 달성하였다.

예측 잉여신호 벡터 양자화를 이용한 3차원 메시 모델 부호화 (3-dimensional Mesh Model Coding Using Predictive Residual Vector Quantization)

  • 최진수;이명호;안치득
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.136-145
    • /
    • 1997
  • 일반적으로 3차원 메시 모델은 많은 정점(vertex)과 다각형으로 이루어져 있을 뿐만 아니라 정점 위치 각각은 3차원 좌표에서 세 개의 32비트 부동소수점수로 표현되기 때문에, 모델을 표현하기 위해 필요한 데이터 량은 매우 많다. 따라서 3차원 모델을 효과적으로 저장 및 전송하기 위한 압축 기법은 필수적으로 요구된다. 이를 위해 본 논문에서는 예측 잉여신호 벡터 양자화를 이용한 3차원 모델 압축 기법을 제안한다. 기본적인 개념은 3D 모델을 이루는 서로 인접한 정점 위치들간에 존재하는 높은 상관도와 정점 위치 자체가 지니는 벡터 특성에 근거한다. 실험 결과에 따르면 제안한 방법이 기존의 압축 방법에 비해 높은 압축율을 얻을 수 있으며 정점 위치 정보를 점진적으로 전송할 수 있는 장점을 지닌다.

  • PDF

압축 비디오시퀀스 편집을 위한 동적 매크로블럭 비트할당 MPEG-2 비트율 제어 (MPEG-2 Bit-Rate Control for Video Sequence Editing using Dynamic Macroblock Bit Assignment)

  • 김주도;이근영
    • 전자공학회논문지S
    • /
    • 제35S권9호
    • /
    • pp.63-69
    • /
    • 1998
  • 본 논문에서는 MPEG-2를 이용한 압축에서 이미 압축되어 있는 영상 시퀀스내의 하나 또는 여러개의 GOP (Group of Picture)를 새로운 GOP로 교체하는 편집응용에 필수적인 사용비트량의 정합을 위한 새로운 비트율 제어방법을 제안하였다. 이전영상의 양자화값을 영상전체에 동일하게 적용하여 목표비트에 근접할때까지 반복적으로 영상을 부호화하고 각 슬라이스의 사용비트량을 기록한다. 영상단위의 양자화값 변화로는 목표 비트를 더이상 맞추지 못하므로 기록된 비트량을 이용하여 목표비트에 가장 근접하도록 슬라이스별 양자화값을 조절한 후 최종적으로 각 매크로블럭의 활동도를 참고하여 매크로블럭의 양자화값을 결정하였다. 실제영상에 적용하였을 경우 MPEG-2 Test Model 5에 비해 유사한 PSNR을 보였고 목표비트에 대한 비트에러량은 각 영상당 대략 수 내지 수십비트 이내로 줄임으로써 제안알고리듬의 유효성을 보였다.

  • PDF

센서 정보를 활용한 스마트폰 모션 인식 (Motion Recognition of Smartphone using Sensor Data)

  • 이용철;이칠우
    • 한국멀티미디어학회논문지
    • /
    • 제17권12호
    • /
    • pp.1437-1445
    • /
    • 2014
  • A smartphone has very limited input methods regardless of its various functions. In this respect, it is one alternative that sensor motion recognition can make intuitive and various user interface. In this paper, we recognize user's motion using acceleration sensor, magnetic field sensor, and gyro sensor in smartphone. We try to reduce sensing error by gradient descent algorithm because in single sensor it is hard to obtain correct data. And we apply vector quantization by conversion of rotation displacement to spherical coordinate system for elevated recognition rate and recognition of small motion. After vector quantization process, we recognize motion using HMM(Hidden Markov Model).

진동신호 양자화에 의한 거동반응을 이용한 베어링 고장진단 (Bearing Fault Diagnosis Using Automaton through Quantization of Vibration Signals)

  • 김도현;최연선
    • 한국소음진동공학회논문집
    • /
    • 제16권5호
    • /
    • pp.495-502
    • /
    • 2006
  • A fault diagnosis method is developed in this study using automaton through quantization of vibration signals for normal and faulty conditions, respectively. Automaton is a kind of qualitative model which describes the system behaviour at the level of abstraction. The system behavior was extracted from the probability of the output sequence of vibration signals. The sequence was made as vibration levels by reconstructing the originally measured vibration signals. As an example, a fault diagnosis for the bearing of ATM machine was done, which detected the bearing fault with confident level compared to any other existing methods of kurtosis or spectrum analysis.

멀티웨이브릿 변환 기반에서 연속 부대역 양자화 및 지각 모델을 이용한 적응 워터마킹 기술 (Adaptive Watermarking Using Successive Subband Quantization and Perceptual Model Based on Mukiwavelet Transform)

  • 권기룡;강균호;조영웅;문광석;이준재
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.121-124
    • /
    • 2002
  • This paper presents an adaptive digital image watermarking scheme that uses successive subband quantization (SSQ) and perceptual modeling. Our approach performs a multiwavelet transform to determine the local image properties optimal and the watermark embedding location. The multiwavelet used in this paper is the DGHM multiwavelet with approximation order 2 to reduce artifacts in the reconstructed image. A watermark is embedded into the perceptually significant coefficients (PSC) of the image in each subband. The PSCs in high frequency subbands are selected by setting the thresholds to one half of the largest coefficient in each subband. After the PSCs in each subband are selected, a perceptual model is combined with a stochastic approach based on the noise visibility function to produce the final watermark.

  • PDF