• 제목/요약/키워드: PCM 알고리즘

검색결과 37건 처리시간 0.02초

멀티미디어 네트워킹을 위한 압축 신호상에서 동영상 처리 : 압축 동영상 비트율 변환 (Manipulation of the Compressed Video for Multimedia Networking : A Bit rate Shaping of the Compressed Video)

  • 황대환;조규섭;황수용
    • 한국통신학회논문지
    • /
    • 제26권11A호
    • /
    • pp.1908-1924
    • /
    • 2001
  • 유무선 통신망, 지상파, 위성 등을 포함한 다양한 이종 네트워크 환경하에서의 멀티미디어 서비스는 급속한 인터넷 보급과 병행하여, 이전과는 전혀 다른 새로운 통합 멀티미디어 네트워킹 인프라를 요구하고 있다. 네트워크와 멀티미디어 유형에 관계 없이 사용자에게 이음새 없는 투명한 멀티미디어 통신서비스를 제공하자는 기술적 요구는 국내외에서 GII를 축으로 연구가 진행되고 있으나, 아직 뚜렷한 형상이 완성되지 않은 실정이다. 이 GII의 배경에는 이종 네트워크, 이종 미디어 그리고 다양한 이종 프로토콜이 포함되는 응용 서비스가 상호 투명하게 연결되어야 하는 복잡한 기술적 측면이 있으며, 멀티미디어의 네트워킹은 가장 핵심적인 연구항목이 되고 있다. 본 논문에서는 통신 대역폭의 QoS를 보장할 수 없는 인터넷 그리고 유무선을 통한 디지털 TV 방송에 직접 적용할 수 있는 압축 통영상 비트율 변환 알고리즘을 제안한다. 통영상 비트율 변환은 상기의 네트워크 환경하에서 동영상 스트리밍 서비스를 위해 필요한 기술이다. 기존의 비트율 변환은 해당되는 압축 통영상 디코더와 인코더를 쌍으로 연결하여, 선형 PCM 신호로 변환하고, 목적하는 비트율로 맞추어 주는 방법이 일반적이나, 그 구현의 복잡성, 수반되는 처리지연 등으로 실시간 멀티미디어 네트워킹에 단점을 갖고 있다. 본 논문에서 제안한 알고리즘은 화질과 구현의 복잡도를 고려하여 비트율 변환을 압축영역에서 행하며, 특히 실시간 처리에 주안점을 두었다. 제안한 알고리즘은 IS0/1EC의 MPEG-2 동영상을 대상으로 소프트웨어로 구현하였으며, 화소영역의 처리방법을 포함하는 기존의 비트율 변환방법에 비해 구현의 복잡도, 처리시간에 장점을 갖는다.

  • PDF

이미지 처리를 통한 공기 중 섬유의 자동계수 알고리즘 프로그램 개발 (Developing Image Processing Program for Automated Counting of Airborne Fibers)

  • 최성원;이희공;이종일;김현욱
    • 한국산업보건학회지
    • /
    • 제24권4호
    • /
    • pp.484-491
    • /
    • 2014
  • Objectives: An image processing program for asbestos fibers analyzing the gradient components and partial linearity was developed in order to accurately segment fibers. The objectives were to increase the accuracy of counting through the formulation of the size and shape of fibers and to guarantee robust fiber detection in noisy backgrounds. Methods: We utilized samples mixed with sand and sepiolite, which has a similar structure to asbestos. Sample concentrations of 0.01%, 0.05%, 0.1%, 0.5%, 1%, 2%, and 3%(w/w) were prepared. The sand used was homogenized after being sieved to less than $180{\mu}m$. Airborne samples were collected on MCE filters by utilizing a personal pump with 2 L/min flow rate for 30 minutes. We used the NIOSH 7400 method for pre-treating and counting the fibers on the filters. The results of the NIOSH 7400 method were compared with those of the image processing program. Results: The performance of the developed algorithm, when compared with the target images acquired by PCM, showed that the detection rate was on average 88.67%. The main causes of non-detection were missing fibers with a low degree of contrast and overlapping of faint and thin fibers. Also, some duplicate countings occurred for fibers with breaks in the middle due to overlapping particles. Conclusions: An image detection algorithm that could increase the accuracy of fiber counting was developed by considering the direction of the edge to extract images of fibers. It showed comparable results to PCM analysis and could be used to count fibers through real-time tracking by modeling a branch point to graph. This algorithm can be utilized to measure the concentrations of asbestos in real-time if a suitable optical design is developed.

잡음환경에서의 음성인식을 위한 모델 파라미터 변환 방식에 관한 연구 (A Study on a Model Parameter Compensation Method for Noise-Robust Speech Recognition)

  • 장육현;정용주;박성현;은종관
    • 한국음향학회지
    • /
    • 제16권5호
    • /
    • pp.112-121
    • /
    • 1997
  • 본 논문에서는 잡음에 강한 음성 인식기를 위한 모델 파라미터 변환 방식에 관하여 살펴보았다. 모델 파라미터 변환에 있어서 잡음에 대한 어떠한 통계 모델도 사용하지 않고 각 단어 단위로 수행되어 실시간 음성 인식이 가능하도록 하였다. Parallel model combination(PCM)은 본 논문에서 제안한 방법과의 성능 비교를 위하여 cepstrum 영역에서 구현되었다. 본 논문에서 제안한 PCM 방법은 modified PCM(MPMC)라 하며, 이 방법은 각 hidden Markov mode(HMM)의 state별로 평균적인 가우시안 믹스처(Gaussian mixture)의 변화률과 개별적인 변화률간에 결합지수를 이용하여 평균을 재조정한다. 또한, vector Taylor series 근사화를 이용한 모델 파라미터 변환을 위하여 cepstrum 영역에서의 환경모델 예측을 위한 expectation-maximization(EM) 해를 유도하여 구현하였다. 본 논문에서 구현된 알고리즘들의 성능 위해 HMM 인식기를 이용한 화자독립 고립단어 인식을 수행하였다. 시용된 잡음은 가우시안 백색 잡음과 주행중에 녹음된 자동차 잡음이며, 각 잡음울 signal-to-noise ratio(SNR)별로 사용하였다. 잡음의 모델은 1 state HMM으로 단어시작 3 프레임(frame)을 이용하여 만들어졌다. 인식 결과는 VTS 접근방식을 이용하였을 경우 매우 우수한 인식률을 나타내었으며, MPMC의 경우도 기존의 PMC보다 인식률이 향상되었다. 특히, 영차 VTS의 경우는 단순히 평균만을 조정하였음에도 불구하고 PMC와 MPMC보다 인식률이 우수하게 나타났다.

  • PDF

VoIP 음성품질 개선을 위한 전송패킷의 크기와 코덱분석 (Analysis of transmission packet size and codec for enhancing the VoIP voice quality)

  • 김용석;박종안
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.639-642
    • /
    • 2006
  • 본 논문에서는 다양한 서비스가 운용되고 있는 인터넷 망에서 PCM 및 ADPCM으로 압축된 음성데이터를 전송할 경우에 발생하는 패킷 크기와 한계 지연시간의 변화가 수신측의 음질에 미치는 영향을 분석하였다. 이를 기반으로 주어진 한계 지연시간에 대하여 적절한 음질을 제공하기 위한 전송패킷의 크기에 대하여 분석하여 적절한 코덱 선택 방법을 제안하였다. 제안된 방법의 실험결과를 입증하기 위해 음질 평가인 MOS평가 방법을 사용했으며 측정방법으로는 서울을 중심으로 전국5개 지역 지점별 5회 측정 각 지점의 임의 번호를 서울 콜 센터로 Call Forwarding 설정 후 측정하고, VQT은 PAMS 알고리즘과 ADRA(Audio Direction Reference Audio)를 사용하여 측정한 결과 음성코덱의 데이터비와 Datagram size에 의해 음성 품질이 달라짐과 적절한 코덱 선택방법임을 확인하였다.

  • PDF

계층적인 구조를 이루는 KPCM 알고리즘 (A Hierarchy of Kernel PCM-Generated Clusters)

  • 구양협;최병인;이정훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.83-86
    • /
    • 2005
  • 커널함수를 이용한 클러스터링 방법은 일반적인 목적함수 기반의 클러스터링 방법에 비해 고리모양과 같은 복잡한 모양의 데이터를 클러스터링할 때 훨씬 효율적이다. 그러나, 커널기반의 클러스터링 방법은 거리함수를 계산하기 위하여 커널함수를 연산해야 하기 때문에 클러스터 수가 많아지면, 일반적인 목적함수 기반의 클러스터링 방법에 비하여 계산량이 급격히 증가하는 단점이 있다. 따라서, 본 논문에서는 이러한 단점을 개선하기 위하여 커널기반의 클러스터링 기법에 계층적인 클러스터링 모델을 적용한다.

  • PDF

웨이브렛 변환과 평균예측검색 알고리즘의 벡터양자화를 이용한 심전도 데이터 압축기법 (ECG Data Compression Technique Using Wavelet Transform and Vector Quantization on PMS-B Algorithm)

  • 은종숙;신재호
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1996년도 추계학술대회
    • /
    • pp.225-228
    • /
    • 1996
  • ECG data are used for the diagnostic purposes with many clinical situations, especially heart disease. In this paper, an efficient ECG data compression technique by wavelet transform and high-speed vector quantization on PMS-B algorithm is proposed. In general, ECG data compression techniques are divided into two categories: direct and transform methods. The direct data compression techniques are AZTEC, TP, CORTES, FAN and SAPA algorithms, besides the transform methods include K-L, Fourier, Walsh, and wavelet transforms. In this paper, we applied wavelet analysis to the ECG data. In particular, vector quantization on PMS-B algorithm to the wavelet coefficients in the higher frequency regions, but scalar quantized in the lower frequency regions by PCM. Finally, the quantized indices were compressed by LZW lossless entropy encoder. As the result of simulation, it turns out to get sufficient compression ratio while keeping clinically acceptable PRD.

  • PDF

TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드웨어 모듈(VR32) 구현 (Real-Time Implementation of Speaker Dependent Speech Recognition Hardware Module Using the TMS320C32 DSP : VR32)

  • 정익주;정훈
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.14-22
    • /
    • 1998
  • 본 연구에서는 Texas Instruments 사의 저가형 부동소수점 디지털 신호 처리기 (Digital Singnal Processor, DSP)인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하 드웨어 모듈(VR32)을 개발하였다. 하드웨어 모듈의 구성은 40MHz의 TMS320C32 DSP, 14bit 코덱인 TLC32044(또는 8bit μ-law PCM 코덱), EPROM과 SRAM 등의 메모리와 호 스트 인터페이스를 위한 로직 회로로 이루어졌다. 뿐만 아니라 이 하드웨어 모듈을 PC사에 서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리 즘의 구성은 에너지와 ZCR을 기반으로 한 끝점검출(Endpoint Detection) 침 10차 가중 LPC 켑스터럼(Weighted LPC Cepstrum) 분석이 실시간으로 이루어지며 이후 Dynamic Time Warping(DTW)를 통하여 최고 유사 단어를 결정하고 다시 검증과정을 거쳐 최종 인식을 수행한다. 끝점검출의 경우 적응 문턱값(Adaptive threshold)을 이용하여 잡음에 강인한 끝 점검출이 가능하며 DTW 알고리즘의 경우 C 및 어셈블리를 이용한 최적화를 통하여 계산 속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 통상 단축다이얼 용도로 사 용할 수 있는 30 단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동 차 소음과 같은 잡음환경에서도 잘 동작한다.

  • PDF