• 제목/요약/키워드: CODEBOOK

검색결과 346건 처리시간 0.02초

불법 주정차 차량 단속을 위한 차량 검지 및 추적 기법 (A vehicle detection and tracking algorithm for supervision of illegal parking)

  • 김승균;김효각;장동니;박상희;고성제
    • 전기전자학회논문지
    • /
    • 제13권2호
    • /
    • pp.232-240
    • /
    • 2009
  • 본 논문은 불법 주정차 단속을 위한 정지 차량 검지 및 추적 기법을 제안한다. 제안하는 알고리즘은 크게 네 부분으로 구성되어 있다. 먼저, 입력 영상으로부터 움직이는 차량을 구분하기 위하여 향상된 코드북 물체 검지 알고리즘을 이용한 차량 검지 알고리즘을 제안한다. 두 번째로 차량의 기하학적 특징을 이용하여 차량이 아닌 물체는 제외시키는 전처리 기법을 사용한다. 그런 다음, 검지된 결과 차량들을 히스토그램 추적 기법과 칼만 필터를 결합한 추적 알고리즘을 이용하여 추적한다. 추적 결과를 더 정확하게 하기 위하여, 히스토그램 추적 결과를 칼만 필터의 측정 데이터로 사용한다. 마지막으로, 정지 차량 검지 알고리즘의 신뢰성 있고 정확한 성능을 위하여 실제 정지 카운터 (RSC)를 제안한다. 실험결과로부터 제안한 시스템은 복잡한 실제 도로 환경에서도 여러 차량을 동시에 추적할 수 있고, 정지 차량을 성공적으로 검지해냄을 확인한다.

  • PDF

화자간 변별력 최대화를 위한 혼합 모델 방식과 심볼 확률 가중함수에 관한 연구 (A Study on the Mixed Model Approach and Symbol Probability Weighting Function for Maximization of Inter-Speaker Variation)

  • 진세훈;강철호
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.410-415
    • /
    • 2005
  • 최근 대부분의 화자확인 시스템은 패턴 인식 접근방식에 기인하고 있다. 패턴 분류기의 성능은 화자의 특징 파라미터를 어떻게 분류하는가 하는 데에 기인한다. 그 특징 파라미터를 잘 분류하기 위해서는, 화자간 변이를 최대화하고 특징 파라미터 간 거리를 효과적으로 측정하는 것이 매우 중요하다. 따라서, 본 논문에서는 개인 모델과 월드 모델을 동시에 배치함으로써 화자간 변이를 최대화 할 수 있는 개선된 혼합 모델 구조를 제안한다. 결정 과정 시 제안한 혼합 모델 방식을 사용함으로써 화자간 변별력을 최대화 할 수 있었다. 또한, 입력데이터에 대한 개인 모델과 월드 모델의 거리비율에 따라 심볼 확률 값을 가중하여 벡터 양자화 에러를 줄이는 가중치 함수를 제안 한다. 실험 결과, 이두 가지 방법을 취함으로써 DCF (Detection Cost Function)를 $2.37\%$에서 $1.16\%$로 낮출 수 있었다.

AMR 기반 저 전력 인공 대역 확장 기술 개발 (Developing a Low Power BWE Technique Based on the AMR Coder)

  • 구본강;박희완;주연재;강상원
    • 한국음향학회지
    • /
    • 제30권4호
    • /
    • pp.190-196
    • /
    • 2011
  • 대역폭 확장 (Bandwidth Extension)은 300-3400 Hz 대역의 협대역 음성 신호를 50-7000 Hz 대역의 광대역 음성신호로 확장하여 협대역 음성신호의 음질과 명료도를 높이는 기술이다. 본 논문에서는 협대역 음성 정보만을 이용해서 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, ITU-T 협대역 표준 음성 코덱인 AMR (adaptive multi-rate) 복호화기에 내장시킴 (embedded)으로써, 대역폭 확장 모듈에서의 LPC 분석 및 LSP 해석과 관련된 계산량을 감소시켰고, 알고리즘 지연도 줄였다. 그리고 SDS (single distance search) 고속 탐색 방식을 대역폭 확장 시스템의 코드북 매핑에 적용하여, 최종적으로 저 전력 대역 확장 AMR 복호화기를 설계하였다. 제안된 대역폭 확장 방법은 AMR 복호화기 후단에 독립적으로 설치되는 기존 DTE (decode then extend)방식에 비해 28 % 정도의 계산량을 줄이고 알고리즘 지연도 20 msec 줄였다. 또한 제안방식은 피치정보를 이용한 classified 코드북 매핑 방식을 사용하여 스펙트럼 포락선을 확장하였고, 코드 벡터 탐색 시 가중치를 적용하여 광대역 합성 음성의 성능을 향상시켰다.

움직임 벡터 및 보상 블록의 특성을 이용한 움직임 보상된 차영상 CVQ (Motion Compensated Difference Image CVQ Using the Characteristics of Motion Vectors and Compensated Blocks)

  • 최정현;이경환;이법기;정원식;김경규;김덕규
    • 대한전자공학회논문지SP
    • /
    • 제37권2호
    • /
    • pp.15-20
    • /
    • 2000
  • 본 논문에서는, 움직임 벡터와 보상 블록을 이용한 분류기를 제안하고, 이 분류기로써 MCD(motion compensated difference) 블록을 CVQ(classified vector quantization)하는 새로운 MCDI(motion compensated difference image) 부호화 방법을 제안하였다. MCD 블록의 분산은 움직임 벡터의 크기뿐만 아니라 보상 블록의 분산과도 밀접한 관계가 있으므로, 이 특성들을 이용하여, 새로운 분류기를 제안하였다. 제안한 방법은 서브 코드북(sub-codebook)을 선택하는 분류기에 대한 부가 정보가 필요 없으면서, 모의 실험 결과 분류 비트가 필요한 기존의 방법에 비해 제안한 방법이 좋은 성능을 나타내었다.

  • PDF

HMM 음성인식 시스템을 위한 화자적응 방법들의 성능비교 (A Comparative Study of Speaker Adaptation Methods for HMM-Based Speech Recognition)

  • 구명완;은종관;이황수
    • 한국음향학회지
    • /
    • 제10권3호
    • /
    • pp.37-43
    • /
    • 1991
  • 본 논문에서는 HMM을 이용한 음성인식 시스템에서 2단계로 이루어지는 화자적응 알고리즘의 성능비교를 수행하였다. 첫단계는 새로운 화자와의 거리차이를 줄여주는 VQ 적응방식들로 구성되는 이 방식들 중에서 lable prototype 적응, 적응음성으로부터 구성된 VQ코우드 북을 사용한 적응 및 사상 코우드 북을 사용한 적응등의 알고리즘 성능비교를 하였다. 두 번째 단계는 새로운 화자를 위해서 HMM 파라미터를 변환시켜주는 HMM 피라미터 적응방식들로 이루어지는데 이 방법들 중에서 Viterbi 알고리즘, DTW 알고리즘, iterative alignment 알고리즘 및 fuzzy histogram 알고리즘의 성능을 비교하였다. 성능비교 결과 fuzzy histogram 알고림즘에 의한 화자적응 방식이 최고의 인식율을 나타내었다.

  • PDF

Fuzzy를 이용한 VQ/NN에 기초를 둔 음성 인식 (Speech Recognition Based on VQ/NN using Fuzzy)

  • 안태옥
    • 한국음향학회지
    • /
    • 제15권6호
    • /
    • pp.5-11
    • /
    • 1996
  • 본 논문은 불특정 화자의 단모음 인식에 관한 연구로써, fuzzy개념를 이용한 VQ(Vector Quantization)/NN(Neural Network)에 의한 음성 인식 방법을 제안한다. 이 방법은 fuzzy를 이용하여 VQ codebook에 의해 다중 관측열(multi-observation sequence)을 구해 각 symbol이 데이타로부터 가질 수 있는 확률값을 계산하여 이 값을 신경 회로망의 입력으로 사용하는 방법이다. 인식 대상어로는 한국어 단모음을 선정하였으며 10명의 남성 화자가 8개의 단모음을 10번씩 발음한 음성 데이터베이스를 이용하여 fuzzy를 이용하지 않은 VQ/NN과 fuzzy를 이용한 VQ/HMM(hidden Markov model)에 의한 인식률과 비교 실험한다. 실험 결과에 의하며, VQ/NN에 의한 인식률은 92.3%이며, fuzzy를 이용한 VQ/HMM에 의한 인식률은 93.8%이고, fuzzy를 이용한 VQ/Nn에 의한 인식률은 95.7%이다. 그러므로, 본 연구의 fuzzy를 이용한 VQ/NN이 학습 능력이 뛰어난 관계로 fuzzy를 이용한 VQ/HMM과 일반적인 VQ/NN 보다 인식률이 향상됨을 보여준다.

  • PDF

밀리미터파 무선통신 시스템에서의 빔포밍 기법 성능 평가 (Performance Evaluation of Beamforming Scheme in Millimeter Wave Wireless Communication System)

  • ;전태현
    • 한국위성정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.133-137
    • /
    • 2016
  • 실내 고속 데이터 전송을 목표로 하는 밀리미터파 무선통신 시스템은 고 품질의 무선 링크에 대한 요구 사항이 매우 중요하다. 그러나, 이러한 주파수 대역에서 전자기파는 상대적으로 작은 파장으로 인하여 발생하는 높은 전파 손실을 감수해야 한다. 이러한 상황에서 방사전력을 특정 방향으로 집중하여 링크 품질을 향상시킬 수 있는 빔포밍 기법은 밀리미터파 대역 무선통신에서 가장 중요한 기법 중의 하나가 되었다. 최근 몇 년간, 무선 시스템의 성능을 향상시키기 위한 빔포밍 관련 연구가 많이 이루어지고 있다. 본 논문에서는 다중절차와 3상 빔 선택을 기반으로 한 단순화된 코드북 기반의 빔포밍 기법의 성능을 평가한다. 이 단순화된 기법은 전수검색, IEEE 802.15.3c 표준이 적용된 2-레벨 검색 및 기존의 멀티레벨 기법과 비교하여 빔포밍 준비에 필요한 시간 감소를 달성할 수 있음을 보여준다.

정상 가우시안 소오스와 음성 신호용 변환 격자 코드에 대한 훈련 알고리즘 개발 (A Training Algorithm for the Transform Trellis Code with Applications to Stationary Gaussian Sources and Speech)

  • 김동윤;박용서;황금찬
    • 한국음향학회지
    • /
    • 제11권1호
    • /
    • pp.22-34
    • /
    • 1992
  • 변환 격차 코드는 모든 레이트에서 정상 가우시안 소오스와 자승 오차 왜곡에 대해 최적코드이다. 본 논문은 실제 데이타의 통계적 특성에 잘 맞는 코드를 얻기 위해 점근적으로 최적인 변환 격자 코드를 훈련시켰다. 훈련 알고리즘은 격자 코드북을 탐색하기위한 M알고리즘과 코드북을 새롭게하기 위한 LBG 알고리즘을 사용했다. 훈련된 변환 격자 코드의 성능을 조사하기 위해서 상관 계수가 0.9인 1차 AR 가우시안 소오스와 실제 음성 데이타를 사용하였다. 1차 AR 소오스에서, 훈련에 사용되지 않은 데이타에 대한 SNR은 레이트에 따라 샤논의 정보량 왜곡 함수에 의한 SNR보다 0.6에서 1.4dB 낮았으나, 이것은 같은 계산량을 사용한 다른 코딩 결과들보다 우수 했다. 실제 음성 데이타는 레이트 1.0 bits/sample에서 코딩을 했으며, 보다 좋은 성능을 얻기 위해 윈도우 함수와 이득 적용을 사용했다.

  • PDF

Rician 페이딩 채널에 적합한 새로운 LTE 하향링크 코드북 (A Novel LTE Downlink Codebook for Rician Fading Channels)

  • 염지비;김영주
    • 대한전자공학회논문지TC
    • /
    • 제48권1호
    • /
    • pp.70-76
    • /
    • 2011
  • LTE (long-term evolution) Rel-10 시스템은 하향링크에서 1Gbits/s 상향링크에서 50Mbits/s 데이터 송선율을 목표로 하므로 넓은 대역폭을 사용할 뿐만 아니라 상향 및 하향탱크에서 선부호화 MIMO (multiple-input multiple-output) 기법을 적용해야 한다. 최근에는 스마트 중계기의 도입으로 협력통신을 통한 용량 개선이 가능해지면서 페이딩 채널에 LoS (line-of-sight) 성분을 고려하고 있다. 본 논문에서는 라이시안 페이딩 채널의 LoS 지표인 K-factor가 증가함에 따라 기존의 코드북보다 우수한 성능을 보이는 새로운 LTE 시스템용 코드북을 제안한다. 기존 LTE 코드북의 생성 원칙을 유지하면서 코드북의 코드워드 사이의 최소 chordal distance를 최대화하는 방법을 라이시안 채널에 적용한다. LTE 하향링크의 시스템 파라미터로 링크레벨 시뮬레이터를 제작하여 기존과 동일한 사이즈로 더 우수한 성능을 보임을 증명한다.

DHMM 음성 인식 시스템을 위한 양자화 기반의 화자 정규화 (Quantization Based Speaker Normalization for DHMM Speech Recognition System)

  • 신옥근
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.299-307
    • /
    • 2003
  • 화자독립 음성인식기에서 화자사이의 성도 길이의 영향을 최소화시켜 인식 성능을 개선하는 화자 정규화에 대한 많은 연구가 있어 왔다. 본 연구에서는 벡터양자화기를 이용하여 화자 검증이 가능하다는 사실에 착안하여 벡터 양자화기를 이용한 비교적 간단한 선형 워핑 화자정규화방법을 제안한다. 제안하는 방법에서는 먼저 정규화에 이용될 최적의 코드북을 생성한 다음, 이 코드 북을 이용하여 화자의 선형 워핑계수를 추출하고 추출된 워핑계수는 멜 켑스트럼 추출시에 사용되는 멜스케일 필터뱅크를 워핑하기 위해 이용된다. 본고에서 제안한 워핑계수 추출 및 적용 방법의 성능을 확인하기 위해 이산 HMM을 이용한 13가지의 단음절 한글 숫자음 인식기를 이용하여 인식실험을 수행하였으며, 실험 결과 약 29%의 오인식률 감소를 보여 제안하는 화자 정규화방법이 다른 라인서치 워핑계수추출 방법보다 간단한 동시에 효용가치가 있음을 확인하였다.