• 제목/요약/키워드: KL(Karhunen-Loeve) 변환

검색결과 8건 처리시간 0.02초

Karhunen-Loeve 변환 기반의 부분공간 인식기와 결합된 다중 노벨티 인식기를 이용한 필기체 숫자 인식 (Handwritten Numeral Recognition Using Karhunen-Loeve Transform Based Subspace Classifier and Combined Multiple Novelty Classifiers)

  • 임길택;진성일
    • 전자공학회논문지C
    • /
    • 제35C권6호
    • /
    • pp.88-98
    • /
    • 1998
  • 부분공간 인식기는 Karhunen-Loeve (KL) 변환을 기반으로 하는 대표적인 패턴인식 방법이다. 이 부분 공간 인식기는 고차원의 패턴을 저차원의 부분공간에 나타내어 인식을 한다. 그러나 차원 감축으로 인한 정보의 손실로 principal components가 유사하게 나타나는 패턴간에는 분별이 어려워지는 단점이 있다. 본 논문에서는 이러한 부분공간 인식기의 단점을 해결하기 위해 일반적으로 무시되는 minor components로 표현되는 패턴의 노벨티 성분을 이용하는 결합된 다중 노벨티 신경망 인식기를 제안하고 부분공간 인식기와 결합을 통해 인식률을 제고하는 방법을 제시한다. 필기체 숫자 데이터베이스에 대해서 제안한 인식기를 구성하고 특성을 분석한다. 제안한 방법은 다른 인식기들에 비해서 신경망에 사용된 가중치의 수는 증가하지만 가장 우수한 인식 성능을 나타내었다.

  • PDF

KL 변환과 템플릿매칭을 이용한 얼굴 인식 방법 (Comparative Study on the Recognition of Face Image Using the KL transform and the Template Matching)

  • 강환일;송영기;이세영;정요원
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.301-305
    • /
    • 1999
  • 얼굴인식의 방법 중 하나인 전체얼굴에 대한 인식 방법으로, 고유벡터를 이용한 인식 방법과 템플릿 매칭을 이용한 방법의 차이점을 비교 연구한다. 고유벡터를 이용한 방법은 얼굴 영상에 대한 벡터공간을 얻은 후 각 얼굴 영상을 구별할 수 있는 공간에 대한 투영을 통하여 인식에 이용한다. 템플릿 매칭에 기반한 방법은 몇가지 유사도 정의를 이용한 것이다. 또한 얼굴 영상에 대한 전처리 과정이 인식에 끼치는 영향도 분석한다. 본 논문은 두가지의 얼굴 영상 인식기술의 비교를 통하여 얼굴 영상의 인식에 대한 유용한 도구로서 에지영상을 이용한 KL변환 방법이 더 우수함을 보인다.

  • PDF

참조샘플을 이용한 분할가능한 KL 변환 (Separable KL transform using reference samples)

  • 김남욱;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.546-549
    • /
    • 2020
  • 본 논문에서는 최신 비디오 코딩 기술에서 잔차(Residual)신호 변환을 효율적으로 수행하기 위한 부동기저(Basis)를 사용하는 방법을 제안한다. 기존의 DCT-II 나 DST-VII 과 같은 고정 기저를 사용하는 방법은 대부분의 잔차신호들에 대해 효과적으로 비상관화(decorrelation)를 수행하지만 복잡한 잔차 신호일수록 성능이 떨어지는 문제가 있었다. 이러한 압축 성능하락 문제를 줄이기 위하여 PCA(Principle Component Analysis) 방법 중 하나인 KLT(Karhunen-Loeve Transform)를 이용하여 부동(floating) 변환 기저를 유도하는 방법을 제안한다. 기존의 KLT 를 이용한 변환 커널 유도 방법들의 문제점인 부호화기 및 복호화기 계산 복잡도를 줄이기 위하여 KL 커널을 분해가능한(Separable) 2 개의 1 차원 커널로 유도하는 방법을 제안하고, 원본 잔차신호와 유사한 텍스처를 찾아 커널을 예측하는 과정을 간소화하는 방법을 제안한다. 제안하는 방법은 HEVC 에서 실험되었으며 정지영상 코딩 Main-Profile 에서 평균 1.4%가량의 BD-PSNR(Bjontegaard Delta-Peak Signal to Noise Ratio) 성능 향상을 보였으며 특히 스크린 컨텐츠 영상에서 최대 4.5%의 성능 향상을 보인다.

  • PDF

KT 변환과 템플릿매칭을 이용한 얼굴 인식 방법 (Comparative Study on the Recognition of Face Image Using the KL transform and the Template Matching)

  • 강환일;송영기;이세영;정요원
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.301-305
    • /
    • 1999
  • 얼굴인식의 방법 중 하나인 전체얼굴에 대한 인식 방법으로, 고유벡터를 이용한 인식 방법과 템플릿 매칭을 이용한 방법의 차이점을 비교 연구한다. 고유벡터를 이용한 방법은 얼굴 영상에 대한 벡터공간을 얻은 후 각 얼굴 영상을 구별할 수 있는 공간에 대한 투영을 통하여 인식에 이용한다. 템플릿 매칭에 기반한 방법은 몇가지 유사도 정의를 이용한 것이다. 또한 얼굴 영상에 대한 전처리 과정이 인식에 끼치는 영향도 분석한다. 본 논문은 두가지의 얼굴 영상 인식기술의 비교를 통하여 얼굴 영상의 인식에 대한 유용한 도구로서 에지영상을 이용한 KL변환 방법이 더 우수함을 보인다.

  • PDF

직교 벡터 공간 변환을 이용한 음성 개성 변환 (Voice personality transformation using an orthogonal vector space conversion)

  • 이기승;박군종;윤대희
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.96-107
    • /
    • 1996
  • 본 논문에서는 직교 벡터 공간 변환을 이용한 새로운 음성 개성 변환 알고리즘을 제안하였다. 음성 개성 변환이란 임의 환자(source)가 가지고 있는 몇 개의 특징 변수를 다른 화자(target)의 특징 변수로 변환하는 기법이다. 본 논문에서는 LPC 켑스트럼 계수와 여기 신호의 스펙트럼, 그리고 피치 궤적을 변환하여 음성 개성변환을 구현하였다. LPC 켑스트럼 계수의 변환을 위해 직교 벡터 공간 변환 기법이 제안되었다. 이 기법은 KL(Karhunen-Loeve)변환을 이용한 principle component의 분리와 최소 자승 오차를 갖는 선형 좌표 변환을 통해 LPC 켑스트럼의 변환을 수행한다. 또한, 화자간의 운율적인 특징을 변환하기 위해 피치 궤적 변환 기법이 제안되었다. 피치 궤적 변환을 위하여 먼저 두 화자간의 기준 피치 패턴의 작성하고 기준 패턴간의 대응 관계를 추정한 후 이를 이용하여 source 화자의 피치 패턴이 target 피치 패턴으로 변환되도록 하였다. 컴퓨터를 이용한 모의 실험 결과 제안된 알고리즘은 객관적인 평가와 주관적인 평가에 있어서 우수한 성능을 나타내었다.

  • PDF

Principal component analysis를 이용한 LSP 계수의 압축기법 (Compression of LSP Coefficents Using Principal Component Analysis)

  • 안해용;이철희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.85-88
    • /
    • 2001
  • Line spectrum pair(LSP) 계수는 양자화 오류에 강하고. 선형 릴간에 효율적이며, 필터의 안정성 판정이 용이하므로 LPC를 대신하여 음성 부호화에 널리 사용되고 있다. 일반적으로 LSP 계수간에는 일정한 상관관계가 나타나고, 이 특성을 이용하면 LSP 계수의 부호량을 줄일 수 있는 가능성이 있나. 본 논문에서는 LSP 계수를 압축하기 위해 principal component analysis(PCA)를 사용한 방법을 제안한다. 제안된 방법에서는 LSP 계수를 Karhunen-Loeve(KL) 변환해 에너지가 집중되는 고유치(eigenvalue)와 고유벡터(eigenvector)를 찾고 값을 양자화 한다. 성능 평가를 위해 2.4kbps MELP(mixed excitation linear prediction)와 8kbps QCELP(qualcumn code excited linear prediction) 음성 부호화기를 사용해 결과 값을 비교했고, 압축률이 증가하는 것을 확인했다.

  • PDF

철강공정 슬라브번호 자동인식 시스템 개발 (Development of recognition system of a slab number in the steel production line)

  • 이종학;박상국;이문락
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.986-989
    • /
    • 2003
  • 철강공정 중에서 고로에서 용융된 쇳물은 연주공정을 거쳐 슬라브(slab) 재질로 변한 후 다음 공정인 열연공정으로 이동하게 된다. 본 논문은 슬라브 재질의 단면에 마킹된 소재관리번호를 슬라브가 열연공정으로 이동하기 전에 철강공정 상에서 실시간으로 인식하기 위한 인식시스템 개발에 관한 연구다. 이를 위해 획득한 슬라브의 단면 영상에 대해 전처리 필터를 적용하여 노이즈를 제거시킨 그레이레벨 영상에 대해 대략적인 번호영역을 추출한 후, 개별 번호영역을 추출하여 최종으로 소재의 관리번호를 추출하는 방법을 사용한다. 그리고 슬라브의 소재 관리번호 추출을 위해 KL-변환 (Karhunen-Loeve transform) 알고리즘을 사용한다. 개발된 슬라브번호 인식 시스템을 사용하여 실제로 공정 상에서 획득한 슬라브 단면 영상데이터에 대해 적응해본 결과 약 94%의 인식률을 가졌다.

  • PDF

KL 변환을 이용한 multilayer perceptron에 의한 한국어 연속 숫자음 인식 (Korean continuous digit speech recognition by multilayer perceptron using KL transformation)

  • 박정선;권장우;권정상;이응혁;홍승홍
    • 전자공학회논문지B
    • /
    • 제33B권8호
    • /
    • pp.105-113
    • /
    • 1996
  • In this paper, a new korean digita speech recognition technique was proposed using muktolayer perceptron (MLP). In spite of its weakness in dynamic signal recognition, MLP was adapted for this model, cecause korean syllable could give static features. It is so simle in its structure and fast in its computing that MLP was used to the suggested system. MLP's input vectors was transformed using karhunen-loeve transformation (KLT), which compress signal successfully without losin gits separateness, but its physical properties is changed. Because the suggested technique could extract static features while it is not affected from the changes of syllable lengths, it is effectively useful for korean numeric recognition system. Without decreasing classification rates, we can save the time and memory size for computation using KLT. The proposed feature extraction technique extracts same size of features form the tow same parts, front and end of a syllable. This technique makes frames, where features are extracted, using unique size of windows. It could be applied for continuous speech recognition that was not easy for the normal neural network recognition system.

  • PDF