• 제목/요약/키워드: Pattern recognition algorithm

검색결과 766건 처리시간 0.03초

분절 특징 HMM을 이용한 영어 음소 인식 (English Phoneme Recognition using Segmental-Feature HMM)

  • 윤영선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권3호
    • /
    • pp.167-179
    • /
    • 2002
  • 본 논문에서는 여러 프레임 특징으로 표현되는 분절 특징(segmental feature) 표현 방법을 제안하고, HMM 개념 위에서 음향학적 모델과 그 알고리즘을 개발하여 HMM의 약점으로 지적되는 독립관측 가정을 완화시키고자 한다. 제안된 특징 표현은 단일 프레임 특징이 음성 신호의 시간적 동적 특성 (temporal dynamics)을 제대로 표현하지 못하기 때문에, 여러 프레임을 이용하여 음성 특징을 표현하도록 한다. 분절 특징은 다항식의 회귀 함수(polynomial regression function)에 의하여 관측 벡터의 궤적으로 표현되고, 이 특징을 패턴 분류에 사용하기 위하여 음성 신호의 궤적을 효과적으로 표현하는 분절 HMM(segmental HMM)을 이용한다. SHMM은 상태에서의 관측 확률을 외적 분절 변이와 내적 분절 변이로 세분하며, 외적 분절 변이는 장기적인 변화를, 내적 분절 변이는 단기적인 변화를 나타낸다. 음향학적 모델에서 분절 특성을 고려하기 위하여 외적 분절 변이는 분절의 확률 분포로 표현하고, 내적 분절 변이는 궤적의 추정 오차로 표현하도록 SHMM을 수정한 분절 특징 HMM(SFHMM; segmental-feature HMM)을 제안한다. SFHMM에서는 분절의 관측 확률을 분절 우도와 궤적의 추정 오차의 관계로써 표현하며, 추정오차는 특정 상태에서의 분절의 우도에 대한 가중치로 고려될 수 있다. 제안된 방법의 유효성과 분절 특징의 특성을 살펴보기 위하여 TIMIT 자료를 이용하여 몇 가지 실험을 하였다. 이들 실험 결과에서, 제안된 방법이 기존의 HMM보다 매개 변수가 많더라도, 성능의 향상과 제안된 특징이 유연하고 정보를 많이 가진다는 점에서 의미가 있다고 하겠다.

작업자 안전관리를 위한 유비쿼터스-실시간 위치추적시스템 연구 (A study of ubiquitous-RTLS system for worker safety)

  • 김영백
    • 한국통신학회논문지
    • /
    • 제37권1C호
    • /
    • pp.1-7
    • /
    • 2012
  • 산업현장에서는 작업 효율을 높이기 위해 공정 과정에 자동화를 진행하고 있지만 전 공정에 자동화를 구축하기 어려운 반자동화 공간에서 작업하는 작업자들은 항상 위험에 노출되어 있다. 이러한 위험으로부터 작업자를 보호하기 위해, 본 논문에서는 Ubiquitous-Wireless Sensor Network(이하 U-WSN) 기반 위치인식 시스템을 이용한 산업현장에서의 작업자 안전관리 시스템을 연구하였다. 무선 신호를 이용하여 두 디바이스 사이의 거리를 측청하고, 3차원 삼각측량으로 작업자의 위치를 계산 할 수 있지만 무선 신호는 철과 구조물이 많은 산업현장에서는 신호의 반사, 멀티패스 등에 따라 오차가 발생하여 정확한 위치를 찾는 것에 많은 어려움이 있는 것이 현실이다. 이러한 문제를 해결하기 위해서 첫째, 작업현장에 적합한 원형편파 패치 안테나를 적용한 Line Of Sight(이하 LOS)에서 안테나 방사 패턴에 의해 발생 할 수 있는 오차를 개선한다. 둘째, 3차원에서 위치를 계산 할 수 있는 3차원 위치계산 방법과 필터링 알고리즘을 활용한 위치 정확도를 개선한다. 개발된 시스템은 항만부두 크레인에 적용하여 정확성 및 실효성을 검증 하였고 본 시스템은 산업현장에서 작업자의 안전에 크게 기여 할 것으로 기대된다.

RAM 기반 신경망의 비지도 학습에 관한 연구 (A Study on Unsupervised Learning Method of RAM-based Neural Net)

  • 박상무;김성진;이동형;이수동;옥철영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.31-38
    • /
    • 2011
  • RAM 기반 3-D 신경망은 2진 신경망(Binary Neural Network, BNN)에 복수개의 정보 저장 비트를 두어 교육의 반복 횟수를 누적하도록 구성된 가중치를 가지지 않는 신경회로망으로서 한 번의 교육만으로 학습이 이루어지는 효율성이 뛰어난 신경회로망이다. MRD(Maximum Response Detector) 기법을 이용한 3-D 신경망의 인식 방법은 지도 학습에 기반을 둔 것으로서 학습을 통해 신경망 스스로가 범주를 구분할 수 없으며 잘 구분된 범주의 학습 데이터를 통해서만 성능을 발휘할 수 있다. 본 논문에서는 기존 3-D 신경 회로망에 학습 데이터의 구분 없이 신경망 자체가 입력 패턴에 따라 학습하여 범주를 구분하는 비지도 학습 알고리즘을 제안한다. 제안된 비지도 학습 알고리즘에 의해 신경회로망은 판별자의 수를 스스로 조절할 수 있는 구조를 가지게 되며 이는 망의 유연한 확장성을 보장한다. 0에서 9까지의 다중 패턴으로 구성된 오프라인 필기체 숫자를 무작위로 추출하여 학습 패턴으로 인식 실험을 수행하였으며 실험을 통해 신경망이 스스로 비지도 학습에 의해 판별자의 수를 결정하게 되며 이것은 신경망이 각각의 필기체 숫자에 대한 개념을 가지게 되는 것으로 해석할 수 있다.

시간적 근접성 향상을 통한 효율적인 SVM 기반 음성/음악 분류기의 구현 방법 (Efficient Implementation of SVM-Based Speech/Music Classifier by Utilizing Temporal Locality)

  • 임정수;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.149-156
    • /
    • 2012
  • 서포트벡터머신 (support vector machine)을 이용한 음성/음악 분류기는 높은 분류 정확도로 주목받고 있으나 많은 계산 량과 저장 공간을 요구하므로 특히 임베디드 시스템과 같이 자원이 제한 적인 경우에는 효율적인 구현이 필수적이다. 특히, 서포트벡터 (support vector)의 차원과 개수에 의해 결정되는 서포트벡터의 저장 공간의 크기는 일반적으로 임베디드 프로세서의 캐시 (cache)의 크기보다 훨씬 크므로 캐시에 존재하지 않는 서포트벡터를 메인 메모리로부터 읽어야 하는 경우가 많다. 메모리에서 데이터를 가져오는 데는 캐시나 레지스터와 비교했을 때 상대적으로 긴 시간과 많은 에너지가 소비되어 분류기의 실행시간과 에너지 소비를 증가시키는 요인이 된다. 본 논문에서는 분류기의 데이터 접근 양식을 보다 시간적 근접성을 가지게 변환하여 일단 프로세서 칩으로 불려진 데이터를 최대한 활용함으로써 메모리의 접근 횟수를 줄여 전체적인 서포트벡터의 실행시간의 단축시키는 기법을 제안한다. 실험을 통해 메모리로의 접근 회수의 감소와 이에 따른 실행시간 그리고 에너지 소비의 감소를 확인하였다.

기준 일증발산량 산정을 위한 인공신경망 모델과 경험모델의 적용 및 비교 (Comparison of Artificial Neural Network and Empirical Models to Determine Daily Reference Evapotranspiration)

  • 최용훈;김민영;수잔 오샤네시;전종길;김영진;송원정
    • 한국농공학회논문집
    • /
    • 제60권6호
    • /
    • pp.43-54
    • /
    • 2018
  • The accurate estimation of reference crop evapotranspiration ($ET_o$) is essential in irrigation water management to assess the time-dependent status of crop water use and irrigation scheduling. The importance of $ET_o$ has resulted in many direct and indirect methods to approximate its value and include pan evaporation, meteorological-based estimations, lysimetry, soil moisture depletion, and soil water balance equations. Artificial neural networks (ANNs) have been intensively implemented for process-based hydrologic modeling due to their superior performance using nonlinear modeling, pattern recognition, and classification. This study adapted two well-known ANN algorithms, Backpropagation neural network (BPNN) and Generalized regression neural network (GRNN), to evaluate their capability to accurately predict $ET_o$ using daily meteorological data. All data were obtained from two automated weather stations (Chupungryeong and Jangsu) located in the Yeongdong-gun (2002-2017) and Jangsu-gun (1988-2017), respectively. Daily $ET_o$ was calculated using the Penman-Monteith equation as the benchmark method. These calculated values of $ET_o$ and corresponding meteorological data were separated into training, validation and test datasets. The performance of each ANN algorithm was evaluated against $ET_o$ calculated from the benchmark method and multiple linear regression (MLR) model. The overall results showed that the BPNN algorithm performed best followed by the MLR and GRNN in a statistical sense and this could contribute to provide valuable information to farmers, water managers and policy makers for effective agricultural water governance.

서베일런스 네트워크에서 패턴인식 기반의 실시간 객체 추적 알고리즘 (Real-Time Object Tracking Algorithm based on Pattern Classification in Surveillance Networks)

  • 강성관;천상훈
    • 디지털융복합연구
    • /
    • 제14권2호
    • /
    • pp.183-190
    • /
    • 2016
  • 본 논문은 서베일런스 네트워크에서 이동하는 객체 추적 시 영상 데이터의 전송량을 감소시키는 신경망 계산 시간의 단축 알고리즘을 제안한다. 객체 검출은 디지털화 연속된 영상으로부터 객체 존재 유무를 판단하고, 객체가 존재할 경우 영상 내 객체의 위치, 방향, 크기 등을 알아내는 기술로 정의된다. 그러나 영상 내의 객체는 위치, 크기, 빛의 방향 및 밝기, 장애물 등의 환경적 변화로 인해 객체 모양이 다양해지므로 정확하고 빠른 검출이 어렵다. 따라서 본 논문에서는 신경망을 사용하여 몇 가지 환경적 조건을 극복한 정확하고 빠른 객체 검출 방법을 제안한다. 검색 영역의 축소는 영상 내 색상 영역의 분할과 차영상을 이용하였고, 주성분 분석을 통해 신경망의 입력 벡터를 축소시킴으로써 신경망 수행 시간과 학습 시간을 단축시켰다. 실시간으로 입력되는 동영상에서 모두 실험하였으며, 색상 영역의 분할을 사용할 경우 입력 영상의 칼라 설정의 유무에 따른 검출 성공률의 차를 보였다. 실험 결과에서 보면 제안하는 방법으로써 객체의 움직임을 탐지하였을 때 기존의 방법보다 30% 정도 더 높은 인식 성능을 보여준다.

인공신경망 기반 온실 외부 온도 예측을 통한 난방부하 추정 (Outside Temperature Prediction Based on Artificial Neural Network for Estimating the Heating Load in Greenhouse)

  • 김상엽;박경섭;류근호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권4호
    • /
    • pp.129-134
    • /
    • 2018
  • 최근, 인공신경망 모델은 예측, 수치제어, 로봇제어, 패턴인식 등의 분야에서 촉망되는 기술이다. 본 연구에서는 인공신경망 모델을 이용하여 온실 외부 온도를 예측하고 이를 온실제어에 활용하는데 목적이 있다. 예측 모델의 성능 평가를 위해 다중회귀모델과 SVM 모델과의 비교분석을 수행하였다. 평가 방법으로는 10-Fold Cross Validation을 사용하였으며, 예측 성능 향상을 위해 상관관계분석 통해 데이터 축소를 수행하였고, 측정 데이터로부터 새로운 Factor 추출하여 데이터의 신뢰성을 확보하였다. 인공신경망 구축을 위해 Backpropagation algorithm을 사용하였으며, 다중회귀모델은 M5 method로 구축하였고, SVM 모델을 epsilon-SVM으로 구축하였다. 각 모델의 비교분석 결과 각각 0.9256, 1.8503과 7.5521로 나타났다. 또한 예측모델을 온실 난방부하 계산에 적용함으로써 온실에 사용되는 에너지 비용 절감을 통한 수입증대에 기여할 수 있다. 실험한 온실의 난방부하는 3326.4kcal/h이며, 총 난방시간이 $10000^{\circ}C/h$일 때 연료소비량은 453.8L로 예측된다. 아울러 데이터 마이닝 기술 중 하나인 인공신경망을 정밀온실제어, 재배기법, 수확예측 등 다양한 농업 분야에 적용함으로써 스마트 농업으로의 발전에 기여할 수 있다.

오디오 부호화기를 위한 스펙트럼 변화 및 MFCC 기반 음성/음악 신호 분류 (Speech/Music Signal Classification Based on Spectrum Flux and MFCC For Audio Coder)

  • 이상길;이인성
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.239-246
    • /
    • 2023
  • 본 논문에서는 오디오 부호화기를 위한 스펙트럼 변화 파라미터와 Mel Frequency Cepstral Coefficients(MFCC) 파라미터를 이용하여 음성과 음악 신호를 분류하는 개루프 방식의 알고리즘을 제안한다. 반응성을 높이기 위해 단구간 특징 파라미터로 MFCC를 사용하고 정확도를 높이기 위해 장구간 특징 파라미터로 스펙트럼 변화를 사용하였다. 전체적인 음성/음악 신호 분류 결정은 단구간 분류와 장구간 분류를 결합하여 이루어진다. 패턴인식을 위해 Gaussian Mixed Model(GMM)을 사용하였고, Expectation Maximization(EM) 알고리즘을 사용하여 최적의 GMM 파라미터를 추출하였다. 제안된 장단구간 결합 음성/음악 신호 분류 방법은 다양한 오디오 음원에서 평균적으로 1.5% 분류 오류율을 보였고 단구간 단독 분류 방법 보다 0.9%, 장구간 단독 분류 방법보다 0.6%의 분류 오류율의 성능 개선을 이룰 수 있었다. 제안된 장단구간 결합 음성/음악 신호 분류 방법은 USAC 오디오 분류 방법보다 타악기 음악 신호에서 9.1% 분류 오류율, 음성신호에서 5.8% 분류 오류율의 성능 개선을 이룰 수 있었다.

혈소판 라만 스펙트럼에서 특이값 분해에 의한 기저 합성을 통한 알츠하이머병 검출 (A screening of Alzheimer's disease using basis synthesis by singular value decomposition from Raman spectra of platelet)

  • 박아론;백성준
    • 한국산학기술학회논문지
    • /
    • 제14권5호
    • /
    • pp.2393-2399
    • /
    • 2013
  • 본 논문에서는 특이값 분해(SVD: singular value decomposition)에 의한 기저 스펙트럼의 합성을 통해 혈소판 라만 스펙트럼에서 알츠하이머병(AD: Alzheimer's disease)을 검출하는 방법을 제안하였다. AD가 유도된 형질 전환 실험용 쥐의 혈소판에서 측정한 라만 스펙트럼은 가산 잡음과 배경 잡음의 제거와 정규화로 구성된 전처리 과정을 수행한다. 각 데이터 행렬의 열벡터는 AD와 정상(NR: normal)의 라만 스펙트럼으로 구성한다. 이 데이터 행렬을 SVD로 분해한 다음 각 행렬의 열벡터 12개를 AD와 NR의 기저 스펙트럼으로 결정한다. 분류 과정은 각 클래스의 기저 스펙트럼을 선형 합성한 스펙트럼과 분류 스펙트럼의 평균제곱근오차(root mean square error)가 최소인 클래스를 선택하는 것으로 완료된다. 278개의 혈소판 라만 스펙트럼을 사용한 실험에 따르면 제안한 방법의 평균 분류율은 약 97.6%로 주성분 분석(principle components analysis)으로 추출한 특징에 MLP(multi-layer perceptron)를 이용한 경우보다 약 6.1% 정도의 우수한 성능을 보였다. 이 결과에서 SVD에 의한 기저 스펙트럼이 혈소판 라만 스펙트럼에서 AD의 검출에 적합하게 사용될 수 있음을 확인하였다.

학습과 시험과정 일체형 신경회로망의 하드웨어 구현 (The Implementation of Digital Neural Network with identical Learning and Testing Phase)

  • 박인정;이천우
    • 전자공학회논문지C
    • /
    • 제36C권4호
    • /
    • pp.78-86
    • /
    • 1999
  • 신경회로망은 학습 시에는 입력패턴이 변하지 않고 조정된 결합계수 값을 레지스터에 저장시키며, 시험시에는 반대로 결합계수가 고정되고, 레지스터에 입력패턴을 기억시킴으로써 학습과 시험 뉴런회로를 공유할 수 있는 특성을 가지고 있다. 본 연구에서는 신경회로망의 이러한 특성을 고찰하여, 신경회로망 구현시 게이트의 수를 줄일 수 있으며, 학습(learning) 및 시험(testing)시의 연산처리 시간을 단축시키기 위하여 곱셈연산 대신 어드레싱 LUT를 사용하여 학습과 시험이 동일한 신경회로망에서 수행할 수 있는 일체형 디지털 신경회로망 구현을 제안하였다. 제안한 신경회로망의 동작을 검증하기 위하여 수정된 오차역전파 학습 알고리듬에 의한 학습과정을 소프트웨어와 VHDL로 시뮬레이션 하였다. 7-segment 인식기 학습을 비교 검토한 결과, 입력패턴에 따라 다소 학습시간 및 학습횟수의 차이는 있지만 대체로 반복회수는 1000∼10000회 정도로 학습시간은 4∼20㎲로 나타났다. 신경회로망의 동작이 소프트웨어 시뮬레이션 학습 진행 상황과 동일하게 학습됨을 알 수 있었고 구현한 신경회로망이 정상적으로 수행됨을 확인하였으며, 또한 초기치 변화에 대한 실험에서도 초기치의 변화에 구애받지 않고 원활하게 학습되었다. 또한 본논문에서 구현된 신경회로망은 기존의 보드형 신경회로망보다 적은 수의 소자로 구현됨을 보였다.

  • PDF