• 제목/요약/키워드: perceptron

검색결과 823건 처리시간 0.025초

DP 알고리즘에 의한 발음사전 전처리와 문맥종속 자소별 MLP를 이용한 영어 발음사전 생성기의 개선 (Improvements of an English Pronunciation Dictionary Generator Using DP-based Lexicon Pre-processing and Context-dependent Grapheme-to-phoneme MLP)

  • 김회린;문광식;이영직;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.21-27
    • /
    • 1999
  • 본 논문에서는 가변어휘 단어 인식기에 사용하기 위한 개선된 MLP 기반 영어 발음사전 생성기를 제안한다. 가변어휘 단어 인식기는 인식대상 도메인이 수시로 바뀌는 상황에서 현재의 인식 도메인에 의해 결정되는 임의의 한국어 어휘들에 대해 처리 할 수 있다. 이 시스템을 영어 단어에 대해서도 처리할 수 있도록 하기 위해서는 미리 정의된 사전에 포함할 수 없는 영어 고유명사와 같은 단어의 발음열을 구할 수 있는 방법이 필요하다. 영어 발음사전 생성기를 구현하기 위하여 본 연구에서는 각 자소를 음소로 변환해 주는 문맥종속 다층 퍼셉트론 구조를 제안한다. 각 자소별 다층 퍼셉트론을 훈련하기 위해서는 표준 발음사전으로부터 각 자소에 대응하는 음소 학습용 데이터를 준비해야 한다. 이를 위해 본 연구에서는 적절한 거리척도를 사용하는 동적 프로그래밍 알고리즘을 사용한다. 훈련 및 평가를 위한 데이터로는 116,191개 영어 단어의 발음사전을 사용하였다. 평가 결과 각각 30~50개의 히든 노드를 가지는 26개 자소별 MLP와 예외 자소 발음사전을 가지고 표준 발음사전에 대하여 72.8%의 단어 정확도를 얻었으며, 이것은 기존의 규칙 에 기반한 발음사전 생성의 정확도인 24.0% 보다 매우 우수한 결과임을 보여주었다.

  • PDF

선택적 주의집중 Hough 변환과 신경망을 이용한 얼굴 검출 (Face Detection Using A Selectively Attentional Hough Transform and Neural Network)

  • 최일;서정익;진성일
    • 대한전자공학회논문지SP
    • /
    • 제41권4호
    • /
    • pp.93-101
    • /
    • 2004
  • 머리가 포함된 얼굴 윤곽선은 5차원의 매개변수들을 가지는 타원 형태와 유사하다. 이 특성은 타원 검출 알고리듬을 얼굴검출 방법에 이용할 수 있도록 한다. 그렇지만 허프 변환으로 5 차원의 매개변수 공간을 구축하기에는 매우 어렵다. 본 논문에서는 선택적 주의집중을 가지는 허프 변환 방법으로 주어진 영상에서 대칭 윤곽선을 가지는 얼굴을 검출하는 방법을 제안한다. 이 방법은 고정된 얼굴의 장단 비율, 그래디언트 정보, 주사선 기반 선택적 방향 분해를 이용하여, 5 차원의 매개변수 공간을 타원의 중심과 특정한 회전 방향을 추정하는 2 차원의 매개변수 공간과 단축의 길이를 추정하는 1 차원의 매개변수 공간으로 분해가 가능하도록 한다. 부가적으로 이 방법에 그래디언트와 지리적인 정보를 결합하는 두 점 선택 제약 조건을 적용하여 복잡한 배경을 가지는 영상에서 허프 변환의 속도를 증대시킨다. 제안하는 허프 변환으로 추출된 후보 얼굴 영역들 가운데에서 얼굴이 아닌 타원 영역들을 다층 퍼셉트론으로 기각시켜 얼굴을 최종적으로 검출한다. 본 논문에서 제안하는 얼굴 검출 방법을 얼굴이 포함된 다양한 영상들에 적용하여 실험한 결과로부터, 제안하는 방법은 처리 속도와 효율성에서 우수함을 확인하였다.

MLP-VQ와 가중 DHMM을 이용한 연결 숫자음 인식에 관한 연구 (A study on the connected-digit recognition using MLP-VQ and Weighted DHMM)

  • 정광우;홍광석
    • 전자공학회논문지S
    • /
    • 제35S권8호
    • /
    • pp.96-105
    • /
    • 1998
  • 본 논문에서는 화자 독립 연속 숫자음 인식 시스템의 성능향상을 위하여 MLP-VQ (Multi-Layer Perceptron-Vector Quantizer)를 이용한 가중 DHMM(WDHMM : Weighted Discrete Hidden Markov Models)을 제안한다. MLP 신경망의 출력분포는 입력 패턴과 학습 패턴들간의 비선형 매핑을 통해 각 패턴들간의 유사도를 나타내는 확률분포를 갖는다. 본 논문에서는 MLP 신경망의 출력분포중 가장 높은 출력 값을 갖는 MLP 신경망의 출력 노드를 인덱스를 이용하여 코드워드를 생성하는 MLP-VQ를 제안하였다. 제안된 MLP-VQ는 기존의 VQ에 비해 현재 입력패턴과 학습된 각 class 패턴들간의 유사성 정도를 인식모델을 반영할 수 있는 특징을 갖는다. 또한 MLP 신경망의 출력분포를 DHMM의 심벌 발생 확률의 가중치로 이용하는 가중 DHMM보다는 음소 클래스간의 관계를 인식모델에 반영할 수 있기 때문에 적은 계산양의 증가로 인식기의 성능을 14.71%개선할 수 있었다. 실험결과에 의하면, MLP-VQ와 WDHMM에 의한 화자독립 연결 숫자음 인식율은 84.22%이다.

  • PDF

학습과 시험과정 일체형 신경회로망의 하드웨어 구현 (The Implementation of Digital Neural Network with identical Learning and Testing Phase)

  • 박인정;이천우
    • 전자공학회논문지C
    • /
    • 제36C권4호
    • /
    • pp.78-86
    • /
    • 1999
  • 신경회로망은 학습 시에는 입력패턴이 변하지 않고 조정된 결합계수 값을 레지스터에 저장시키며, 시험시에는 반대로 결합계수가 고정되고, 레지스터에 입력패턴을 기억시킴으로써 학습과 시험 뉴런회로를 공유할 수 있는 특성을 가지고 있다. 본 연구에서는 신경회로망의 이러한 특성을 고찰하여, 신경회로망 구현시 게이트의 수를 줄일 수 있으며, 학습(learning) 및 시험(testing)시의 연산처리 시간을 단축시키기 위하여 곱셈연산 대신 어드레싱 LUT를 사용하여 학습과 시험이 동일한 신경회로망에서 수행할 수 있는 일체형 디지털 신경회로망 구현을 제안하였다. 제안한 신경회로망의 동작을 검증하기 위하여 수정된 오차역전파 학습 알고리듬에 의한 학습과정을 소프트웨어와 VHDL로 시뮬레이션 하였다. 7-segment 인식기 학습을 비교 검토한 결과, 입력패턴에 따라 다소 학습시간 및 학습횟수의 차이는 있지만 대체로 반복회수는 1000∼10000회 정도로 학습시간은 4∼20㎲로 나타났다. 신경회로망의 동작이 소프트웨어 시뮬레이션 학습 진행 상황과 동일하게 학습됨을 알 수 있었고 구현한 신경회로망이 정상적으로 수행됨을 확인하였으며, 또한 초기치 변화에 대한 실험에서도 초기치의 변화에 구애받지 않고 원활하게 학습되었다. 또한 본논문에서 구현된 신경회로망은 기존의 보드형 신경회로망보다 적은 수의 소자로 구현됨을 보였다.

  • PDF

단층 코어넷 다단입력 인공신경망회로의 함수에 관한 구현가능 연구 (The Implementable Functions of the CoreNet of a Multi-Valued Single Neuron Network)

  • 박종준
    • 전기전자학회논문지
    • /
    • 제18권4호
    • /
    • pp.593-602
    • /
    • 2014
  • 인공신경망회로 목표 중의 하나는 최소한의 회로구성으로 구현가능함수를 가능한 많게 하는데 있다. 본 논문은 인공신경망회로의 가장 기본이 되는 하나의 입력노드와 하나의 출력노드, 그리고 입출력에 다단(multi-level)값을 갖는 단층(입출력 2 layer) 다단 코어넷(CoreNet)을 제안하고 그 처리 용량을 구하였고, 무게값 공간에서 구현 가능한 함수와 각 무게값 좌표(${\omega}$,${\theta}$)를 계산으로 구하여 한 함수의 구현 가능 여부를 알 수 있게 하였다. 또 입력 단계(level)값 설정 방법으로 cot(${\sqrt{x}}$)을 제안하였다. 제안된 p단 입력과 q단 출력을 갖는 코어넷의 처리용량(구현 가능한 함수의 수)은 $a_{p,q}={\frac{1}{2}}p(p-1)q^2-{\frac{1}{2}}(p-2)(3p-1)q+(p-1)(p-2)$임을 유도 증명하였다. 시뮬레이션으로 5단(level) 입력 값과, 6단 출력 값을 갖는 1(5)-1(6) 모델을 분석한 결과, cot(${\sqrt{x}}$) 입력 레벨링법에서 총 246가지의 함수가 구현가능 함을 보였다. 이 모델의 시뮬레이션 결과에서는 최대 219개의 함수가 수렴(구현 가능)하였고, 구현가능 함수 중에서 나머지 수렴되지 않은 27개의 함수는 무게값 공간에서 무게값 좌표를 계산하여 구현 가능함을 보였다. 이는 앞에서 제시된 코어넷 처리용량 $a_{5,6}(=246)$에 의한 계산 값과 일치하였다. 무게값 공간에서, 구현 가능한 함수가 차지하는 영역의 함수번호 매김 방법도 제시하여 구현 가능함수의 번호도 알 수 있도록 하였다.

오프라인 필기체 한글 자소 인식에 있어서 특징성능의 비교 (Comparison of Feature Performance in Off-line Hanwritten Korean Alphabet Recognition)

  • 고태석;김종렬;정규식
    • 인지과학
    • /
    • 제7권1호
    • /
    • pp.57-74
    • /
    • 1996
  • 본 논문에서는 근래의 필기체 한글인식에서 상요되고 있는 특징들의 인식 성능을 비교한다.본 연구는 인식률 뿐만 아니라 인식시스템의 효율성을 향상시키기 위한 특징 선택의 기반을 마련함에 그 목적이 있다.특징성능 비교를 위해 그 특징들의 특성들을 분석하였고,그 특성에 따라 특징들을 전역적 특징(영상변환,통계적 특징,지역/위상적 특징의 3가지 종류로 분류하였다.각 종류별로 한글 자소 특징을 나타내는데 적합한 특징들을 4-5가지씩 선정하였고,인식실험을 한글의 초성자음,횡모음,종모음별로 수행하였다. 실험에 사용된 인식기로는 오류역전파 알고리즘으로 학습된 은닉층이 하나인 다층 퍼셉트론이 사용되었다.실험에 사용된 학습 및 시험용 데이타는 PE92중 30벌이다.실험결과를 보면,1)지역/위상적 특징들이 다른 종류의 특징들보다 인식 성능이 우수하였으며,2) 통계적 특징 중에서는 망 특징과 투영특징이,전역적인 특징들 중에서는 왈쉬특징과 DCT특징이,지역/위상적 특징에서는 윤곽선 위상변화 특징과 오목성 특징이 각각 성능이 우수하였다.

  • PDF

Assessing the Impact of Climate Change on Water Resources: Waimea Plains, New Zealand Case Example

  • Zemansky, Gil;Hong, Yoon-Seeok Timothy;Rose, Jennifer;Song, Sung-Ho;Thomas, Joseph
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.18-18
    • /
    • 2011
  • Climate change is impacting and will increasingly impact both the quantity and quality of the world's water resources in a variety of ways. In some areas warming climate results in increased rainfall, surface runoff, and groundwater recharge while in others there may be declines in all of these. Water quality is described by a number of variables. Some are directly impacted by climate change. Temperature is an obvious example. Notably, increased atmospheric concentrations of $CO_2$ triggering climate change increase the $CO_2$ dissolving into water. This has manifold consequences including decreased pH and increased alkalinity, with resultant increases in dissolved concentrations of the minerals in geologic materials contacted by such water. Climate change is also expected to increase the number and intensity of extreme climate events, with related hydrologic changes. A simple framework has been developed in New Zealand for assessing and predicting climate change impacts on water resources. Assessment is largely based on trend analysis of historic data using the non-parametric Mann-Kendall method. Trend analysis requires long-term, regular monitoring data for both climate and hydrologic variables. Data quality is of primary importance and data gaps must be avoided. Quantitative prediction of climate change impacts on the quantity of water resources can be accomplished by computer modelling. This requires the serial coupling of various models. For example, regional downscaling of results from a world-wide general circulation model (GCM) can be used to forecast temperatures and precipitation for various emissions scenarios in specific catchments. Mechanistic or artificial intelligence modelling can then be used with these inputs to simulate climate change impacts over time, such as changes in streamflow, groundwater-surface water interactions, and changes in groundwater levels. The Waimea Plains catchment in New Zealand was selected for a test application of these assessment and prediction methods. This catchment is predicted to undergo relatively minor impacts due to climate change. All available climate and hydrologic databases were obtained and analyzed. These included climate (temperature, precipitation, solar radiation and sunshine hours, evapotranspiration, humidity, and cloud cover) and hydrologic (streamflow and quality and groundwater levels and quality) records. Results varied but there were indications of atmospheric temperature increasing, rainfall decreasing, streamflow decreasing, and groundwater level decreasing trends. Artificial intelligence modelling was applied to predict water usage, rainfall recharge of groundwater, and upstream flow for two regionally downscaled climate change scenarios (A1B and A2). The AI methods used were multi-layer perceptron (MLP) with extended Kalman filtering (EKF), genetic programming (GP), and a dynamic neuro-fuzzy local modelling system (DNFLMS), respectively. These were then used as inputs to a mechanistic groundwater flow-surface water interaction model (MODFLOW). A DNFLMS was also used to simulate downstream flow and groundwater levels for comparison with MODFLOW outputs. MODFLOW and DNFLMS outputs were consistent. They indicated declines in streamflow on the order of 21 to 23% for MODFLOW and DNFLMS (A1B scenario), respectively, and 27% in both cases for the A2 scenario under severe drought conditions by 2058-2059, with little if any change in groundwater levels.

  • PDF

Local min/max 연산을 이용한 필기체 숫자의 방향특징 추출 (Directional Feature Extraction of Handwritten Numerals using Local min/max Operations)

  • 정순원;박중조
    • 융합신호처리학회논문지
    • /
    • 제10권1호
    • /
    • pp.7-12
    • /
    • 2009
  • 본 논문에서는 local min/max 연산을 이용한 필기체 숫자의 방향특징 추출 기법을 제안한다. 숫자의 방향특징은 숫자를 이루는 선에서 수평, 수직 및 두 대각방향인 4개 방향의 선들로 구성된 방향선분 영상으로부터 구해진다. Kirsch 마스크를 사용하는 기존의 방향특징 추출기법은 에지형태인 두 겹으로 된 방향선분 영상을 생성하는데 반해 본 논문에서 제시하는 방법은 방향성 수축연산을 사용하여 한 겹으로 된 방향선분 영상을 생성한다. 본 방향성 수축연산을 숫자영상에 적용하기 위해서는 먼저 세선화, 영상 팽창 등의 전처리가 필요하지만 이 방법은 숫자를 이루는 선 자체와 더욱 유사한 형태를 갖는 방향선분을 제공한다. 우리가 구하고자 하는 [$4{\times}4$] 크기인 4개의 방향특징은 4개의 방향선분 영상으로부터 조닝방법을 통해 구해진다. 보다 높은 필기체 숫자인식을 얻기 위해, 본 연구에서는 우리가 제안한 방향특징에 기존의 Kirsch 방향특징과 오목특징을 결합한 다중특징을 사용하였다. 본 숫자 특징에 의한 인식률을 테스트를 위해 오류역전파 알고리즘으로 학습되는 다층퍼셉트론 신경회로망을 인식기로 사용하였으며, Concordia 대학의 CENPARMI 숫자 데이터베이스를 사용하여 실험한 결과 98.35%의 인식률을 얻을 수 있었다.

  • PDF

다단계 신경회로망을 이용한 후두질환 감별진단 시스템의 개발 (A Basic Study on the Differential Diagnostic System of Laryngeal Diseases using Hierarchical Neural Networks)

  • 전계록;김기련;권순복;예수영;이승진;왕수건
    • 대한의용생체공학회:의공학회지
    • /
    • 제23권3호
    • /
    • pp.197-205
    • /
    • 2002
  • 본 연구에서는 잡음이 존재하는 공간에서 획득한 음성신호로부터 후두질환을 감별진단 할 수 있는 분류기를 구현하였다. 이를 위해 후두질환 환자로부터 수집한 /아/ 모음에 잡음을 혼입하여 음성 신호를 획득하였고, 여러 가지 후두질환을 감별진단 할 수 있는 파라미터를 추출하였으며. 이를 입력으로 하는 계층적 신경회로망을 구성하여 후두질환을 감별진단 하도록 하였다. 감별진단용 분류기는 다섯 단계의 계층적 신경회로망으로 구성하였다 첫 번째 신경회로망은 정상 양성 후두질환과 악성 후두질환을. 두 번째 신경회로망은 정상과 양성 후두질환을 감별진단 하도록 하였다 그리고 세 번째 신경회로망은 양성 후두질환 중 후두용. 성대결절 후두마비를 감별진단 하도록 하였으며. 네 번째와 다섯 번째 신경회로망은 성문암 1-4기를 감별진단 하도록 구성하였다. 분류기에 적용된 신경회로망은 다층퍼셉트론 구조로써 역전파 알고리듬으로 학습시켰으며, 선형변환 표준점수변환 등 전처리과정을 적용하여 분류기의 성능을 개선하였다. 후두질환의 감별진단 결과 후두용 88.23%. 정상. 성대결절. 후두마비 100%. 성문암 1기 90%, 성문암 2-4기 100%의 감별진단율을 관찰할 수 있었다.

머신러닝을 사용한 단층 탐지 기술 연구 동향 분석 (Research Trend Analysis for Fault Detection Methods Using Machine Learning)

  • 배우람;하완수
    • 자원환경지질
    • /
    • 제53권4호
    • /
    • pp.479-489
    • /
    • 2020
  • 단층은 근원암에서 형성된 석유 가스 등의 탄화수소가 이동하는 통로이자 탄화수소를 가두는 덮개암의 역할을 할 수 있는 지질구조로, 탄화수소가 축적된 저류층을 찾기 위한 탄성파 탐사의 주요 대상 중 하나이다. 하지만 기존의 유사성, 응집성, 분산, 기울기, 단층가능성 등 탄성파 자료의 측면 방향 불연속성을 활용하는 단층 감지 방법들은 전문지식을 갖춘 해석자가 많은 계산 비용과 시간을 투자해야 한다는 문제가 있다. 따라서 많은 연구자들이 단층 해석에 필요한 계산 비용과 시간을 절약하기 위한 다양한 연구를 진행하고 있고, 최근에는 머신러닝 기술을 활용한 연구들이 활발히 수행되고 있다. 단층 해석에는 다양한 머신러닝 기술들 중 서포트백터머신, 다층퍼셉트론, 심층 신경망, 합성곱 신경망 등의 알고리즘이 사용되고 있다. 특히 합성곱 신경망을 활용한 연구는 독자적인 구조의 모델을 사용한 연구뿐만 아니라, 이미지 처리 분야에서 성능이 검증된 모델을 활용한 연구 및 단층의 위치와 주향, 경사 등의 정보를 함께 해석하는 연구도 활발히 진행되고 있다. 이 논문에서는 이러한 연구들을 조사하고 분석하여, 현재까지 단층 위치 및 단층 정보 해석에 가장 효과적인 기술은 영상 처리 분야에서 검증된 U-Net 구조를 바탕으로 한 합성곱 신경망인 것을 확인했다. 이러한 합성곱 신경망에 전이학습 및 데이터 증식 기법을 접목하면 앞으로 더욱 효과적인 단층 감지 및 정보 해석이 가능할 것으로 기대된다.