• Title/Summary/Keyword: 단위 신경망

Search Result 216, Processing Time 0.026 seconds

Automatic segmentation for continuous spoken Korean language recognition based on phonemic TDNN (음소단위 TDNN에 기반한 한국어 연속 음성 인식을 위한 데이타 자동분할)

  • Baac, Coo-Phong;Lee, Geun-Bae;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.30-34
    • /
    • 1995
  • 신경망을 이용하는 연속 음성 인식에서 학습이라 함은 인위적으로 분할된 음성 데이타를 토대로 진행되는 것이 지배적이었다. 그러나 분할된 음성데이타를 마련하기 위해서는 많은 시간과 노력, 숙련 등을 요구할 뿐만아니라 그 자체가 인식도메인의 변화나 확장을 어렵게 하는 하나의 요인 되기도 한다. 그래서 분할된 음성데이타의 사용을 가급적 피하고 그러면서도 성능을 떨어뜨리지 않는 신경망 학습법들이 나타나고 있다. 본 논문에서는 학습된 인식기를 이용하여 자동으로 한국어 음성데이타를 분할한 후 그 분할된 데이타를 이용하여 다시 인식기를 재학습시켜나가는 반복 과정을 소개하고자 한다. 여기에는 TDNN이 인식기로 사용되며 인식단위는 음소이다. 학습은 cross-validation 기법을 이용하여 제어된다.

  • PDF

Generative Korean Inverse Text Normalization Model Combining a Bi-LSTM Auxiliary Model (Bi-LSTM 보조 신경망 모델을 결합한 생성형 한국어 Inverse Text Normalization 모델)

  • Jeongje Jo;Dongsu Shin;Kyeongbin Jo;Youngsub Han;Byoungki Jeon
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.716-721
    • /
    • 2023
  • Inverse Text Normalization(ITN) 모델은 음성 인식(STT) 엔진의 중요한 후처리 영역 중 하나이며, STT 인식 결과의 가독성을 개선한다. 최근 ITN 모델에 심층신경망을 활용한 연구가 진행되고 있다. 심층 신경망을 사용하는 대부분의 선행연구는 문장 내 변환이 필요한 부분에 토큰 태깅을 진행하는 방식이다. 그러나 이는 Out-of-vocabulary(OOV) 이슈가 있으며, 학습 데이터 구축 시 토큰 단위의 섬세한 태깅 작업이 필요하다는 한계점이 존재한다. 더불어 선행 연구에서는 STT 인식 결과를 그대로 사용하는데, 이는 띄어쓰기가 중요한 한국어 ITN 처리에 변환 성능을 보장할 수 없다. 본 연구에서는 BART 기반 생성 모델로 생성형 ITN 모델을 구축하였고, Bi-LSTM 기반 보조 신경망 모델을 결합하여 STT 인식 결과에 대한 고유명사 처리, 띄어쓰기 교정 기능을 보완한 모델을 제안한다. 또한 보조 신경망을 통해 생성 모델 처리 여부를 판단하여 평균 추론 속도를 개선하였다. 실험을 통해 두 모델의 각 정량 성능 지표에서 우수한 성능을 확인하였고 결과적으로 본 연구에서 제안하는 두 모델의 결합된 방법론의 효과성을 제시하였다.

  • PDF

인공 신경망 기법을 이용한 제지공정의 지절 원인 분석

  • 이진희;이학래
    • Proceedings of the Korea Technical Association of the Pulp and Paper Industry Conference
    • /
    • 2001.04a
    • /
    • pp.168-168
    • /
    • 2001
  • 제지공정의 지절 현상은 많은 공정 변수들이 복합적으로 작용하여 발생하는 가장 큰 공정 트러블 중의 하나이다. 지절은 생산량 감소 뿐만 아니라 발생 후 공정의 복구 와 정리, 생산재가동 및 공정의 재안정화를 위해 많은 시간과 비용, 그리고 노력이 투 입되어야 하므로 공정의 효율과 생산성을 크게 저하시키는 요인이다. 그러나 지절 현상 의 복잡성 때문에 이에 대해 쉽게 접근하거나 해결하지 못하고 있는 것이 현실이지만 그 필요성은 더욱 더 증대되고 있다. 본 연구에서는 최근 들어 각종 산업분야에서 복잡 한 공정상의 결점 발견 및 진단에 효과적이라고 인정받고 있는 예측 분석기법인 인공 신경망(artificial neural network) 시율레이션과 일반적인 통계기법 중의 하나인 주성분 분석을 이용하여 제지 공정의 지절 현상의 검토 가능성을 타진하였다. 인공신경망이란 인간두뇌에서 일어나는 자극-반응-학습과정을 모사하여 현실세계에 존재하는 다양한 현상들의 업력벡터와 출력상태 간의 비선형 mapping올 컴퓨터 시율 레이션을 통하여 분석하고자 하는 기법으로, 여러 가지 현상들을 학습을 통해서 인식하 는 신경망 내의 신경단위들이 병렬처리에 의해 많은 양의 자료에 대한 추론이나 판단 을 신속하고 정확하게 해주는 특징이 있으며 실시간 패턴인식이나 분류 응용분야에도 매우 매력적으로 이용되고 있는 방법이다. 이러한 인공 신경망 기법 중에서도 본 연구 에서는 퍼셉트론의 한계점을 극복하기 위하여 입력총과 출력층에 한 개 이상의 은닉층 ( (hidden layer)을 사용하여 다층 네트워으로 구성하고, 모든 입력패턴에 대하여 발생하 는 오차함수를 최소화하는 방향으로 연결강도를 조정하는 back propagation 학습 알고 리즘을 사용하였다. 지절의 원인으로 추정 가능한 공정인자들을 변수로 하여 최적의 인 공신경망을 구축하기 위해 학습률과 모멘트 상수의 변화 및 은닉층의 수와 출력층의 뉴런 수를 조절하는 동의 작업을 거쳐 네트워크의 정확도가 높은 인공신경망을 설계하 였다. 또한 이러한 인공신경망과의 비교분석을 위해 동일한 공정 데이터들올 이용하여 보편적으로 사용하는 통계기법 중의 하나인 주성분회귀분석을 실시하였다. 주성분 분석은 여러 개의 반응변수에 대하여 얻어진 다변량 자료의 다차원적인 변 수들을 축소, 요약하는 차원의 단순화와 더불어 서로 상관되어있는 반응변수들 상호간 의 복잡한 구조를 분석하는 기법이다. 본 발표에서는 공정 자료를 활용하여 인공신경망 과 주성분분석을 통해 공정 트러블의 발생에 영향 하는 인자들을 보다 현실적으로 추 정하고, 그 대책을 모색함으로써 이를 최소화할 수 있는 방안을 소개하고자 한다.

  • PDF

An Implementation of Neural Networks Intelligent Characters for Fighting Action Games (대전 액션 게임을 위한 신경망 지능 캐릭터의 구현)

  • Cho, Byeong-Heon;Jung, Sung-Hoon;Seong, Yeong-Rak;Oh, Ha-Ryoung
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.14 no.4
    • /
    • pp.383-389
    • /
    • 2004
  • This paper proposes a method to provide intelligence for characters in fighting action games by using a neural network. Each action takes several time units in general fighting action games. Thus the results of a character's action are not exposed immediately but some time units later. To design a suitable neural network for such characters, it is very important to decide when the neural network is taught and which values are used to teach the neural network. The fitness of a character's action is determined according to the scores. For learning, the decision causing the score is identified, and then the neural network is taught by using the score change, the previous input and output values which were applied when the decision was fixed. To evaluate the performance of the proposed algorithm, many experiments are executed on a simple action game (but very similar to the actual fighting action games) environment. The results show that the intelligent character trained by the proposed algorithm outperforms random characters by 3.6 times at most. Thus we can conclude that the intelligent character properly reacts against the action of the opponent. The proposed method can be applied to various games in which characters confront each other, e.g. massively multiple online games.

A Discourse-based Compositional Approach to Overcome Drawbacks of Sequence-based Composition in Text Modeling via Neural Networks (신경망 기반 텍스트 모델링에 있어 순차적 결합 방법의 한계점과 이를 극복하기 위한 담화 기반의 결합 방법)

  • Lee, Kangwook;Han, Sanggyu;Myaeng, Sung-Hyon
    • KIISE Transactions on Computing Practices
    • /
    • v.23 no.12
    • /
    • pp.698-702
    • /
    • 2017
  • Since the introduction of Deep Neural Networks to the Natural Language Processing field, two major approaches have been considered for modeling text. One method involved learning embeddings, i.e. the distributed representations containing abstract semantics of words or sentences, with the textual context. The other strategy consisted of composing the embeddings trained by the above to get embeddings of longer texts. However, most studies of the composition methods just adopt word embeddings without consideration of the optimal embedding unit and the optimal method of composition. In this paper, we conducted experiments to analyze the optimal embedding unit and the optimal composition method for modeling longer texts, such as documents. In addition, we suggest a new discourse-based composition to overcome the limitation of the sequential composition method on composing sentence embeddings.

Han River Basin climate forecast using multi-site artificial neural network (다지점 인공신경망을 이용한 한강수계 기후전망)

  • Kang, Boo-Sik;Moon, Su-Jin;Kim, Jung-Joong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.371-371
    • /
    • 2011
  • 본 연구에서는 한강유역 내 관측기간이 충분한 기상청 지상관측소 10개소를 선정하고 CCCma(Canadian Century for Climate modeling and analysis)에서 제공하는 자료에 대한 인공신경망기법 상세화 적용을 실시하였다. 인공신경망의 학습을 위해 CGCM3.1/T63 20C3M시나리오(reference scenario)의 22개 2D변수 중 물리적으로 민감도가 높다고 판단되는 GCM_Prec, huss, ps를 입력변수로 선정하였으며 인공신경망 학습기간은 1991년~1995년, 검증기간은 1996년~2000년, 예측기간은 2011년~2100년으로 A1B, A2 B1 시나리오 등 다양한 기후변화 시나리오를 통해 예측band를 제시하고자 하였다. 하지만 공간상관을 고려하기 위하여 각 관측소에 대하여 인공신경망 학습을 하는 경우 관측소간 spatial correlation 및 spatial cluster구현이 어렵기 때문에 Spatial Rectangular Pulse모형을 이용하고자 하였으나, 강수면적에 대한 scale의 결정이 어렵다는 단점을 확인 하고 본 연구에서는 Random Cascade 모형을 이용하여 ${\beta}$를 통한 강수면적 scale(rainy area fraction)을 결정하고자 하였다. Random Cascade모형의 기법은 격자단위의 downscaling기법으로 강수대의 공간적 형상을 재현하며 스케일에 비종속적인(scale-invariant)프랙탈 특성을 이용하여 매개변수를 최소화 할 수 있는 장점을 가진 기법으로 한강유역 1Km내외 강우장을 만들어 topographic effect를 첨가하고자 한다.

  • PDF

Music Mood Classification based on a New Feature Reduction Method and Modular Neural Network (단위 신경망과 특징벡터 차원 축소 기반의 음악 분위기 자동판별)

  • Song, Min Kyun;Kim, HyunSoo;Moon, Chang-Bae;Kim, Byeong Man;Oh, Dukhwan
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.18 no.4
    • /
    • pp.25-35
    • /
    • 2013
  • This paper focuses on building a generalized mood classification model with many mood classes instead of a personalized one with few mood classes. Two methods are adopted to improve the performance of mood classification. The one of them is feature reduction based on standard deviation of feature values, which is designed to solve the problem of lowered performance when all 391 features provided by MIR toolbox used to extract features of music. The experiments show that the feature reduction methods suggested in this paper have better performance than that of the conventional dimension reduction methods, R-Square and PCA. As performance improvement by feature reduction only is subject to limit, modular neural network is used as another method to improve the performance. The experiments show that the method also improves performance effectively.

Edge Estimation of Event Data Using Recurrent Neural Network (재귀 신경망 기반 이벤트 영상의 엣지 추정)

  • Paek, Seunghan;Park, Jong-Il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.195-199
    • /
    • 2021
  • 본 논문에서는 재귀 신경망을 통해 동적 비전 센서 (DVS: Dynamic Vision Sensor)의 출력에서 엣지를 추정하는 방법을 제안한다. 동적 비전 센서는 기존의 일반적인 카메라들과 달리 급격한 움직임이나 밝기 변화에 강인하게 동작한다. 그러나 동적 비전 센서에서 획득한 출력은 각각이 독립적이기 때문에 화소들의 상관관계를 이용한 알고리즘을 사용함에 어려움이 따른다. 제안하는 방법은 센서에서 획득한 출력을 일정한 시간단위로 분할하고 2차원 평면에 투영함으로써 출력의 정보량 및 상관관계를 향상시키고, 이를 재귀 신경망에 통과시켜 엣지 정보를 추정한다. 이 방법은 센서의 출력에 의해 형성된 패턴을 학습하여 엣지를 잘 추출하였으며, 기존의 컴퓨터 비전 알고리즘의 적용 및 시각 관성 측위 등의 분야에서 활용될 수 있다.

  • PDF

Semi-automatic Expansion for a Chatting Corpus Based on Similarity Measure Using Utterance Embedding by CNN (합성곱 신경망에 의한 발화 임베딩을 사용한 유사도 측정 기반의 채팅 말뭉치 반자동 확장 방법)

  • An, Jaehyun;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.95-100
    • /
    • 2018
  • 채팅 시스템을 잘 만들기 위해서는 양질, 대량의 채팅 말뭉치가 굉장히 중요하지만 구축 시 많은 비용이 발생한다는 어려움이 있었다. 따라서 본 논문에서는 영화 자막, 극대본과 같이 대량의 발화 데이터를 이용하여 채팅 말뭉치를 반자동으로 확장하는 방법을 제안한다. 채팅 말뭉치 확장을 위해 미리 구축된 채팅 말뭉치와 유사도 기법을 이용하여 채팅 유사도를 구하고, 채팅 유사도가 실험을 통해 얻은 임계값보다 크다면 올바른 채팅쌍이라고 판단하였다. 그리고 길이가 매우 짧은 채팅성 발화의 채팅 유사도를 효과적으로 계산하기 위해 본 논문에서 제안하는 것은 형태소 단위 임베딩 벡터와 합성곱 신경망 모델을 이용하여 발화 단위 표상을 생성하는 것이다. 실험 결과 기본 발화 단위 표상 생성 방법인 TF를 이용하는 것보다 정확률, 재현율, F1에서 각각 5.16%p, 6.09%p, 5.73%p 상승하여 61.28%, 53.19%, 56.94%의 성능을 가지는 채팅 말뭉치 반자동 구축 모델을 생성할 수 있었다.

  • PDF

Korean sentence spacing correction model using syllable and morpheme information (음절과 형태소 정보를 이용한 한국어 문장 띄어쓰기 교정 모델)

  • Choi, Jeong-Myeong;Oh, Byoung-Doo;Heo, Tak-Sung;Jeong, Yeong-Seok;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.141-144
    • /
    • 2020
  • 한국어에서 문장의 가독성이나 맥락 파악을 위해 띄어쓰기는 매우 중요하다. 또한 자연 언어 처리를 할 때 띄어쓰기 오류가 있는 문장을 사용하면 문장의 구조가 달라지기 때문에 성능에 영향을 미칠 수 있다. 기존 연구에서는 N-gram 기반 통계적인 방법과 형태소 분석기를 이용하여 띄어쓰기 교정을 해왔다. 최근 들어 심층 신경망을 활용하는 많은 띄어쓰기 교정 연구가 진행되고 있다. 기존 심층 신경망을 이용한 연구에서는 문장을 음절 단위 또는 형태소 단위로 처리하여 교정 모델을 만들었다. 본 연구에서는 음절과 형태소 단위 모두 모델의 입력으로 사용하여 두 정보를 결합하여 띄어쓰기 교정 문제를 해결하고자 한다. 모델은 문장의 음절과 형태소 시퀀스에서 지역적 정보를 학습할 수 있는 Convolutional Neural Network와 순서정보를 정방향, 후방향으로 학습할 수 있는 Bidirectional Long Short-Term Memory 구조를 사용한다. 모델의 성능은 음절의 정확도와 어절의 정밀도, 어절의 재현율, 어절의 F1 score를 사용해 평가하였다. 제안한 모델의 성능 평가 결과 어절의 F1 score가 96.06%로 우수한 성능을 냈다.

  • PDF