• 제목/요약/키워드: probabilistic neural network

검색결과 132건 처리시간 0.015초

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

알렌 마우스 브레인 아틀라스를 이용한 반자동 신경섬유지도 분석 : 여기수와 신호대잡음비간의 DTI 획득 비교 (Semi-automated Tractography Analysis using a Allen Mouse Brain Atlas : Comparing DTI Acquisition between NEX and SNR)

  • 임상진;백현만
    • 한국방사선학회논문지
    • /
    • 제14권2호
    • /
    • pp.157-168
    • /
    • 2020
  • 자기공명영상(Magnetic Resonance Image)을 이용한 구조적 연구 방법에서 뇌 구조 세분화 방법은 최근 빠르게 발전하여 구조 이미지의 자동 분할을 위한 유능한 방법론이 되었다. 특히 아틀라스 정보를 이미지에 등록해 피사체의 이미지로 전달하는 분할(Segmentation) 방법은 아틀라스(Atlas)의 정확도에 편향되기 때문에 높은 정확도를 갖고 있는 아틀라스가 필요하게 된다. 알렌 마우스 뇌 아틀라스(Allen Mouse Brain Atlas)는 마우스의 아틀라스 중에서 높은 정확도를 갖고 있어 다양한 분야에서 사용되고 있으며, 신경섬유지도(Tractography)에 필수적인 마우스 뇌구조의 정확한 좌표와 분할 정보를 제공할 수 있다. 또한 기능적 연구 방법인 뇌의 백질 경로를 재구성하는 확산텐서영상(Diffusion Tensor Image)에 대한 확률론적 신경섬유지도를 사용하여 포괄적인 뉴런 네트워크를 매핑 하였다. 인간의 뇌 연구 결과와 마우스의 뇌 연구 결과는 비교분석 할 수 있어 인간에게 적용하기 어려운 실험들을 질환이 모델링된 마우스를 통해 결과를 얻어 임상적으로 이용이 가능하기 때문에 마우스 실험의 중요성이 올라가고 있다. 하지만 마우스를 이용한 연구에서 인간과 마우스의 뇌 크기 차이로 인한 문제가 있어 동등한 영상의 질을 달성하려면 다양한 조건이 필요하게 되며, 그중 대표적으로 충분히 긴 스캔시간이 필요하게 된다. 충분히 긴 스캔시간을 확보하기 위해 본 연구에서는 마우스의 뇌를 샘플화시켜 Ex-vivo 실험이 진행되었으며, 마우스 커넥톰(Connectome) 매핑에 대한 참조를 제공하기 위해 이 연구는 아틀라스 정규화 도구인 ANTx와 확산 텐서 영상을 분석할 도구인 FSL을 사용하여 마우스 뇌의 반자동 분할 및 신경섬유지도 분석 파이프라인을 제시하여 다양한 마우스 모델에 적용하고자 했다. 또한, 신경섬유지도 분석을 위해 획득하는 확산텐서영상의 유용한 신호대 잡음비를 결정하기 위해 다양한 여기수의 영상을 획득해 비교분석하였다.