• 제목/요약/키워드: 장단기 기억 네트워크

검색결과 11건 처리시간 0.023초

Neural Attention을 반영한 문장 생성 모델 (Sentence generation model with neural attention)

  • 이세희;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.17-18
    • /
    • 2017
  • 자연어 처리 분야에서 대화문 생성, 질의응답 등과 같은 문장생성과 관련된 연구가 꾸준히 진행되고 있다. 본 논문에서는 기존 순환신경망 모델에 Neural Attention을 추가하여 주제 정보를 어느 정도 포함시킬지 결정한 뒤 다음 문장을 생성할 때 사용하는 모델을 제안한다. 이는 기존 문장과 다음 문장의 확률 정보를 사용할 뿐만 아니라 주제 정보를 추가하여 문맥적인 의미를 넣을 수 있기 때문에, 더욱 연관성 있는 문장을 생성할 수 있게 도와준다. 이 모델은 적절한 다음 문장을 생성할 뿐만 아니라 추가적으로 어떤 단어가 다음 문장을 생성함에 있어 주제문장에 더 민감하게 반응하는지 확인할 수 있다.

  • PDF

CNN-LSTM 기반의 자율주행 기술 (CNN-LSTM based Autonomous Driving Technology)

  • 박가은;황치운;임세령;장한승
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1259-1268
    • /
    • 2023
  • 본 연구는 딥러닝의 합성곱과 순환신경망 네트워크를 기반으로 시각센서를 이용해 속도(Throttle)와 조향(Steering) 제어 기술을 제안한다. 학습 트랙을 시계, 반시계 방향으로 주행하며 카메라 영상 이미지와 조종 값 데이터를 수집하고 효율적인 학습을 위해 데이터 샘플링, 전처리 과정을 거쳐 Throttle과 Steering을 예측하는 모델을 생성한다. 이후 학습에 사용되지 않은 다른 환경의 테스트 트랙을 통해 검증을 진행하여 최적의 모델을 찾고 이를 CNN(Convolutional Neural Network)과 비교하였다. 그 결과 제안하는 딥러닝 모델의 성능이 뛰어남을 확인했다.

수문 시계열 예측을 위한 LSTM의 다지점 통합 학습 방안 평가 (Evaluation of multi-basin integrated learning method of LSTM for hydrological time series prediction)

  • 최정현;원정은;정하은;김상단
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.366-366
    • /
    • 2022
  • 유역의 하천유량과 같은 수문 시계열을 모의 또는 예측하기 위한 수문 모델링에서 최근 기계 학습 방법을 활용한 연구가 활발하게 적용되고 있는 추세이다. 이러한 데이터 기반 모델링 접근법은 입출력 자료에서 관찰된 패턴을 학습하며, 특히, 장단기기억(Long Short-Term Memory, LSTM) 네트워크는 많은 연구에서 수문 시계열 예측에 대한 적용성이 검증되었으나, 장기간의 고품질 관측자료를 활용할 때 더 나은 예측성능을 보인다. 그러나 우리나라의 경우 장기간 관측된 고품질의 하천유량 자료를 확보하기 어려운 실정이다. 따라서 본 연구에서는 LSTM 네트워크의 학습 시 가용한 모든 유역의 자료를 통합하여 학습시켰을 때 하천유량 예측성능을 개선할 수 있는지 판단해보고자 하였다. 이를 위해, 우리나라 13개 댐 유역을 대상으로 대상 유역의 자료만을 학습한 모델의 예측성능과 모든 유역의 자료를 학습한 모델의 예측성능을 비교해 보았다. 학습은 2001년부터 2010년까지 기상자료(강우, 최저·최고·평균기온, 상대습도, 이슬점, 풍속, 잠재증발산)를 이용하였으며, 2011년부터 2020년에 대해 테스트 되었다. 다지점 통합학습을 통해 테스트 기간에 대해 예측된 각 유역의 일 하천유량의 KGE 중앙값이 0.74로 단일지점 학습을 통해 예측된 KGE(0.72)보다 다소 개선된 결과를 보여주었다. 다지점 통합학습이 하천유량 예측에 큰 개선을 달성하지는 못하였으며, 추가적인 가용 자료 확보와 LSTM 구성의 개선을 통해 추가적인 연구가 필요할 것으로 판단된다.

  • PDF

메모리 요소를 활용한 신경망 연구 동향 (A Survey on Neural Networks Using Memory Component)

  • 이지환;박진욱;김재형;김재인;노홍찬;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권8호
    • /
    • pp.307-324
    • /
    • 2018
  • 최근 순환 신경 망(Recurrent Neural Networks)은 시간에 대한 의존성을 고려한 구조를 통해 순차 데이터(Sequential data)의 예측 문제 해결에서 각광받고 있다. 하지만 순차 데이터의 시간 스텝이 늘어남에 따라 발생하는 그라디언트 소실(Gradients vanishing)이 문제로 대두되었다. 이를 해결하기 위해 장단기 기억 모델(Long Short-Term Memory)이 제안되었지만, 많은 데이터를 저장하고 장기간 보존하는 데에 한계가 있다. 따라서 순환 신경망과 메모리 요소(Memory component)를 활용한 학습 모델인 메모리-증대 신경망(Memory-Augmented Neural Networks)에 대한 연구가 최근 활발히 진행되고 있다. 본 논문에서는 딥 러닝(Deep Learning) 분야의 화두로 떠오른 메모리-증대 신경망 주요 모델들의 구조와 특징을 열거하고, 이를 활용한 최신 기법들과 향후 연구 방향을 제시한다.

머신러닝을 이용한 철광석 가격 예측에 대한 연구 (Forecasting of Iron Ore Prices using Machine Learning)

  • 이우창;김양석;김정민;이충권
    • 한국산업정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.57-72
    • /
    • 2020
  • 철광석의 가격은 여러 국가와 기업들의 수요와 공급에 따라서 높은 변동성이 지속되고 있다. 이러한 비즈니스 환경에서 철광석의 가격을 예측하는 것은 중요해졌다. 본 연구는 머신러닝 기법을 이용하여 철광석이 거래되는 시점으로부터 한 달 전에 철광석 거래가격을 미리 예측하는 모형을 개발하고자 하였다. 예측 모형은 시계열 데이터를 활용한 예측 방법론으로 많이 활용되고 있는 시차분포 모형과 다층신경망 (Multi-layer perceptron), 순환신경망 (Recurrent neural network), 그리고 장단기 기억 네트워크 (Long short-term memory)와 같은 딥 러닝(Deep Learning) 모형을 사용하였다. 측정지표를 통해 개별 모형을 비교한 결과에 따르면, LSTM 모형이 예측 오차가 가장 낮은 것으로 나타났다. 또한, 앙상블 기법을 적용한 모형들을 비교한 결과, 시차분포와 LSTM의 앙상블 모형이 예측오차가 가장 낮은 것으로 나타났다.

효율적인 교통 체계 구축을 위한 Conv-LSTM기반 사거리 모델링 및 교통 체증 예측 알고리즘 연구 (Conv-LSTM-based Range Modeling and Traffic Congestion Prediction Algorithm for the Efficient Transportation System)

  • 이승용;서부원;박승민
    • 한국전자통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.321-327
    • /
    • 2023
  • 인공 지능이 발전함에 따라 예측 시스템은 우리의 삶에 필수적인 기술 중 하나로 자리를 잡았다. 이러한 기술의 성장에도 불구하고, 21세기 사거리 교통 체증은 계속해서 문제 되어 왔다. 본 논문에서는 Conv-LSTM(: Convolutional-Long Short-Term Memory) 알고리즘을 이용한 사거리 교통 체증 예측 시스템을 제안한다. 제안한 시스템은 교통 체증이 발생하는 사거리에 시간대별 교통 정보를 학습한 데이터를 모델링 한다. 시간의 흐름에 따라 기록된 교통량 데이터로 교통 체증을 예측하며. 예측된 결과를 기반으로 사거리 교통 신호를 제어하고, 일정한 교통량으로 유지한다. VDS(: Vehicle Detection System)센서를 활용하여 도로 혼잡도 데이터를 정의하고, 교통을 원활하게 하기 위하여 각각의 교차로를 Conv-LSTM 알고리즘기반 네트워크 시스템으로 구성하였다.

수신된 전파신호의 자동 변조 인식을 위한 딥러닝 방법론 (A deep learning method for the automatic modulation recognition of received radio signals)

  • 김한진;김혁진;제준호;김경섭
    • 한국정보통신학회논문지
    • /
    • 제23권10호
    • /
    • pp.1275-1281
    • /
    • 2019
  • 무선 신호의 자동 변조 인식은 지능형 수신기의 주요한 작업으로 다양한 민간 및 군대 응용분야가 있다. 본 논문에서는 딥 뉴럴 네트워크 모델을 기반한 무선통신에서 전파신호의 변조 방식을 식별하는 방법을 제안한다. 순차적인 데이터에 대해 장기적인 패턴을 잡아내는데 용이한 LSTM 모델을 통과하여 얻은 연속적인 신호의 특징값을 딥 뉴럴 네트워크의 입력 데이터로 사용하여 신호의 변조 패턴을 분류한다. 변조된 신호의 진폭 및 위상, 동상(In-phase) 반송파, 직각 위상(Quadrature-phase) 반송파의 값을 LSTM 모델의 입력 데이터로 사용하여 분류한다. 제안된 학습 방법의 성능을 검증하기 위해, 다양한 신호 대 잡음비로 10 가지 유형의 변조 신호를 포함하는 대형 데이터 세트를 사용하여 학습하고 테스트한다. 본 논문의 변조 인식 프로그램은 신호의 사전 정보가 없는 환경에서 변조방식을 예측하는데 적용될 수 있다.

Applying a Novel Neuroscience Mining (NSM) Method to fNIRS Dataset for Predicting the Business Problem Solving Creativity: Emphasis on Combining CNN, BiLSTM, and Attention Network

  • Kim, Kyu Sung;Kim, Min Gyeong;Lee, Kun Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.1-7
    • /
    • 2022
  • 인공지능 기술이 발달하면서 뉴로사이언스 마이닝(NSM: NeuroScience Mining)과 AI를 접목하려는 시도가 증가하고 있다. 나아가 NSM은 뉴로사이언스와 비즈니스 애널리틱스의 결합으로 인해 연구범위가 확장되고 있다. 본 연구에서는 fNIRS 실험을 통해 확보한 뉴로 데이터를 분석하여 비즈니스 문제 해결 창의성(BPSC: business problem-solving creativity)을 예측하고 이를 통해 NSM의 잠재력을 조사한다. BPSC는 비즈니스에서 차별성을 가지게 하는 중요한 요소이지만, 인지적 자원의 하나인 BPSC의 측정 및 예측에는 한계가 존재한다. 본 논문에서는 BPSC 예측 성능을 높이는 방안으로 CNN, BiLSTM 그리고 어텐션 네트워크를 결합한 새로운 NSM 기법을 제안한다. 제안된 NSM 기법을 15만 개 이상의 fNIRS 데이터를 활용하여 유효성을 입증하였다. 연구 결과, 본 논문에서 제안하는 NSM 방법이 벤치마킹한 알고리즘(CNN, BiLSTM)에 비하여 우수한 성능을 가지는 것으로 나타났다.

미국 무역정책 변화가 국내 중공업 기업의 경영성과에 미치는 영향 (Predicting Performance of Heavy Industry Firms in Korea with U.S. Trade Policy Data)

  • 박진수;김경호;김범수;서지혜
    • 한국전자거래학회지
    • /
    • 제22권4호
    • /
    • pp.71-101
    • /
    • 2017
  • 미국 무역위원회(United States International Trade Commission)는 불공정 무역으로 인해 무역 질서를 해치는 경우 상계 관세(Countervailing Duties)와 반덤핑 관세(Antidumping Duties) 등을 징수하고 있다. 본 연구에서는 상기 연구 목적을 달성하기 위하여 상계 관세 및 반덤핑 관세와 관련된 데이터를 수집해 양적 분석을 수행하였다. 몇 가지 데이터 마이닝(Data mining) 기법을 활용한 본 연구의 양적 분석 결과, 미국의 상계 관세 및 반덤핑 관세 부과 경향이 우리나라의 중공업 산업의 성장률에 유의한 영향을 미친다고 잠정적으로 결론 내릴 수 있었다. 본 연구의 가장 큰 기여점은 '미국의 보호주의 무역기조가 울산지역의 주력산업의 경영성과에 부정적인 영향을 미칠 수 있다'는 직관적인 명제를 과거 데이터를 가지고 객관적으로 검증해보고 그 영향 정도를 계량화해 측정할 수 있도록 한 것이라고 할 수 있다.

데이터 예측을 위한 텐서플로우 기반 기계학습 알고리즘 비교 연구 (A Comparative Study of Machine Learning Algorithms Based on Tensorflow for Data Prediction)

  • ;장성봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권3호
    • /
    • pp.71-80
    • /
    • 2021
  • 기계학습에서 정확한 데이터 예측을 위해서는 적절한 인공신경망 알고리즘을 선택해야 한다. 이러한 알고리즘에는 심층 신경망 (DNN), 반복 신경망 (RNN), 장단기 기억 (LSTM) 네트워크 및 게이트 반복 단위 (GRU) 신경망등을 들 수 있다. 개발자가 실험을 위해, 하나를 선택해야 하는 경우, 각 알고리즘의 성능에 대한 충분한 정보가 없었기 때문에, 직관에 의존할 수 밖에 없었다. 본 연구에서는 이러한 어려움을 완화하기 위해 실험을 통해 예측 오류(RMSE)와 처리 시간을 비교 평가 하였다. 각 알고리즘은 텐서플로우를 이용하여 구현하였으며, 세금 데이터를 사용하여 학습을 수행 하였다. 학습 된 모델을 사용하여, 세금 예측을 수행 하였으며, 실제값과의 비교를 통해 정확도를 측정 하였다. 또한, 활성화 함수와 다양한 최적화 함수들이 알고리즘에 미치는 영향을 비교 분석 하였다. 실험 결과, GRU 및 LSTM 알고리즘의 경우, RMSE(Root Mean Sqaure Error)는 0.12이고 R2값은 각각 0.78 및 0.75로 다른 알고리즘에 비해 더 낳은 성능을 보여 주었다. 기본 심층 신경망(DNN)의 경우, 처리 시간은 가장 낮지만 예측 오류는 0.163로 성능은 가장 낮게 측정 되었다. 최적화 알고리즘의 경우, 아담(Adam)이 오류 측면에서 최고의 성능을, 처리 시간 측면에서 최악의 성능을 보여 주었다. 본 연구의 연구결과는 데이터 예측을 위한 알고리즘 선택시, 개발자들에게 유용한 정보로 사용될 것으로 예상된다.