• 제목/요약/키워드: Time Series Data Processing

검색결과 326건 처리시간 0.029초

A Comparative study on smoothing techniques for performance improvement of LSTM learning model

  • Tae-Jin, Park;Gab-Sig, Sim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.17-26
    • /
    • 2023
  • 본 연구논문에서는 LSTM 기반의 학습 모델 적용과 그 효용성을 높일 수 있도록 몇 가지 평활 기법을 비교, 적용하고자 한다. 적용된 평활 기법은 Savitky-Golay, 지수 평활법, 가중치 이동 평균 등이다. 본 연구를 통해 비트코인 데이터에 LSTM모델 적용 시 보여준 결과 값보다 전처리 과정에서 적용된 Savitky-Golay 필터가 적용된 LSTM 알고리즘이 예측 성능에 유의미한 좋은 결과를 보였다. 예측 성능 결과를 확인하기 위해 비트코인 가격 예측에 따른 복잡 요인을 제거하는데 사용된 LSTM의 경우와 Savitzky-Golay LSTM 모델에 따른 학습 손실율과 검증 손실율을 비교하고 그 신뢰성을 높일 수 있도록 20회 평균값으로 실험하였다. 그 결과 (3.0556, 0.00005), (1.4659, 0.00002)의 값을 얻을 수 있었다. 결과적으로는 비트코인과 같은 암호화폐가 주식보다 더한 변동성을 가지는 만큼 데이터 전처리 과정에서 평활 기법(Savitzky-Golay)을 적용하여 잡음(Noise)을 제거하였으며, 전처리 후의 데이터는 LSTM 신경망 학습을 통해서 비트코인 예측률을 높이는데 가장 유의미한 결과를 얻을 수 있었다.

R&D 기술 선정을 위한 시계열 특허 분석 기반 지능형 의사결정지원시스템 (An Intelligent Decision Support System for Selecting Promising Technologies for R&D based on Time-series Patent Analysis)

  • 이충석;이석주;최병구
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.79-96
    • /
    • 2012
  • 기술의 발전과 융합이 빠르게 이루어지고 있는 오늘날 유망기술을 어떻게 파악하여, 다양한 후보군들 중에서 최적의 R&D 대상을 어떻게 선정할 것인가에 대한 문제는 주요한 경영의사결정문제 중 하나로 부상하고 있다. 본 연구에서는 이러한 R&D 기술 선정 의사결정을 지원할 수 있는 새로운 지능형 의사결정지원시스템을 제안한다. 본 연구의 의사결정지원시스템은 크게 3가지 모듈로 구성되는데, 우선 첫 번째 모듈인 '기술가치 평가' 모듈에서는 기업이 관심을 갖고 있는 분야의 특허들을 분석하여 유망기술 파악에 요구되는 다양한 차원의 기술가치 평가지수 값들을 산출하는 작업이 이루어진다. 이를 통해, 현재 시점에서의 각 기술의 가치가 다양한 차원에서 평가가 이루어지고 나면, 두 번째 모듈인 '미래기술가치 예측' 모듈에서 이들의 시간 흐름에 따른 변화를 학습한 인공지능 모형을 토대로 각 후보기술들이 미래 시점에 어떤 가치지수값을 갖게 될 것인지 예측값을 산출하게 된다. 마지막 세 번째 모듈인 '최적 R&D 대상기술 선정 지원' 모듈에서는 앞서 두 번째 모듈에서 산출된 각 차원별 예상 가치지수값들을 적절히 가중합하여 기술의 종합적인 미래가치 예측값을 산출하여 의사결정자에게 제공하는 기능을 수행한다. 이를 통해 의사결정자가 자사에 적합한 최적의 R&D 대상기술을 선정할 수 있도록 하였다. 본 연구에서는 제안된 시스템의 적용 가능성을 검증하기 위해, 10년치 특허데이터에 인공신경망 기법을 적용하여 실제 기술가치 예측모형을 구축해 보고, 그 효과를 살펴본다.

패턴 매칭과 자동 규칙 생성에 기반한 2단계 주식 트레이딩 시스템 (A Two-Phase Stock Trading System based on Pattern Matching and Automatic Rule Induction)

  • 이종우;김유섭;김성동;이재원;채진석
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.257-264
    • /
    • 2003
  • 일반적인 동적 매매 환경에서의 금융 예측 시스템은 주어진 목적을 최적으로 만족시키는 매매 형태를 찾고자 한다. 본 논문은 수익률을 극대화시키기 위하여 추출과 여과라는 두개의 단계로 구성된 새로운 형태의 주식 매매 시스템을 제안한다. 주식 추출 단계에서는 특정 시계열 패턴에 부합하는 주식을 추출하는데, 이러한 시계열 패턴은 기술 지표 값들의 조합으로 표현된다. 그리고 여과 단계에서는 추출된 주식 집합에 여과 규칙들을 적용하여 실제 매매 대상이 되는 주식들을 골라내는데, 여과 규칙은 과거 주가 데이터로부터 자동으로 유도되었다. 이를 위하여, 우리는 먼저 방대한 과거 일별 주가 데이터로부터 기술 지표 값들을 계산하였다. 계산된 기술 지표 값들은 시계열 패턴을 추출하는데 사용되고 이 값들의 이산화 구간들의 분포가 양성 및 음성 데이터들에 대하여 계산된다. 본 논문에서는 독특한 분포를 보이는 구간에 존재하는 기술 지표 값들이 주가의 향후 움직임을 예측하는 데 도움을 준다는 가정을 하였다. 그리고 여과 규칙은 바로 이런 독특한 분포를 보이는 구간 내의 데이터 값들로부터 자동으로 유도되었다. 우리는 시뮬레이션을 통해, 본 논문에서 제시한 트레이딩 시스템이 시장 평균 수익률을 상회한다는 사실을 확인함으로써 위의 가정에 대한 검증을 할 수 있었다.

딥러닝 기반의 연기 확산거리 예측을 위한 알고리즘 개발 기초연구 (Fundamental Study on Algorithm Development for Prediction of Smoke Spread Distance Based on Deep Learning)

  • 김별;황광일
    • 해양환경안전학회지
    • /
    • 제27권1호
    • /
    • pp.22-28
    • /
    • 2021
  • 본 연구는 화재진압 및 피난활동을 지원하는 딥러닝 기반의 알고리즘 개발에 관한 기초 연구로 선박 화재 시 연기감지기가 작동하기 전에 검출된 연기 데이터를 분석 및 활용하여 원격지까지 연기가 확산 되기 전에 연기 확산거리를 예측하는 것이 목적이다. 다음과 같은 절차에 따라 제안 알고리즘을 검토하였다. 첫 번째 단계로, 딥러닝 기반 객체 검출 알고리즘인 YOLO(You Only Look Once)모델에 화재시뮬레이션을 통하여 얻은 연기 영상을 적용하여 학습을 진행하였다. 학습된 YOLO모델의 mAP(mean Average Precision)은 98.71%로 측정되었으며, 9 FPS(Frames Per Second)의 처리 속도로 연기를 검출하였다. 두 번째 단계로 YOLO로부터 연기 형상이 추출된 경계 상자의 좌표값을 통해 연기 확산거리를 추정하였으며 이를 시계열 예측 알고리즘인 LSTM(Long Short-Term Memory)에 적용하여 학습을 진행하였다. 그 결과, 화재시뮬레이션으로부터 얻은 Fast 화재의 연기영상에서 경계 상자의 좌표값으로부터 추정한 화재발생~30초까지의 연기 확산거리 데이터를 LSTM 학습모델에 입력하여 31초~90초까지의 연기 확산거리 데이터를 예측하였다. 그리고 추정한 연기 확산거리와 예측한 연기 확산거리의 평균제곱근 오차는 2.74로 나타났다.

MPEG-21 터미널 (MPEG-21 Terminal)

  • 손유미;박성준;김문철;김종남;박근수
    • 방송공학회논문지
    • /
    • 제8권4호
    • /
    • pp.410-426
    • /
    • 2003
  • MPEG-21은 디지털 객체를 디지털 아이템으로 정의하고 이를 네트워크 깡에서 생성, 변형, 전달, 소비를 위한 통합적 멀티미디어 프레임워크 제공을 위한 국제 표준화 작업을 진행하고 있다. 이러한 통합적 멀티미디어 프레임워크는 네트워크 상에서의 사용자로 하여금 사용자가 원하는 디지털 아이템에 범용적 접근을 가능하게 하고 사용자가 원하는 형태로 소비 할 수 있는 환경을 제공할 것으로 기대된다. 이러한 통합 멀티미디어 프레임워크를 위한 요소 기술 표준으로서 MPEG-21에서는 디지털 아이템의 선언, 식별, 권리 표현 언어, 권리 서술 사전 및 적응 방법 등에 대한 표준화 작업을 진행하였으며, 안전하고 투명한 디지털 아이템의 전달 및 거래를 가능하게 하기 위한 표준으로서 디지털 아이템 처리, 리소스에 대한 영속 관계 기술 및 지적 자산 관리 및 보호 등에 대한 표준화 작업을 진행하고 있다. 본 논문에서는 MPEG-21의 디지털 아이템 선언, 적응 및 처리에 기반한 MPEG-21 터미널(단말) 아키텍쳐를 설계하고 MPEG-21 터미널을 구현한다. 또한 구현된 MPEG-21 터미널을 검증하기 위해 비디오 요약 서비스에 대한 응용 시나리오를 구성하였다. PC 및 PDA 플랫폼을 기반으로 하는 각각의 MPEG-21 터미널 특성에 맞게 디지털 아이템을 가공한 후 특정 형태로 디지털 아이템을 처리하고 이를 상호 호환적 형태로 터미널에서 처리하여 소비되는 일련의 실험 결과를 제시한다. 본 논문은 MPEG-21 디지털 아이템의 적응 및 처리를 위해 디지털 아이템이 표준화 된 형태로 제안된 MPEG-21 터미널에 상호 호환적 형태로 소비될 수 있는 터미널 구조 및 구현, 그리고 실험 결과를 처음으로 제시 하였다는데 의미가 있다고 할 수 있겠다.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

엔빌로프 기반 하한을 사용한 효율적인 회전-불변 윤곽선 이미지 매칭 (Efficient Rotation-Invariant Boundary Image Matching Using the Envelope-based Lower Bound)

  • 김상필;문양세;홍선경
    • 정보처리학회논문지D
    • /
    • 제18D권1호
    • /
    • pp.9-22
    • /
    • 2011
  • 본 논문에서는 윤곽선 이미지 매칭에서 회전-불변 거리 계산의 효율적 방법을 제안한다. 회전-불변 거리 계산은 이미지 시계열을 한 칸씩 회전하면서 매번 유클리디안 거리를 계산해야 하는 고비용의 연산이다. 본 논문에서는 엔빌로프 기반 하한을 사용하여 회전-불변 거리 계산을 크게 줄이는 획기적인 해결책을 제시한다. 이를 위해, 먼저 질의 시퀀스 대상의 단일 엔빌로프 작성과 이의 하한 개념을 제시하고, 이를 회전-불변 거리 계산에 사용하면 많은 수의 회전-불변 거리 계산을 줄일 수 있음을 보인다. 그런데, 단일 엔빌로프 기법은 하나의 엔빌로프가 가능한 모든 회전 시퀀스를 포함하기 때문에 하한이 커지고, 이에 따라 매칭 성능이 저하되는 문제점이 있다. 이러한 문제점을 해결하기 위하여, 본 논문에서는 회전 구간의 개념을 도입하여 단일 엔빌로프 기반 하한을 다중 엔빌로프 기반 하한 개념으로 확장한다. 또한, 다중 엔빌로프 기법에서 회전 구간을 결정하기 위한 방법으로 동일-너비 기법과 엔빌로프 최소화 기법을 제안한다. 실험 결과, 제안한 엔빌로프 기반 매칭 기법은 기존 기법에 비해 최대 수 배에서 수십 배까지 매칭 성능을 향상시킨 것으로 나타났다.

스마트워크 적합성 평가 프레임워크 개발에 관한 연구 (A Study on the Development of an Assessment Framework for Smart Work Readiness)

  • 이정우;이혜정;이세윤
    • 정보화정책
    • /
    • 제20권2호
    • /
    • pp.60-72
    • /
    • 2013
  • 정보통신기술로 인하여 나타나는 업무형태의 변화를 수용하기 위해 여러 가지 근무형태를 도입하려는 시도가 있어 왔으나 최근 스마트 모바일 기기들이 등장하면서 이러한 근무형태의 변화를 '스마트워크'라고 정의하고 정보사회의 근무형태로 확산하고자 하는 흐름이 있다. 본 연구에서는 스마트워크를 하기위해서는 업무 성격이 부합하여야 한다는 점에 착안하여 적합성 판별을 위한 프레임워크를 디자인 사이언스의 방법론에 따라 도출하였다. 본 스마트워크 적합성 평가 프레임워크는 지식활용도를 의미하는 스마트(지식-데이터)와 시공의 유연성을 의미하는 이동성(이동-고정)의 두 개의 축으로 구성하였다. 지식을 활용하면서 이동하는 직무 분야가 스마트워크의 표적 직종으로 분류하였고 데이터를 활용하면서 이동하는 직종은 이미 스마트워크를 하고 있는 직종으로 예측하였다. 이동성이 낮은 직종은 스마트워크에는 부적합한 직종으로 분류하였다. 본 프레임워크를 2011년 직종별 근로자수에 적용하여 적합 직종 근로자수를 추산하였다. 결과적으로 근로인력의 57.4%가 스마트워크를 할 수 있다는 추정을 할 수 있었다. 결론에서는 본 연구의 결과와 관련하여 스마트워크 확산을 위한 정책적 함의를 논하였고 앞으로 필요한 연구들에 관하여 제안을 하였다.

  • PDF

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

모형 그물에 대한 어군행동의 수직 모델링에 관한 연구 - 모형 그물이 없는 수조에서의 무지개송어의 유영특성 - (A Study on the Numerical Modeling of the Fish Behavior to the Model Net - Swimming Characteristics of Rainbow Trout, Salmo Gairdnerii in the Water Tank Without Model Net -)

  • 이병기
    • 수산해양기술연구
    • /
    • 제31권1호
    • /
    • pp.74-83
    • /
    • 1995
  • 모형 그물에 대한 어군행동의 수치모델링에 관한 연구의 일환으로서 어군행동의 모델링을 위하여 어군행동을 나타내는 운동방정식을 구성하는 각종 힘들의 parameter를 추정하기 위한 기초자료를 제공하고자, 모형 그물을 설치하지 않은 상태에서의 유속 변화에 따른 무지개송어의 유영행동을 화성처리하여 각 개체 위치좌표로부터 계산된 유영속도, 유영깊이, 수조의 변과 개체 사이의 거리, 개체상호간의 최근접거리, 어구의 3차원적 구조 등의 유역특성을 조사 분석한 결과는 다음과 같다. 유영궤적으로부터 무지개송어의 유영행동을 살펴보면, 정수상태에서는 수종 중앙부에서 유영하는 빈도가 높았으며, 수조 벽면으로부터 상당히 떨어져서 유회운동을 하는 것으로 나타났다. 정수상태에서의 평균 유영속도는 21.6~23.6cm/sec(2.5~2.9BL cm/sec)로서 개체수가 많을수록 체장당 유영속도가 빠른 것으로 나타났으며, 유속의 변화에 따른 어군의 평균유영속도는 유속이 증가할수록 유영속도도 증가하여 유속이 25cm/sec인 경우에는 유영속도가 30.6 cm/secd(3.8BLcm/sec)에 달하였다. 어군의 평균 유영깊이는 17~38cm로서 주로 중층의 깊이에서 유영하였으며, 유속이 빨라질수록 유영 깊이가 깊어지고 유영 깊이의 변화가 적어졌다. 수조의 벽과 개체 사이의 평균 거리는 17.6~21.4cm였으며, 유속이 빨라질수록 수조의 벽과 개체사이의 거리가 다소 멀어지는 경향을 나타내었다. 개체상호간의 최근거리는 개체수가 많을수록 가까워지며, 유속의 변화에 따른 개체상호간의 최근접거리 평균치는 3.0~5.9cm(0.4~0.7BL cm)로 나타났다. 어군의 3차원적 구조는 군을 형성하는 개체수가 증가함에 따라 군의 형상이 길이, 폭 및 깊이의 모든 방향으로 넓어지며, 유속이 빨라질수록 길이방향과 폭 방향의 크기가 깊이 방향에 비해 상대적으로 커져 각 방향의 평균 상태비는 2.8 : 2.7 : 1이었다.

  • PDF