• 제목/요약/키워드: 다층 데이터 모델

검색결과 98건 처리시간 0.03초

딥러닝 기반 무역 수출 가격 예측 모델 (Predicting the Future Price of Export Items in Trade Using a Deep Regression Model)

  • 김지훈;이지항
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권10호
    • /
    • pp.427-436
    • /
    • 2022
  • 산업통상자원부에서 제공하는 KOTRA 무역 데이터는 해당 품목과 해당 국가에 대하여 GDP, 관세율, 비즈니스 점수, 과/차년도 수출금액 등을 제공한다. 그러나 무역 수출품목은 수없이 많을뿐더러 그에 따른 대량의 데이터를 매년 수작업 기반 분석을 통해 유의미한 결과를 이끌어내는 것은 상당히 큰 시간과 비용을 요구한다. 따라서 이번 연구에선 대량의 데이터를 학습하여 단기간에 저비용으로 결과 예측이 가능한 다층 퍼셉트론 모델을 구현하고 성능을 평가하였다. 먼저 딥러닝 기반 무역 수출 가격 예측 모델을 일반적 다변량 회귀 모델과 비교하였을 때, 예측 오류와 학습 시간 측면에서 통계적으로 우수한 성능을 보였다. 수출 가격 데이터는 시계열 속성이 있을 것으로 예상하는 바, 은닉 노드들이 모두 연결된 다층 퍼셉트론과 순환 신경망을 이용하여 수출 가격 데이터를 예측하였다. 그 결과 새로운 데이터에 대해 수출 가격 예측을 위한 일반화 능력은 순환 신경망이 우수한 성능을 보였으나, 다층 퍼셉트론이 무역 수출 가격 예측에서 더 뛰어난 성능을 보였다. 추후 장기간 데이터를 확보한다면, 순환 신경망 혹은 트랜스포머 기반 딥러닝 모델을 이용하여 더 뛰어난 수출 가격 예측이 가능할 것으로 사료된다.

Temporal Fusion Transformer 모델을 활용한 다층 수평 시계열 데이터 분석 (Multi-horizon Time Series Forecasting Using Temporal Fusion Transformer)

  • 김인경;김대희;이재구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.479-482
    • /
    • 2021
  • 시계열 형태의 데이터는 다양한 분야에서 수집되고 응용되기 때문에 정확한 시계열 예측은 많은 분야에서 운영 효율성을 높일 수 있는 중요한 분석 방법으로 고려된다. 그중 다층 수평 예측은 사용자에게 전반적인 시계열 데이터 경향성을 제공할 수 있다. 하지만 다양한 정보를 포함하는 시계열 데이터는 데이터에 내재한 이질성(heterogeneity)까지 포괄적으로 고려한 방법을 통해서만 정확한 예측을 할 수 있다. 하지만 지금까지 많은 시계열 분석 모델들이 데이터의 이질성을 반영하지 못했다. 이러한 한계를 보완하고자 우리는 Temporal Fusion Transformer 모델을 사용하여 실생활과 밀접한 관련이 있는 데이터에 적용하여 이질성을 고려한 향상된 예측을 수행하였다. 실제, 주식 데이터와 미세 먼지 데이터와 같은 실생활 시계열 데이터에 적용하였고 실험 결과 기존 모델보다 Mean Squared Error(MSE)가 0.3487 낮은 것을 확인하였다.

학생 중도탈락 예측 모델에 관한 연구 (A Study on the Prediction Model for Student Dropout)

  • 이종혁;김대학;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.37-40
    • /
    • 2018
  • 빅데이터 산업 부상과 함께 교육 데이터 분석 분야가 새롭게 주목받고 있다. 교육 현장에서 학습 데이터의 양과 종류는 꾸준히 증가하고 있고 이를 분석하기 위한 정보기술도 계속 발전하고 있다. 한편, 학교 교육은 사회적 성취와 밀접한 관련이 있어 사회이동의 중요한 수단이 되는 만큼 학교 교육으로부터 이탈할 위험이 있는 학생들을 조기에 발견하여 이탈을 방지하는 것은 매우 중요하다. 본 논문은 대학생의 중도탈락을 예방하기 위해 로지스틱 회귀분석과 다층 퍼셉트론 기법을 이용해 학습 데이터를 분석하여 예측 모델을 생성하고 해당 모델을 평가한다. 평가 결과, 다층 퍼셉트론 모델이 로지스틱 회귀분석 모델에 비해 정확도와 재현율은 우수하였지만 정밀도는 약간 저조하였다.

다중 센서 데이터와 다층 퍼셉트론을 활용한 젖소의 유방염 진단 예측 (Prediction of dairy cow mastitis with multi-sensor data using Multi-Layer Perceptron(MLP))

  • 송혜원;박기철;박재화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.788-791
    • /
    • 2020
  • 낙농업에서 경제적 손실을 불러일으키고 관찰 시간과 비용이 필요한 젖소의 유방염 관리는 중요하다. 그러나 지금까지의 연구는 유방염 진단에 초점을 맞추고 있고, 예측하려는 시도는 전무하다. 유방염에 걸린 개체는 며칠 동안 우유를 생산할 수 없기 때문에 낙농가에 막대한 피해를 준다. 따라서 젖소가 유방염에 걸려 증상이 나타나기 전에 미리 파악해 조처를 할 수 있도록 하는 것이 중요하다. 이에 본 연구는 유방염 예측을 위해 생체 데이터를 포함한 다중 센싱 데이터를 사용해 유방염 예측 모델을 개발하였다. 모델에 사용된 데이터는 충청남도의 농가에 설치된 로봇 착유기로 부터 수집하였으며, 일정 기간 동안의 다중 센싱 데이터를 바탕으로 다음 날의 유방염 여부를 예측한다. 많은 양의 비선형 데이터를 효과적으로 처리하기 위해 다층 퍼셉트론을 사용해 모델을 학습하였다. 그 결과, 81.6%의 예측 정확도를 보였으며 교차 검증을 통해 정확도뿐만 아니라 재현율까지 우수함을 확인할 수 있었다.

당뇨병 발생 예측을 위한 다층 스태킹 앙상블 모델 구축 기법 (Automatic Multi-layer Stacking Ensemble Generation Technique for Predicting Diabetes Mellitus Incidence)

  • 성아영;윤소현;강수연;김건우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.426-427
    • /
    • 2023
  • 최근 현대인의 식습관 및 고령화로 인해 당뇨병 환자의 수가 연간 증가하고 있다. 따라서 현재는 아직 당뇨병이 발생하지 않았더라도 미래에 발생할 가능성 예측의 중요성이 커지고 있다. 기존의 당뇨병 발생 여부 진단 연구는 회귀 분석과 같은 단일 모델을 사용하여 수행된다. 그러나 당뇨병에 영향을 미치는 변수들은 복잡하게 얽혀있어 단일 모델만으로는 패턴을 충분히 학습하기 어렵다. 본 논문에서는 데이터에 적합하게 자동으로 다층 스태킹 앙상블 모델을 구성하는 알고리즘을 이용한 다층 스태킹 앙상블 모델을 제안한다. 제안하는 방법은 성능이 높은 모델들을 기준으로 층을 쌓으며 모델을 구성하며 실험 결과 다른 자동 기계학습 라이브러리와 비교해 F1 score 기준으로 최대 12.89%p의 성능 향상을 보였다.

Temporal Fusion Transformers와 심층 학습 방법을 사용한 다층 수평 시계열 데이터 분석 (Temporal Fusion Transformers and Deep Learning Methods for Multi-Horizon Time Series Forecasting)

  • 김인경;김대희;이재구
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권2호
    • /
    • pp.81-86
    • /
    • 2022
  • 시계열 데이터는 주식, IoT, 공장 자동화와 같은 다양한 실생활에서 수집되고 활용되고 있으며, 정확한 시계열 예측은 해당 분야에서 운영 효율성을 높일 수 있어서 전통적으로 중요한 연구 주제이다. 전반적인 시계열 데이터의 향상된 특징을 추출할 수 있는 대표적인 시계열 데이터 분석 방법인 다층 수평 예측은 최근 부가적 정보를 포함하는 시계열 데이터에 내재한 이질성(heterogeneity)까지 포괄적으로 분석에 활용하여 향상된 시계열 예측한다. 하지만 대부분의 심층 학습 기반 시계열 분석 모델들은 시계열 데이터의 이질성을 반영하지 못했다. 따라서 우리는 잘 알려진 temporal fusion transformers 방법을 사용하여 실생활과 밀접한 실제 데이터를 이질성을 고려한 다층 수평 예측에 적용하였다. 결과적으로 주식, 미세먼지, 전기 소비량과 같은 실생활 시계열 데이터에 적용한 방법이 기존 예측 모델보다 향상된 정확도를 가짐을 확인할 수 있었다.

신경망을 이용한 고신뢰성의 회귀분석 모델 (Regression Model With High Reliability by Using Neural Networks)

  • 조용현
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

신경망 앙상블을 이용한 인간 성별 인식 (Human Gender Recognition Using Neural Network Ensembles)

  • 류중원;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.555-558
    • /
    • 2001
  • 본 논문에서는 인간 행동의 성별 인식문제를 해결하기 위해 여러 개의 전문가(expert) 신경망의 앙상블로 이루어진 결합 신경망 분류기를 제안한다. 하나는 여러 개의 modular 다층퍼셉트론을 계층형으로 결합한 모텔이고, 다른 하나는 modular 다층퍼셉트론들의 출력값을 의사결정트리로 결합하는 모델이다. 데이터 베이스는 남녀 각 13 명의 데이터로 이루어져 있고, 문 두드리기, 손 흔들기, 물건 들어올리기의 세 가지 동작을, 보통 상태 혹은 화난 상태하에서 10 회씩 반복 수행하여 저장하였다. 행위자의 움직임은 몸에 부착된 6 개의 적외선 센서를 사용하여 기록 되었으며, 2 차원 혹은 3 차원 속도 및 좌표가 그 특징값으로 사용되었다. 앙상블 분류기의 성능을 비교하기 위하여 단일 다층퍼셉트론, 의사결정트리, 자기구성지도 및 support vector machine 을 사용한 실험 결과를 보였다. 실험 결과, 신경망 앙상블 모델이 다른 전통적인 분류기 및 사람에 비하여 훨씬 우수한 성능을 보였음을 알 수 있었다.

  • PDF

디지털 특수자료를 위한 XML 스키마 기반의 메타데이터 표현 체계 (A Metadata Representation Scheme based on XML Schema for Special Digital Collections)

  • 오삼균;채진석
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.109-131
    • /
    • 2004
  • 정보자원의 전달 매체와 형태가 다양화됨에 따라서 이에 대한 관리방법 또한 다양화되어 왔다. 도서관 환경에서는 정보자원를 위한 관리방법으로서 AACR, KCR 등의 목록규칙이 정립되었으며 이러한 목록규칙에 근거한 정보자원관리를 자동화하고자 하는 노력의 결과로서 MARC가 개발되었다. 하지만, MARC 레코드는 서지 레코드가 지니고 있는 의미적 관계의 표현을 지원하지 못하는 구조적 경직성으로 인해 다양하고 상이한 기술적 특성을 지니는 정보자원들을 적절히 기술하는데 제약이 따른다. 즉, MARC의 기본 설계 목적이 몇몇 정보유형에는 비교적 적합하더라도 새로운 형태의 정보유형의 다양성을 지원하는데 어려움이 있다. 또한 MARC를 활용한 정보자원 관리 방식에서는 정보자원 간 연결 관계의 표현을 지원하지 못한다. 즉, MARC의 데이터 모델은 자원기술의 대상을 단일의 객체로 파악하는 단층 데이터 모델이기 때문에 여러 객체들 간의 연결 관계를 설정할 수 있는 다층 데이터 모델을 이용한 정보자원 기술이 필요한 경우는 적절치 못하다. 본 연구에서는 다층 데이터 모델을 지원하는 IFLA FRBR 기본 모델을 기초로 하여 전자도서관에서 사용되는 고서, 고문서, 음악 자료, 학술회의 및 세미나 자료의 관리에 있어서 이용자의 정보요구를 최대한 수용할 수 있는 최적의 메타데이터 모델과 이에 대한 XML 스키마 기반의 표현 체계를 제시하고자 한다.

IoT센서로 수집된 균질 시간 데이터를 이용한 기계학습 기반의 품질관리 및 데이터 보정 (Machine Learning-based Quality Control and Error Correction Using Homogeneous Temporal Data Collected by IoT Sensors)

  • 김혜진;이현수;최병진;김용혁
    • 한국융합학회논문지
    • /
    • 제10권4호
    • /
    • pp.17-23
    • /
    • 2019
  • 본 논문은 온도 등 7 가지의 IoT 센서에서 수집된 기상데이터의 각 기상요소에 대하여 품질관리(Quality Control; QC)를 하였다. 또한, 우리는 측정된 값에 오류가 있는 데이터를 기계학습으로 의미있게 추정하는 방법을 제안한다. 수집된 기상데이터를 기본 QC 결과를 바탕으로 오류 데이터를 선형 보간하여 기계학습 QC를 진행하였으며, 기계학습 기법으로는 대표적인 서포트벡터회귀, 의사결정테이블, 다층퍼셉트론을 사용했다. 기본 QC의 적용 유무에 따라 비교해 보았을 때, 우리는 기본 QC를 거쳐 보간한 기계학습 모델들의 평균절대오차(MAE)가 21% 낮은 것을 확인할 수 있었다. 또한, 기계학습 기법에 따라 비교하여 서포트벡터회귀 모델을 적용하였을 때가, 모든 기상 요소에 대하여 MAE가 평균적으로 다층신경망은 24%, 의사결정테이블은 58% 낮은 것을 알 수 있었다.