• 제목/요약/키워드: 회귀분석모델

검색결과 1,516건 처리시간 0.029초

은닉 마르코프 모델 기반의 교통량 예측 기법 연구 (A Study of Traffic Prediction Method Based on Hidden Markov Model)

  • 김민재;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.347-348
    • /
    • 2014
  • 최근 급증하는 교통 혼잡으로 인해 시간적/물질적 손실이 크게 발생하고 있다. 이러한 교통난 해소는 시설투자만으로는 근본적인 해결책이 될 수 없다는 판단 하에 지난 수년간 보다 정확한 교통량을 예측하기 위해 시계열 기반의 다양한 교통량 예측 모델들이 개발 되어 왔다. 그러나 시계열 기반의 모델들은 회귀분석을 통해 과거 교통량을 분석하고 과거의 교통패턴이 미래에도 지속적으로 연장된다는 가정 하에 연구되었기 때문에 실시간으로 급변하는 불규칙한 교통 패턴에 대한 예측의 신뢰성을 떨어트린다. 또한 시계열 기반의 예측 기법은 어떠한 회귀분석 모델을 사용하는지에 따라 성능의 차이가 많이 나타나기 때문에 회귀분석 모델 선택이 중요하다. 이러한 제약을 극복하기 위해 본 논문에서는 은닉 마르코프 모델(Hidden Markov model)을 이용해 동적인 교통 패턴에 따라 현재 상황에 맞는 회귀분석 모델을 선택하는 신뢰도 높은 교통량 예측 시스템을 제안한다.

  • PDF

비자동회귀 다중 디코더 기반 한국어 형태소 분석 (Non-autoregressive Multi Decoders for Korean Morphological Analysis)

  • 조성민;송현제
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.418-423
    • /
    • 2022
  • 한국어 형태소 분석은 자연어 처리의 기초가 되는 태스크이므로 빠르게 결과를 출력해야 한다. 기존연구는 자동회귀 모델을 한국어 형태소 분석에 적용하여 좋은 성능을 기록하였다. 하지만 자동회귀 모델은 느리다는 단점이 있고, 이 문제를 극복하기 위해 비자동회귀 모델을 사용할 수 있다. 비자동회귀 모델을 한국어 형태소 분석에 적용하면 조화롭지 않은 시퀀스 문제와 토큰 반복 문제가 발생한다. 본 논문에서는 두 문제를 해결하기 위하여 다중 디코더 기반의 한국어 형태소 분석을 제안한다. 조화롭지 않은 시퀀스는 다중 디코더를 적용함으로써, 토큰 반복 문제는 두 개의 디코더에 서로 어텐션을 적용하여 문제를 완화할 수 있다. 본 논문에서 제안한 모델은 세종 형태소 분석 말뭉치를 대상으로 좋은 성능을 확보하면서 빠르게 결과를 생성할 수 있음을 실험적으로 보였다.

  • PDF

회귀분석에서 설명변수와 반응변수 간의 시차를 파악하는 딥러닝 모델 (A Deep Learning Model for Identifying The Time Lag Between Explanatory Variables and Response Variable in Regression Analysis)

  • 김채현;류의림;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2021
  • 기후, 경영, 경제 등 여러 분야의 회귀분석에서 설명변수가 반응변수에 일정 시차를 두고 영향을 미치는 경우들이 많다. 하지만 지금까지 대부분의 회귀분석은 설명변수가 반응변수에 즉각적으로 영향을 미치는 경우만을 가정하고 있으며, 설명변수와 반응변수 간에 존재하는 시차를 탐색하는 연구는 거의 이루어지지 않았다. 그러나 보다 정확한 회귀분석을 위해서는 설명변수와 반응변수 간에 존재하는 시차를 파악하는 것이 중요하다. 본 논문은 회귀분석 데이터가 주어졌을 때 설명변수와 반응변수 간에 존재하는 시차를 파악하는 딥러닝 모델을 제안한다. 제안하는 딥러닝 모델은 설명변수의 과거 값들 중 어떤 값이 현재 반응변수에 가장 큰 영향을 미치는지를 노드 간 가중치로 표현하고, 회귀모델의 오차를 최소화하는 가중치를 탐색한다. 훈련이 끝나면 이 가중치들을 사용하여 각 설명변수와 반응변수 간에 존재하는 시차를 파악한다. 실험을 통해 제안 방법은 시차를 고려하지 않는 기존 회귀모델에 비해 시차까지 고려함으로써 오차가 1/100 수준에 불과한 더 정확한 회귀모델을 찾을 수 있음을 확인하였다.

실내 온열환경 쾌적 제어를 위한 단순 PMV 회귀모델의 적용에 관한 시뮬레이션 연구 (A Study on the Application of Simulation-based Simplified PMV Regression Model for Indoor Thermal Comfort Control)

  • 김상훈;윤성준;정광섭
    • 에너지공학
    • /
    • 제24권1호
    • /
    • pp.69-77
    • /
    • 2015
  • 본 연구에서는 보정된 모델링 건물을 대상으로 PMV 변수에 대한 데이터베이스를 구축하였고, 다중회귀분석을 통하여 PMV 회귀모델을 도출하였다. PMV 회귀모델은 민감도 및 데이터 분석을 통하여 단순화하여 단순 PMV 회귀모델을 제시하였다. 단순 PMV 회귀모델과 Fanger PMV 모델에 대한 MAE 및 RMSE 검증을 통하여 단순 PMV 회귀모델이 Fanger PMV 모델을 대체할 수 있는 것으로 분석되었다. EnergyPlus의 EMS(Energy Management System)를 이용하여 보정된 모델링 건물에 PMV 회귀모델 제어를 적용하였다. 단순 PMV 회귀모델과 Fanger PMV 모델 제어의 온열 쾌적도를 비교한 결과, 두 제어 모두 공조기간 동안 약 90% 이상이 온열쾌적 범위를 만족하였고, 온열 쾌적 제어의 특징인 설정 PMV를 만족하는 설정온도에 의하여 제어되는 것으로 나타났다.

신경망을 이용한 고신뢰성의 회귀분석 모델 (Regression Model With High Reliability by Using Neural Networks)

  • 조용현
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

회귀 분석 모델을 이용한 고리 1호기 해체 비용 추정 (Decommissioning Cost Estimation of Kori Unit 1 Using a Multi-Regression Analysis Model)

  • 주한영;김재욱;정소윤;문주현
    • 방사성폐기물학회지
    • /
    • 제18권2_spc호
    • /
    • pp.247-260
    • /
    • 2020
  • 본 논문에서는 고리 1호기 해체 비용 추정을 위해 외국 원자력발전소 해체 비용 데이터를 현가화한 후 원자력발전소 해체 비용 추정 회귀 분석모델을 개발하였다. 이 모델 개발에 사용된 데이터는 해체 또는 진행 중인 BWR 13기, PWR 16기의 해체 비용 데이터이다. 회귀 분석모델 도출을 위해, 해체 비용을 종속변수로 정하고, 해체 원전의 운전 특성을 반영할 수 있게 고안된 Contamination factor와 해체 기간을 독립변수로 선정하였다. 빅데이터 분석 도구인 R language의 통계패키지를 이용하여 회귀 분석모델을 도출하였다. 이 회귀 분석 모델을 적용하여 고리 1호기 해체 비용을 예측한 결과, 미화 663.40~928.32백만 달러, 한화 약 7,828.12억~1조 954.18억 원이 소요될 것으로 예측되었다.

시계열 데이터 예측을 위한 점진적인 회귀분석 모델 (An Incremental Regression Model for Time Series Data Prediction)

  • 김성현;이용미;김룡;서성보;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.23-26
    • /
    • 2006
  • 기존의 데이터 마이닝 예측 기법 중 회귀분석은 학습 단계에서 생성된 모델을 변경 없이 새로운 데이터에 적용하였다. 그러나 시계열 데이터에 모델 변경 없이 동일하게 적용하면 시간이 지남에 따라 정확도가 낮아지는 단점이 있다. 따라서 이 논문에서는 시간에 따라 변화하는 시계열데이터의 특성을 고려하여 점진적으로 회귀 모델을 갱신하는 기법을 제안한다. 이 기법은 입력되는 모든 데이터를 회귀 모델에 적용하여 점진적으로 모델을 갱신한다. 제안된 기법의 타당성은 RME(Relative Mean Error)와 RMSE(Root Mean Square Error)를 이용하여 측정하였다. 정확도 측정 실험 결과 제안 기법인 IMQR(Incremental Multiple Quadratic Regression) 기법이 MLR(Multiple Linear Regression), MQR(Multiple Quadratic Regression), SVR(Support Vector Regression) 기법에 비해 RME 가 평균 2%, RMSE 가 평균 0.02 정도 우수한 결과를 얻었다.

  • PDF

근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교 (Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data)

  • 백승현
    • 대한안전경영과학회지
    • /
    • 제15권4호
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

다항식 회귀분석을 이용한 전자저울의 비선형 특성 개선 연구 (A Study of the Nonlinear Characteristics Improvement for a Electronic Scale using Multiple Regression Analysis)

  • 채규수
    • 융합정보논문지
    • /
    • 제9권6호
    • /
    • pp.1-6
    • /
    • 2019
  • 본 연구에서는 다항식 회귀분석(Polynomial regression analysis) 방법을 이용하여 비선형 특성을 갖는 전자저울의 질량 추정 모델 개발이 이루어 졌다. 전자저울에 사용되는 로드셀의 출력 단자 전압을 기준 질량 추를 사용하여 직접 측정하였고 이 데이터를 이용하여 MS Office 엑셀의 행렬식 계산과 데이터 추세선 분석 기능을 이용하여 다항식 회귀모델을 구하였다. 5kg까지 측정 가능한 로드셀 전자저울을 사용하여 100g단위로 질량을 측정하였고 다항식 회귀분석(Multiple regression analysis) 모델을 구하였으며, 단순(1차), 2차, 3차 다항식 회귀분석에 대한 오차를 구하였다. 각 모델에 대한 회귀 방정식의 적합도 분석을 위해 결정계수(Coefficient of determination)를 제시하여 추정 질량과 측정 데이터와의 상관관계를 나타내었다. 본 연구에서 제안하는 3차 다항식 모델을 이용하여 추정 값의 표준편차가 10g, 결정계수 1.0으로 상당히 정확한 모델을 얻었다. 본 연구에 사용된 선형 회귀 분석 이론을 바탕으로 최근 인공지능 분야에서 많이 사용되고 있는 로지스틱 회귀 분석(Logistic regression analysis)을 활용하여 기상예측, 신약개발, 경제지표 분석 등의 분야에 대한 다양한 연구를 수행할 수 있을 것으로 생각된다.

OMI 위성자료를 활용한 서울 지표 이산화질소 혼합비 추정 연구 (Estimation of surface nitrogen dioxide mixing ratio in Seoul using the OMI satellite data)

  • 김대원;홍현기;최원이;박준성;양지원;류재용;이한림
    • 대한원격탐사학회지
    • /
    • 제33권2호
    • /
    • pp.135-147
    • /
    • 2017
  • 본 연구에서는 처음으로 한반도 서울지역에서 OMI (Ozone Monitoring Instrument) 센서로 관측된 대류권 이산화질소 칼럼농도를 이용하여 OMI 센서의 관측시간인 13:45에서의 월 평균 및 일별 위성 지표 이산화질소 혼합비를 추정하였다. 본 연구에서는 세 가지 회귀모델들이 이용되었다. 첫 번째 회귀모델(M1)은 OMI 대류권 이산화질소 칼럼농도와 지점 측정값과의 선형회귀를 통한 회귀계수로 구성되어있다. 두번째 회귀모델(M2)은 OMI 대류권 이산화질소 칼럼농도와 AIRS (Atmospheric Infrared Sounder) 센서로 관측한 행성경계층 높이, 온도, 압력 자료 모두가 반영된 회귀모델이다. 세 번째 회귀모델(M3M, M3D)은 다중회귀모델로서 앞서 고려된 이산화질소 칼럼농도와 행성경계층 높이와 다양한 기상변수를 추가적으로 반영하는 회귀모델이다. 본 연구에서는 2009년에서 2011년까지를 회귀모델의 훈련기간으로 하여서 각 회귀식의 회귀계수를 도출하였으며 2012년도는 검증기간으로서 훈련기간에 도출된 회귀모델들의 성능을 평가하였다. 회귀모델들로 추정된 월 평균 지표 이산화질소 혼합비와 지점 관측소에서 지점 측정장비로 측정된 월평균 지표 이산화질소 혼합비와 가장 높은 상관성(avg. R = 0.77)을 보이는 회귀분석방법은 다중회귀분석방법(M3M)이다. 또한, 회귀모델들로 추정된 13:45에서의 일 지표 이산화질소 혼합비와 지점 관측소에서 지점장비로 측정된 지표 이산화질소 혼합비와 가장 좋은 상관성(avg. R = 0.55)을 보인 것도 다중회귀분석방법(M3D)이다. 회귀모델들로 추정된 지표 이산화질소 혼합비는 지점 측정값에 비해 과소추정 되는 경향이 나타났다. 회귀모델들로 추정된 지표 이산화질소 혼합비를 평가하기 위해 지점 측정값과의 RMSE (Root Mean Square Error), mean bias, MAE (Mean Absolute Error), percent difference와 같은 통계분석을 실시하였다. 본 연구는 위성을 통한 지표 이산화질소 혼합비 산출 가능성을 보여준다.