• 제목/요약/키워드: 최적회귀모형

검색결과 226건 처리시간 0.027초

딥러닝 모형을 이용한 신호교차로 대기행렬길이 예측 (Predicting a Queue Length Using a Deep Learning Model at Signalized Intersections)

  • 나다혁;이상수;조근민;김호연
    • 한국ITS학회 논문지
    • /
    • 제20권6호
    • /
    • pp.26-36
    • /
    • 2021
  • 본 연구는 영상검지기에서 수집되는 정보를 활용하여 딥러닝 기반으로 대기행렬길이를 예측하는 모형을 개발하였다. 그리고 통계적 기법인 다중회귀 모형을 추정하여 평균절대오차와 평균제곱근오차의 두 지표를 이용하여 비교·평가하였다. 다중회귀분석 결과, 시간, 요일, 점유율, 버스 교통량이 유효한 변수로 도출되었고, 이 중에서 독립변수들의 종속변수에 대한 영향력은 점유율이 가장 큰 것으로 나타났다. 딥러닝 최적 모형은 은닉층이 4겹, Look Back이 6으로 결정되었고, 평균절대오차와 평균제곱근오차가 6.34와 8.99로 나타났다. 그리고 두 모형을 평가한 결과, 다중회귀 모형과 딥러닝 모형의 평균절대오차는 각각 13.65와 6.44, 평균제곱근오차는 각각 19.10과 9.11로 계산되었다. 이는 딥러닝 모형이 다중회귀 모형과 비교하여 평균절대오차가 52.8%, 평균제곱근오차는 52.3% 감소된 결과이다.

중소기업 청년인턴 이직횟수 결정요인 분석 (The study on the determinants of the number of job changes)

  • 박성익;류장수;김종한;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.387-397
    • /
    • 2015
  • 본 연구에서는 청년인턴 DB와 고용보험 DB를 사용하여 중소기업 청년인턴의 이직횟수에 영향을 미치는 요인을 분석하였다. 이직횟수는 음수가 아닌 정수 값만 가지는 계수 데이터 (count data)이므로 일반적인 선형회귀모형을 적용하는 것은 문제가 있다. 따라서 계수 데이터에 적합한 회귀모형으로 포아송 회귀모형, 영과잉 포아송 회귀모형, 음이항 회귀모형, 영과잉 음이항 회귀모형 등 4개의 회귀모형을 적용하였다. 분석결과 최적모형으로 영과잉 음이항 회귀모형이 선택되었다. 주요 분석결과를 정리하면 다음과 같다. 첫째, 통제집단 (비인턴집단)에 비해서 처리집단 (인턴집단)이 통계적으로 유의하게 이직경험이 낮게 나타났다. 둘째, 연령이 작을수록 통계적으로 유의하게 이직경험이 낮게 나타났다. 셋째, 여자에 비해서 남자가 유의하게 이직횟수가 높게 나타났다. 마지막으로 기업규모가 클수록 이직횟수가 유의하게 감소하는 것으로 나타났다.

생활용수 회귀수량의 분석을 위한 시계열 단기 예측모형 구축 (Construction of a Short-term Time-series Prediction Model for Analysis of Return Flow of Residential Water)

  • 이승연;이상은
    • 대한토목학회논문집
    • /
    • 제43권6호
    • /
    • pp.763-774
    • /
    • 2023
  • 도시 하류의 가용수량과 관련된 생활용수 회귀수량은 아직까지 정확한 회귀수량 파악이 어려운 상황이다. 본 연구에서는 생활용수 물순환시스템을 면(面)적 개념으로 물 유입, 물 전달, 물 유출 단계로 정의하였다. 대상지는 전라남도 함평군 일대로 선정했으며 물순환계통도 작성 및 완전·불완전 계측지점의 분류를 통해 단일 유입~단일 유출지점으로 설정하였다. 총 6년(2017년 1월 1일~2022년 12월 31일)간 일단위의 유입량·유출량 자료로 시계열예측모형(ARIMA 모형, 전이함수모형)을 구축하였고 학습기간과 검증기간으로 분리하여 유입량·유출량을 예측하였다. 그 결과, 두 모형 모두 안정적인 잔차와 통계적 유의성 확보로 단기 예측 실현 가능성을 보여 초기 단계의 물순환시스템을 구현하였다. 향후에는 불완전 계측지점, 미계측지점, 기상조건을 추가하고 최적의 모형을 선정하여 대상 유역의 실제 회귀량을 예측하고 효율적인 물 운영이 가능하길 기대해본다.

시뮬레이션과 회귀분석을 연계한 적응형 공정의사결정방법 (Adaptive Process Decision-Making with Simulation and Regression Models)

  • 이병훈;윤성욱;정석재
    • 한국시뮬레이션학회논문지
    • /
    • 제23권4호
    • /
    • pp.203-210
    • /
    • 2014
  • 본 연구는 생산공정운영시 발생하는 담당자의 의사결정 지원을 위한 학습형 공정 의사결정 시스템 구축방법에 대한 것이다. 먼저 추출 및 누적된 각 공정 별 이력 데이터에서, 주요한 주요자원(Critical Resource)을 단계적 회귀법에 따라 선정한다. 선정된 주요자원을 독립변수로 취급하여 담당자의 의사결정 대상이 되는 공정운영 성과를 종속변수로 하는 회귀모형을 산출하고, 해당 주요자원으로 구성된 시뮬레이션 모형을 설계한다. 메타휴리스틱 방법을 통하여 의사결정 시점의 생산계획 및 목적에 대한 시뮬레이션 분석을 실행하고, 복수 대안 및 가능해(기대성과)를 산출한다. 각각의 대안에서 주요자원 별 회귀모형을 구성하는 분석 값을 회귀식에 대입하고, 여기에서 얻어지는 값과 시뮬레이션 분석에 의해 산출된 가능해 간의 비교를 통하여 그 차이가 가장 작은 대안을 최적대안으로 선정하고 실제 공정운영 의사결정에 반영하여 생산을 실시한다. 이때 발생하는 공정 이력 데이터들은 이후 의사결정을 위한 회귀모형에 피드백 된다.

인공 신경망 모형을 이용한 한국프로야구 관중 수요 예측 (A Prediction of Demand for Korean Baseball League using Artificial Neural Network)

  • 박진욱;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.920-923
    • /
    • 2017
  • 본 연구는 기존의 수요 예측 등의 시계열 분석에서 주로 사용되는 ARIMA 모형의 어려움을 극복하고자 인공신경망(Artificial Neural Network) 모형을 이용하여 한국 프로 야구 관중 수를 예측하였다. 인공신경망의 가장 기본적인 종류인 전방향 신경망(Feedforward Neural Network)의 초모수(Hyperparameter) 선정에 그리드 탐색(Grid Search)을 적용하여 최적의 모형을 찾고자 하였다. 훈련 자료로는 2015년 3월부터 8월까지의 일별 KBO 관중 수 자료를 대상으로 하였고, 예측력 검증을 위해 2015년 9월 관중 수를 예측하여 실제 관측값과 비교하였다. 그 결과, 그리드 탐색법에서 최적 모형이라고 판단한 모형의 예측력은, 평균 절대 백분율 오차(MAPE) 기준으로 평균 27.14% 였다. 또한, 앙상블 기법에서 착안하여 오차율이 낮은 모형 5개의 예측값 평균의 MAPE는 평균 28.58% 였다. 이는 다중회귀와 비교해보았을 때, 평균적으로 각각 14%, 13.6% 높은 예측력을 보이고 있다.

합리적인 하천수 관리체계 구축을 위한 자료기반 방류량 예측모형 개발 (Development of a Data-Driven Model for Forecasting Outflow to Establish a Reasonable River Water Management System)

  • 유형주;이승오;최서혜;박문형
    • 한국방재안전학회논문집
    • /
    • 제13권4호
    • /
    • pp.75-92
    • /
    • 2020
  • 일반적으로 물수지 분석 시 공급에 해당되는 회귀수량의 경우 용수별 회귀율을 일률적으로 정하여 산정하는 방법을 채택하고 있어 정확한 가용유량을 산정하지 못하는 한계를 갖고 있다. 이에 본 연구에서는 회귀수 중 하·폐수에 초점을 두었고 인공신경망 등의 기계학습 모형을 적용하여 하수종말처리장의 방류량 예측 모형을 개발하였다. 시계열 자료예측 시 사용되는 주요 기계학습 모형인 LSTM (Long Short-Term Memory), GRU (Gated Recurrent Units), SVR (Support Vector Regression)모형을 적용하였으며 관측 값과 예측 값을 비교하는 오차지표를 통하여 방류량 예측의 최적의 모형을 선정하였다. 모형 적용 결과, GRU 모형의 평균제곱근 오차(Root Mean Square Error, RMSE)는 LSTM 모형과 SVR 모형보다 작으며 Nash-Sutcliffe 계수(NSE)는 LSTM 모형과 SVR 모형보다 큰 것을 확인하였고, 이를 근거로 하수종말처리장의 방류량 예측에 최적모형은 GRU 모형이라고 판단하였다. 다만, 극값에서는 예측 값이 과소 및 과대 산정되는 경향을 보여 추후 예측 정확도 향상을 위해서는 극한사상에 대한 추가자료 구축 및 입력 자료의 최소시간단위를 축소하는 것이 필요할 것으로 판단되었다. 또한, 예측하고자 하는 대상지의 용수이용량을 검토하고 계절적 영향을 반영할 수 있는 추가인자를 고려하게 되면 기후변동성에 대비하여 정확한 방류량 예측이 가능하며 예측 결과를 토대로 종합적인 하천수 사용관리 및 물이용 계획 수립을 위한 기초자료로 활용될 수 있을 것으로 기대된다.

층화에서 최적경계점 결정에 관한 연구

  • 박진우;김영원
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.179-184
    • /
    • 2002
  • 층화 추출법에서 층의 경계점을 정하는 문제는 추정의 효율에 직접적으로 영향을 미치기 때문에 매우 실제적이고 중요한 문제이다. 층화변수가 일변량 연속변수인 경우 널리 알려진 방법으로는 누적도수제곱근법과 Ekman법이 있는데 이 두 방법은 모두 나름의 약점을 지니고 있다. 본 논문에서는 Breiman 등(1984)이 제시한 CART 기법 중 회귀나무(regression tree)모형을 이용하여 층의 경계점을 정하는 방법을 소개한다. 그리고 통계청의 어업총조사 자료를 사용하여 층의 경계점을 정하는 여러 다른 방법들의 효율을 비교한다.

  • PDF

섬진강 유역의 도달시간 및 저류상수 산정공식 개발 (A Development of Formula on Time of Concentration and Storage Constant in Sumjin River Basin)

  • 이신재;박양래;김명수;박상우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.1193-1197
    • /
    • 2004
  • 본 연구는 강우에 내한 유역의 반응시간에 관한 연구로써 우리나라 자연하천유역에 적합한 도달시간 및 저류상수 산정공식을 개발하기 위하여 섬진강 유역을 대상으로 유역특성인자 및 강우 특성인자를 분석하고, 이를 다중회귀분석방범 중 최적의 회귀모형을 추출하기 위한 단계별 회귀분석방법을 이용하여 산정공식을 개발하였다. 그리고 개발된 산정공식으로부터의 도달시간 및 저류 상수들을 기존 경험공식의 값들과 비교하였으면, 또한 이를 Clark 모형에 적용하여 실제 호우사상들에 대한 유출수문곡선을 분석하여 관측수문곡선과 비교 검토하였다. 그 걸과 계산된 유출수문곡선과 관측수문곡선은 첨두유량 및 첨두발생시간에서 비교적 적은 오차를 보였으며, 유출수문곡선의 양상에서도 상호 높은 상관성을 보여 개발된 산정공식에 대한 적합성을 잘 나타내주고 있다.

  • PDF

다항회귀모형에 대한 최소편의 실험계획 (Minimum Bias Design for Polynomial Regression)

  • 장대흥;김영일
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1227-1234
    • /
    • 2015
  • 전통적으로 최적실험을 위한 실험기준들은 기본적으로 가정된 모형에 의존한다. 따라서 모형에 대한 완벽한 정보를 가지지 않는 경우 실험자는 곤란에 빠질 수 밖애 없다. Box와 Draper (1959) 이런 상황에 대비해 적분된 평균제곱오차의 편의부분에 해당하는 적분된 편의를 최소화하는 실험기준을 제안하고 필요충분조건을 명시하였다. 그러나 간단한 예제를 제외하고는 문헌에서는 이러한 필요충분조건을 만족하는 실험에 대한 구채적인 예제는 계산상의 문제로 예상외로 많이 연구가 되어 있지 않다. 비록 수치적인 해이긴 하지만 다항회귀모형을 중심으로 최소편의를 만족하는 실험의 성격을 파악하였는데 결론적으로 양극단에서 안쪽 방향으로 이탈되는 위치에서 받힘점이 형성되는 것을 알 수 있었다.

t-링크를 갖는 마코프 이항 회귀 모형을 이용한 인도네시아 어린이 종단 자료에 대한 베이지안 분석 (Bayesian inference of longitudinal Markov binary regression models with t-link function)

  • 심보현;정윤식
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.47-59
    • /
    • 2020
  • 본 논문에서는 마코프 이항 회귀 모형의 시차가 알려져 있거나 그렇지 않은 경우일 때, t-링크 함수를 갖는 종단적 마코프 이항 회귀 모형을 제시한다. 일반적으로, 이항 회귀 모형에서는 로직 모형이나 프로빗 모형이 주로 사용된다. t-링크 함수는 t 분포가 자유도가 커질수록 정규분포로 근사하기 때문에 프로빗 모형을 대신 더 많은 유연성을 위해 사용될 수 있다. 게다가 마코프 회귀모형은 종단 자료에 대해 사용될 수 있다. 우리는 마코프 회귀 모형의 시차를 결정하기 위해 베이지안 방법을 제시하고자 한다. 특히, 각 모델의 차수에 대해 알고 있는 경우에는 DIC를 기준으로 모델 비교를 실시하였다. 모델의 차수에 대해 모르는 경우에는 가능한 모델들의 사후 확률을 이용하였다. 복잡한 베이지안 계산을 해결하기 위하여 Albert와 Chib (1993), Kuo와 Mallick (1998)과 Erkanli 등 (2001)의 방법을 이용하여 모델을 재설정하였다. 제안하는 방법은 시뮬레이션 데이터와 Somer 등 (1984)에 의해 조사된 인도네시아 어린이 종단 데이터에 적용했다. 마코프 이항 회귀모형의 순서에 대해서 아는 경우와 모르는 경우를 각각 가정하여 최적의 모델을 알아보기 위해 MCMC 방법을 사용하였다. 또한, 매트로폴리스 해스팅 알고리즘의 수렴성을 점검하기 위해 Gelman과 Rubin의 진단을 이용했다.