• 제목/요약/키워드: 선택변수모형

검색결과 608건 처리시간 0.032초

데이터 마이닝을 이용한 교통사고 심각도 분류분석 (Data Mining for Road Traffic Accident Type Classification)

  • 손소영;신형원
    • 대한교통학회지
    • /
    • 제16권4호
    • /
    • pp.187-194
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도 변화에 영향력 있는 변수 선택을 위하여 독립성 검정을 위한 $x^2$ test와 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 Decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합한 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

데이터 마이닝을 이용한 교통사고 심각도 분류분석 (Data Mining for Road Traffic Accident Type Classification)

  • 손소영
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1998년도 Proceedings 제34회 추계 학술발표회
    • /
    • pp.373-381
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도변화에 영향력 있는 변수선택을 위하여 $X^2$ 독립성 검정과 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합합 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

유전자 알고리즘을 활용한 인공신경망 모형 최적입력변수의 선정: 부도예측 모형을 중심으로 (Using GA based Input Selection Method for Artificial Neural Network Modeling Application to Bankruptcy Prediction)

  • 홍승현;신경식
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.227-249
    • /
    • 2003
  • 부도예측모형의 구축은 은행 등 금융기관이 신용평가시스템 혹은 심사역 의사결정지원시스템을 구축하는데 중요한 기반이 된다. 많은 선행연구들에서는 기업의 부도예측을 위하여 전통적으로 다변량 판별분석이나 로짓분석과 같은 통계기법이 많이 사용되었으나, 최근에는 많은 연구들에 의해 그 우수성이 보고되고 있는 인공신경망, 귀납적 학습방법 등 인공지능 기법이 부도예측분야에 많이 응용되고 있다. 일반적으로 인공신경망 기법을 응용한 부도예측모형에서는 기업의 재무정보 및 비재무 정보를 입력변수로 주고 기업의 부도여부를 출력변수로 설정하여 학습을 통해 이들의 관계를 추출하고 있다. 그러므로 입력변수의 선정은 모형의 정확도에 커다란 영향을 미치며, 입력변수가 잘못 선정된 경우 예측 정확도는 현저히 낮아진다. 그러나 최적의 입력변수군을 선정하는 문제는 매우 어려운 과제 중 하나로, 선행 연구들에서는 주로 전문가의 의견을 반영하거나, 문헌을 통해 도출, 혹은 통계적 기법을 활용하여 입력변수를 선정하는 것이 일반적이었다. 본 연구에서는 많은 선행 연구에서 모형구축에의 한계점으로 명시하고 있는 입력변수 선정의 문제에 대해 유전자 알고리즘을 이용한 최적화를 통하여 입력 변수군을 도출하는 방법론을 제시하였고, 이 방법론이 다른 통계기법이나 전문가에 의한 변수 선택 방법론에 비해 우수함을 인공신경망 모형에 적용한 결과를 비교함으로 보여 주었으며, 이들간의 예측력의 차이가 유의함을 통계적 검증하였다. 모형의 실험을 위하여 총 528개사의 재무정보를 활용하였는데, 이는 1995년부터 1997년까지 3년간 부도가 발생한 일반법인 제조업체 중 외감법인 이상 264개사와 동수의 건전기업의 재무 데이터로 구성하였다. 기업이 도산에 이르기까지 많은 변인들이 다양하게 작용하게 된다. 그러나 이러한 변인들을 모두 모형에 적용하는 것은 비효율적이며, 인공신경망 모형에서 과다 입력변수를 사용하는 경우 수렴과 일반화 모두에 바람직하지 않은 결과가 나타난다. 따라서 적절한 입력변수군의 선택은 인공신경망 모형의 효율성과 성능을 향상시키게 되고, 이는 부도 예측율의 향상으로 이어질 수 있다. 이에 인공신경망 모형을 위한 최적의 입력변수군을 선정하고자 한 본 연구는 결국 기업의 부도 예측율을 높이기 위한 방법론을 제시했다는 점에 그 의의가 있다.

  • PDF

LH-OAT 민감도 분석과 SCE-UA 최적화 방법을 이용한 SWAT 모형의 자동보정 (Automatic Calibration of SWAT Model Using LH-OAT Sensitivity Analysis and SCE-UA Optimization Method)

  • 이도훈
    • 한국수자원학회논문집
    • /
    • 제39권8호
    • /
    • pp.677-690
    • /
    • 2006
  • 본 연구에서는 LH-OAT (Latin Hypercube Ore factor At a Time) 민감도분석 방법과 SCE-UA (Shuffled Complex Evolution at University of Arizona) 최적화 기법을 적용하여 보청천 유역에서 SWAT모형에 대한 자동보정 방법을 제시하였다. LH-OAT 방법은 전역 민감도분석과 부분 민감도 분석의 장점을 조합하여 가용매개변수 공간에 대하여 효율적으로 매개변수의 민감도 분석이 가능하게 하였다. LH-OAT민감도 분석으로부터 결정된 매개변수의 민감도 등급은 SWAT 모형의 자동보정 과정에서 요구되는 보정대상 매개변수의 선택에 유용하게 적용될 수 있다. SCE-UA 방법을 적용한 SWAT모형의 자동보정 해석결과는 보정자료, 보정매개변수, 통계적 오차의 선택에 따라서 모형의 성능이 좌우되었다. 보정기간과 보정매개변수가 증가함에 따라 검증기간에 대한 RMSE (Root Mean Square Error), NSEF (Nash-Sutcliffe Model Efficiency), RMAE (Relative Mean Absolute Error), NMSE (Normalized Mean Square Error) 등의 모형오차는 감소하였지만, NAE (Normalized Average Error) 및 SDR(Standard Deviation Ratio)은 개선되지 않았다. SWAT모형의 보정에 적용되는 보정자료, 보정매개변수 및 모형평가를 위한 통계적 오차 선택이 해석결과에 미치는 복잡한 영향을 이해하기 위하여 다양한 대표유역을 대상으로 추가적인 연구가 필요하다.

기업 인적자원 관련 변수를 이용한 기업 신용점수 모형 구축에 관한 연구 (A Study for Building Credit Scoring Model using Enterprise Human Resource Factors)

  • 이영섭;박주완
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.423-440
    • /
    • 2007
  • 본 논문의 목적은 기업 신용점수에 영향을 미치는 기업 인적자원 요소들을 찾아서 기업 신용점수 모형을 구축하는 것이다. 모형 구축을 위해 사용된 자료는 2005년 한국직업능력개발원의 인적자본 기업패널 (Human Capital Corporate Panel, HCCP) 설문조사 자료와 한국신용평가(주)의 KIS-신용평점모델에서 생성된 기업 신용점수이다. 모형 구축을 위한 독립변수는 McLagan (1989)의 '인적자원 바퀴모델'을 토대로 인적자본 기업패널 설문조사 문항을 선택하여 사용하였으며, 종속변수로는 기업 신용평가점수를 사용하였다. 또한 기업 인적자원 관련 변수를 이용한 기업 신용점수 모형 구축을 위해 로지스틱 회귀모형을 사용하였다. 모형 구축 결과 최종적으로 선택된 변수는 22개였다 영역별로 세분화해서 살펴보면 대분류 기준으로 HRD 영역은 6개, HRM 영역은 15개, 기타 1개이고, 중분류 기준으로 개인개발 2개, 경력개발 2개, 조직개발 2개, 조직직무설계 1개, 인적자원계획 4개, 정보체계 2개, 보상 및 장려 6개, 복지후생 1개, 노사관계 1개, 기업규모 1개가 선택되었다. 구축된 모형을 평가하기 위하여 10등급 교차타당성 분석을 통한 오분류율, G-mean은 각각 30.81, 68.27이었다. 그리고 반응율은 가장 좋은 십분위가 가장 나쁜 십분위보다 약 6.08배가 크고 점차 감소하는 경향을 보이고 있다. 그러므로 구축된 모형은 기업 인적자원 관련 변수를 이용해 기업 신용점수를 측정하는데 적당한 모형이라는 결론을 내릴 수 있다

유출에 대한 APEX 모형 매개변수 불확실성 평가 (Evaluation of APEX model parameter uncertainty for runoff)

  • 추인교;성연정;박정웅;정영훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.188-188
    • /
    • 2021
  • APEX(Agricultural Policy Enviromental eXtender) 모형은 일 단위로 구동되며 필지단위 및 소유역 단위에서의 흐름을 장기 모의를 할 수 있는 모형이다. APEX는 유출을 포함한 토양 침식, 탄소 이동 등 다양한 자연현상을 모의할 수 있는 모형이다. 강우에 의한 직접유출량을 APEX를 이용하여 산정할 수 있지만, 모델링 과정에서 발생하는 불확실성으로 인하여 부정적인 요인이 발생한다. 따라서 본 연구에서는 APEX 모형의 유출 매개변수를 이용한 불확실성을 평가하고자 한다. 이를 위해서 금강권역에서 표준유역으로 분류되어있는 한천 유역에 대해 2008~2019년도 유출량을 모의하였으며, 검증을 위해 동일기간에 대해 기저유출분리를 수행하였다. 불확실성 평가를 위해서 Python 기반으로 사전분포로부터 매개변수를 임의로 선택하도록 설정하여 총 10,000번의 구동을 수행하였다. 불확실성 평가지표로는 NSE, PBIAS, RSR을 이용하여 평가하여 평가지표별 불확실성 구간을 비교분석 하였다. 본 연구에서의 APEX 모형의 불확실성 평가를 통하여 APEX의 활용성을 더욱 확대하고 신뢰성을 높일 것으로 기대한다.

  • PDF

베이지안 선택 모형을 이용한 영화흥행 예측 (Predicting Financial Success of a Movie Using Bayesian Choice Model)

  • 이경재;장우진
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.1851-1856
    • /
    • 2006
  • 영화는 대표적인 경험재로 가치판단이 주관적이고 제품 수명주기가 매우 짧아 예측의 불확실성이 높기 때문에 이를 정량적인 방법으로 모형화하기는 쉽지 않다. 이러한 한계점에도 불구하고 한 영화의 상업적 성공을 예측하는 것은 영화 제작자나 배급사, 극장 등 모든 주체에게 수익과 직결되는 중요한 문제이기 때문에 지금까지 다양한 통계 모형이 제시되었다. 그러나 이들 모형의 대부분은 영화흥행에는 영향을 미치나 측정할 수 없는 효과를 반영하지 못한다거나, 추정 모수의 효과가 모든 영화에 대해서 같다는 동일성 가정으로 인해 영화간 이질성을 고려하지 못하고 있다. 따라서, 본 연구에서는 추정 모수의 사전분포를 모호사전분포로 정의함으로써 변수들의 불확실성을 반영할 수 있고, 영화간 이질성을 고려할 수 있는 베이지안 선택 모형을 제안하였다. 모수의 사후분포는 마코프체인 몬테카를로 기법인 깁스 샘플러를 이용하여 추정하였다. 또한, 감독, 배우, 장르 등의 영화 별 속성 변수뿐만 아니라, 입소문에 의한 영화관람 결정 등의 구전효과와 경쟁영화의 개봉으로 인한 효과를 반영할 수 있는 변수를 추가하여 모형의 정확성을 높였다. 2005년과 2006년 상반기에 상영된 영화를 바탕으로 모형을 구축하고 인공신경망 모형과 비교한 결과, 전체적인 예측 정확도에서는 인공신경망 모형과 비슷한 결과를 보이나 상업적으로 성공한 영화를 예측하는 데에는 베이지안 선택모형이 보다 더 우수한 것으로 나타났다. 또한, 개봉 주의 경쟁심화 정도 및 개봉 첫 주의 스크린 수 등이 영화 흥행에 가장 중요한 변수로 나타났으며, 영화 개봉 전 그 영화에 대한 기대치가 높을수록 흥행 성적 또한 좋음을 알 수 있었다. 배우의 힘 및 계절성, 영화 평점 등은 이질성을 고려하지 않은 전체수준에서는 통계적으로 유의하지 않은 것으로 나타났으나, 그룹 간 이질성을 반영한 모형에서는 어느 정도 흥행한 영화를 만들기 위해서는 고려되어야 할 요소로 나타났다.렇지 않을 경우 적절한 벤치마킹 대상을 도출할 때까지 추가적인 분석과정을 반복한다. 제안한 방법을 통하여 조직은 기술적 생산 가능성 외에도 다양한 조직 운영 관점에서 적절한 벤치마킹 대상을 선정할 수 있으며, 이에 따른 목표를 수립할 수 있을 것으로 기대한다. 또한 더 나아가 global efficiency 관점에서 효율적 조직이 되기 위하여 단계적인 벤치마킹 대상 선정과 이에 따른 목표를 수립하는데도 유용하리라 판단된다.$1.20{\pm}0.37L$, 72시간에 $1.33{\pm}0.33L$로 유의한 차이를 보였으므로(F=6.153, P=0.004), 술 후 폐환기능 회복에 효과가 있다. 4) 실험군과 대조군의 수술 후 노력성 폐활량은 수술 후 72시간에서 실험군이 $1.90{\pm}0.61L$, 대조군이 $1.51{\pm}0.38L$로 유의한 차이를 보였다(t=2.620, P=0.013). 5) 실험군과 대조군의 수술 후 일초 노력성 호기량은 수술 후 24시간에서 $1.33{\pm}0.56L,\;1.00{\ge}0.28L$로 유의한 차이를 보였고(t=2.530, P=0.017), 술 후 72시간에서 $1.72{\pm}0.65L,\;1.33{\pm}0.3L$로 유의한 차이를 보였다(t=2.540, P=0.016). 6) 대상자의 술 후 폐환기능에 영향을 미치는 요인은 성별로 나타났다. 이에 따른 폐환기능의 차이를 보면, 실험군의 술 후 노력성 폐활량이 48시간에 남자($1.78{\pm}0.61L$)가 여자($1.27{\pm}0.45L$)보다 더 높게 나타났으며 (t=2.170, P=0.042), 72시간에도 역시 남자($2.16{\pm}0.56L$)가 여자($1.50{\pm}0.47L$)보다 더

  • PDF

정형·비정형 우도에 의한 SWAT 매개변수의 불확실성 평가 (Assessment of the uncertainty in the SWAT parameters based on formal and informal likelihood measure)

  • 성연정;이상협;정영훈
    • 한국수자원학회논문집
    • /
    • 제52권11호
    • /
    • pp.931-940
    • /
    • 2019
  • 수문모형에서 매개변수는 수문요소를 반영하거나 단순화된 모형을 보완하기 위해 사용된다. 이러한 과정에서 매개변수로 인한 모형의 불확실성이 발생할 수 있다. 따라서, 본 연구에서는 General Likelihood Uncertainty Estimation (GLUE)을 이용하여 SWAT 매개변수의 불확실성을 평가하고자 하였다. GLUE의 우도함수는 정형/비정형 우도를 이용하여 불확실성 해석을 수행하였다. 정형우도는 lognormal 함수를 비정형우도는 Nash-Sutcliffe Efficiency (NSE)를 이용하였다. 우도와 임계치를 선택하는데 주관적인 요소가 포함되지만 정형우도는 상위 30%, 비정형우도는 0.5이상의 NSE 값을 가지는 우도를 선택하여 행위모델을 생성하였다. 연구결과 우도선택과 임계치 선택의 주관성에도 불구하고 정형/비정형 우도는 작은 차이가 있었으나 우도의 선택과 상관없이 일관된 점분포, 사후분포 및 SWAT결과의 불확실성 범위를 나타내었다. 또한, 공통적으로 SWAT매개변수 가운데 기저유출과 관련된 ALPHA_BF가 가장 민감한 것으로 나타났다. 본 연구를 통하여 유역별로 어떤 임계치를 만족하는 SWAT모형 매개변수의 범위를 분류한다면 사용자들이 SWAT모형에 대한 실무적인 혹은 학술적인 접근이 용이해질 것으로 기대된다.

미계측 유역의 기후변화 영향평가를 위한 수문모형 매개변수의 지역회귀분석 적용 (Applying regional regression analysis of the hydrologic model parameters for assessing climate change impacts in the ungaged watershed)

  • 김영일;서승범;김성진;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.219-219
    • /
    • 2017
  • 상대적으로 유역의 관측 자료가 충분하지 못하거나 검증되지 않았을 경우 미계측 유역으로 정의되며 수문모형의 매개변수 검정을 할 수 없으므로 다른 방법을 고안해야 한다. 이를 위해 기존 연구에서는 지역적 특성을 고려한 지역회기분석을 통해 미계측 유역의 유량을 산정하였는데, 대부분 유역의 특성과 연 평균 유출량 자료의 관계를 이용한 회귀식으로 실시간 유량의 변화를 고려하기 어려웠다. 본 연구에서는 개념적 강우-유출모형으로 많이 사용되고 있는 개념적 수문모형인 GR4J의 매개변수에 대해 미계측 유역의 특성을 고려한 변수들을 이용하여 회귀식을 구하고 그 적용성을 평가하였다. 이를 통해 미계측 유역의 유량 시계열 자료를 생성할 수 있었다. 또한 IPCC에서 발간한 AR5의 RCP 4.5 시나리오를 적용하여 미래 유출량을 산정하였다. 우선 지역회귀분석을 적용하기 위해 수문모형을 이용한 계측 유역의 유출량을 구하였으며 22개의 전국 댐 상류 지점을 기준으로 SCE 알고리즘을 이용하여 GR4J의 최적 매개변수를 구하고 각 유역별로 물리적, 지형적, 기상학적 특성을 고려하여 11개의 변수를 선택하였다. 각 변수간 다중공선성(Multicollinearity)를 고려하기 위해 VIF(Variation Inflation Factor) test를 적용하여 최종 7개의 변수를 선정하고 단계별 회귀방법(Stepwise regression)을 이용하여 GR4J의 매개변수별 회귀식을 생성하였다.

  • PDF

개인성향 요인이 탄소저감형 교통서비스 잠재선호에 미치는 영향에 관한 연구 (Effect of Attitudinal Factors on Stated Preference of Low-carbon Transportation Services)

  • 이윤희;이경재;추상호
    • 한국ITS학회 논문지
    • /
    • 제22권6호
    • /
    • pp.49-65
    • /
    • 2023
  • 최근 전세계적으로 환경에 대한 관심이 커지고, 국제사회가 '탄소중립'을 선언하면서 '탄소'를 고려한 다양한 수단선택모형 연구가 실시되고 있으나, 탄소에 대한 개인성향을 반영한 연구는 미비한 실정이다. 따라서, 본 연구에서는 탄소저감형 이동수단(전동킥보드 등)을 포함한 대중교통 서비스로 SPT(Sustainable Public Transit)라는 새로운 수단을 제시하고, 수도권 통근자를 대상으로 실시한 SP(Stated Preference)조사를 활용하여 요인분석을 통해 응답자의 탄소에 대한 개인성향을 분석한 후, 다항로짓모형을 활용하여 SPT에 대한 수단선택모형을 구축하였다. 분석 결과, SPT 잠재선호에 영향을 미치는 요인으로 성별, 소득, 개인성향('새로운경로 탐색에 대한 열정', '수단간 환승 선호', '탄소저감지식', '탄소저감실천') 변수가 유의한 것으로 나타났다. 따라서, 본 연구는 수단선택모형 구축시 수단의 속성변수로 탄소배출량을 선정하거나, 탄소저감과 관련한 개인성향 변수를 구축했다는 부분에서 의의가 있다.