• 제목/요약/키워드: 회귀 모형 함수

검색결과 294건 처리시간 0.022초

t-링크를 갖는 마코프 이항 회귀 모형을 이용한 인도네시아 어린이 종단 자료에 대한 베이지안 분석 (Bayesian inference of longitudinal Markov binary regression models with t-link function)

  • 심보현;정윤식
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.47-59
    • /
    • 2020
  • 본 논문에서는 마코프 이항 회귀 모형의 시차가 알려져 있거나 그렇지 않은 경우일 때, t-링크 함수를 갖는 종단적 마코프 이항 회귀 모형을 제시한다. 일반적으로, 이항 회귀 모형에서는 로직 모형이나 프로빗 모형이 주로 사용된다. t-링크 함수는 t 분포가 자유도가 커질수록 정규분포로 근사하기 때문에 프로빗 모형을 대신 더 많은 유연성을 위해 사용될 수 있다. 게다가 마코프 회귀모형은 종단 자료에 대해 사용될 수 있다. 우리는 마코프 회귀 모형의 시차를 결정하기 위해 베이지안 방법을 제시하고자 한다. 특히, 각 모델의 차수에 대해 알고 있는 경우에는 DIC를 기준으로 모델 비교를 실시하였다. 모델의 차수에 대해 모르는 경우에는 가능한 모델들의 사후 확률을 이용하였다. 복잡한 베이지안 계산을 해결하기 위하여 Albert와 Chib (1993), Kuo와 Mallick (1998)과 Erkanli 등 (2001)의 방법을 이용하여 모델을 재설정하였다. 제안하는 방법은 시뮬레이션 데이터와 Somer 등 (1984)에 의해 조사된 인도네시아 어린이 종단 데이터에 적용했다. 마코프 이항 회귀모형의 순서에 대해서 아는 경우와 모르는 경우를 각각 가정하여 최적의 모델을 알아보기 위해 MCMC 방법을 사용하였다. 또한, 매트로폴리스 해스팅 알고리즘의 수렴성을 점검하기 위해 Gelman과 Rubin의 진단을 이용했다.

비매개변수적 Kernel 가중함수의 수문학적 응용

  • 문영일
    • 물과 미래
    • /
    • 제33권5호
    • /
    • pp.49-55
    • /
    • 2000
  • 전통적인 매개변수적 목적함수 추정방법은 관측자료의 모든 영역에 걸쳐 선형 또는 지수함수 형태의 가정을 기본으로 매개변수를 추정하는 반면 비매개 변수적 Kernel 가중함수를 이용한 방법은 목적함수의 형태에 대한 가정이 필요 없이 관심 있는 임의의 추정지점에서 이웃하는 자료를 이용하여 목적함수를 국지적으로 근사하는 방법이다. 추계학적 수문학의 전형적인 문제인 "목적함수의 가정"에 의해 발생되는 문제를 줄이려는 노력의 일환으로 비매개변수적 Kernel 가중함수를 이용하는 방법에 연구되었고, 본 지면에서는 Kernel 가중함수를 이용한 비매개변수적 확률밀도함수의 기본이론과 빈도해석, 회귀모형 및 비동질성 천이확률 등의 수문학적 응용에 대하여 살펴보았다.

  • PDF

Random Effects Tobit 회귀모형을 이용한 교차로 교통사고 요인 분석 (An Analysis on Vehicle Accident Factors of Intersections using Random Effects Tobit Regression Model)

  • 이상혁;이정범
    • 한국ITS학회 논문지
    • /
    • 제16권1호
    • /
    • pp.26-37
    • /
    • 2017
  • 본 연구는 random effects Tobit 회귀모형을 이용하여 도심지 교차로에 대한 교통사고모형을 개발하여 교통사고와 요인간의 상관관계를 파악하는 것이 목적이다. Random effects Tobit 회귀모형의 적용성을 비교 분석하기 위하여 fixed effect Tobit 회귀모형을 산정하였다. 산정결과, 교통량, 제한속도, 차로수, 토지이용, 우회전차로, 전방신호등이 유효한 변수로 나타났으며, 총 교통사고율에 대한 random effects 모형의 모형 적합도(결정계수: 0.418, 로그-우도함수값: -3210.103, 우도비: 0.056)와 모형 설명력(MAD: 19.533, MAPE: 75.725, RMSE: 26.886)은 fixed effects 모형의 모형 적합도 (결정계수: 0.298, 로그-우도함수값: -3276.138, 우도비: 0.037)와 모형 설명력(MAD: 20.725, MAPE: 82.473, RMSE: 27.267)보다 우수한 것으로 나타났으며, 부상교통사고율에 대한 교통사고모형에서도 총 교통사고율의 산정결과와 동일하게 나타나 두 모형에서 random effects Tobit 회귀모형이 다소 우수한 것으로 분석되었다.

로짓모형에 있어서 다중공선성의 영향에 관한 연구 (Effects of Multicollinearity in Logit Model)

  • 류시균
    • 대한교통학회지
    • /
    • 제26권1호
    • /
    • pp.113-126
    • /
    • 2008
  • 비확률변수간 선형관계로 정의되는 다중공선성은 설명변수간 선형방정식으로 표현되는 회귀모형의 신뢰도를 저하시키기 때문에 회귀모형의 구축과정에서는 세심한 검토와 대응이 이루어진다. 본 연구에서는 구조화된 수치실험을 통해서 로짓모형에 대한 다중공선성의 영향을 규명하였다. 효용함수를 구성하는 설명변수들간 상관관계의 정도에 따라서 추정된 모형의 적합도 지표와 계수의 신뢰도 지표가 어떻게 변동하는 지를 추적함으로써 다음과 같은 시사점을 확인할 수 있었다. 첫째, 설명변수의 추가를 통해서 모델의 적합도 개선이 가능한 회귀모형과 달리, 로짓모형에서는 효용함수에 설명변수를 추가하는 경우 로짓모형의 적합도가 개선될 수도, 역으로 저하될 수도 있음이 확인되었다. 둘째, 공통의 계수를 갖도록 모델을 구성하면 제네릭 변수간 상관관계가 높아짐에 따라 모델의 적합도가 저하됨을 확인하였다. 셋째, 설명 변수간 상관관계가 높은 경우 선택행동에 대한 설명변수의 기여도가 과대평가될 가능성을 확인하였다. 넷째, 설명변수간 상관관계가 높으면 추정된 계수의 신뢰도가 저하됨을 확인하였다. 결론적으로 본 연구를 통해서 그동안 로짓모형의 구축과정에서는 주목받지 못했던 다중공선성이 실제로는 세심한 배려와 적절한 대응을 통해서 제어되어야 함이 규명되었다.

유전알고리즘을 이용한 능형회귀모형의 검정 : 빈도별 홍수량의 지역분석을 대상으로 (Calibration of the Ridge Regression Model with the Genetic Algorithm:Study on the Regional Flood Frequency Analysis)

  • 성기원
    • 한국수자원학회논문집
    • /
    • 제31권1호
    • /
    • pp.59-69
    • /
    • 1998
  • 빈도별 홍수량의 지역분석을 위하여 유역의 지형특성을 독립변수로 이용하는 회귀모형을 검정하였다. 그런데 이들 독립변수들간의 상관관계가 존재할 경우 능형회귀모형이 이용되기도 하는 이 방법은 다중공선성 문제를 극복하는데 적합한 방법으로 알려져 있다. 능형회귀모형을 최적화하기 위해서는 조정변수가 포함되는 비용함수를 최소화하여야 한다. 본 연구에서는 이 최적화를 위하여 유전알고리즘을 이용하였다. 유전알고리즘은 자연 생물의 유전 및 진화과정을 모방한 추계학적 탐색방법을 말한다. 이러한 유전알고리즘을 이용하여 지역분석 모형을 검정한 결과 안정된 매개변수의 가중치를 얻을 수 있었다.

  • PDF

가능도함수를 이용한 불연속점 수의 추정 (Estimation of the number of discontinuity points based on likelihood)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.51-59
    • /
    • 2010
  • 일반화선형모형에서 회귀함수가 하나의 불연속점을 가질 때, Huh (2009)는 하나의 모수를 가지는 지수족의 가능도함수를 한쪽방향커널을 이용하여 그 불연속점의 위치와 점프크기를 추정하였다. 이 논문에서는 미지의 불연속점 수 q개를 가지는 회귀함수인 경우에, Huh (2009)가 제안한 점프크기 추정량의 점근분포를 이용한 가설검정법을 소개하고, 그 가설검정법을 이용한 불연속점 수를 추정하는 알고리듬을 제안하고, 모의실험을 통하여 추정의 정도를 알아보고자 한다.

함수회귀분석을 통한 교통량 예측 (Functional regression approach to traffic analysis)

  • 이인주;이영경
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.773-794
    • /
    • 2021
  • 교통량 예측은 지방 행정의 의사결정에 매우 중요한 정보를 제공한다. 교통량 예측을 통해 교통혼잡비용을 줄이고 지역경제를 활성화 함으로써 사회적, 경제적 이익을 창출할 수 있다. 교통량은 미지의 확률적 규칙하에서 시간의 흐름에 따라 궤적을 가지며 변화하는 함수데이터의 일종이다. 본 논문에서는 세 가지 함수회귀모형을 이용하여 과거에 관측된 교통량 궤적을 기반으로 미래의 관측되지 않은 교통량 궤적을 예측하는 방법을 제시한다. 본 논문에서 소개하는 세가지 방법은 전국 고속도로 영업소 중 서울, 춘천, 강릉 세 개 영업소에서 수집된 고속도로 영업소 데이터에 적용한다. 각 영업소 별로 세가지 방법의 예측오차를 비교함으로써 영업소별 최적 교통량 예측모형을 찾는다.

연관성 규칙 수의 추정을 위한 일반적인 비선형 회귀모형에서의 표준화 향상도 활용 방안 (Generally non-linear regression model containing standardized lift for association number estimation)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.629-638
    • /
    • 2016
  • 최근에 많이 활용되고 있는 데이터 분석을 위한 연관성 규칙 마이닝은 대용량 데이터베이스에 많이 활용되고 있는 서 두 항목간의 관계를 측도화 함으로써 두 개 이상의 항목간의 관련성을 표시하여 주는 기법이다. 연관성 규칙의 여부를 판단하기 위한 연관성 평가 기준에는 지지도, 신뢰도, 그리고 향상도 등이 있으며, 이들 세 가지 기준을 이용하여 연관성 규칙 생성 여부를 판단하게 된다. 이에 대한 기존의 연구 결과는 결정함수를 이용하는 방법과 회귀모형을 이용하는 방법으로 분류할 수 있다. 회귀모형을 이용하여 수행한 연구에는 지지도와 신뢰도에 의한 모형, 세 가지 평가 기준의 쌍에 의한 모형, 표준화 향상도를 포함한 세 가지 평가 기준의 쌍에 의한 모형, 그리고 세 가지 평가 기준 전부를 고려한 모형 등이 있다. 본 논문에서는 기존의 연구를 확장하는 의미에서 표준화 향상도를 포함한 세가지 평가 기준 전부를 고려한 비선형 회귀모형을 이용하여 연관성 규칙의 수를 추정하는 방안에 대해 강구하고자 한다. 또한 분산분석에서의 F 통계량과 수정 결정계수를 이용하여 각 모형의 유의한 정도를 비교하는 동시에 분산팽창계수에 의한 공선성 문제를 진단함으로써 가장 유용한 회귀 모형을 탐색하고자 한다.

기온 강수량 자료의 함수적 데이터 분석 (Functional Data Analysis of Temperature and Precipitation Data)

  • 강기훈;안홍세
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.431-445
    • /
    • 2006
  • 본 연구는 함수적 데이터 분석의 몇 가지 이론에 대해 소개하고 분석 기법을 실제 자료에 적용하는 내용을 다루었다. 함수적 데이터 분석의 이론적 내용으로 기저를 이용해 자료를 함수적 데이터로 표현하는 방법, 그리고 함수적 데이터의 변동성을 조사하는 주성분분석, 선형모형 등에 대해 살펴보았다. 그리고 우리나라 기온 데이터와 강수량 데이터를 대상으로 각각 함수적 데이터 분석 기법을 적용해 보았다. 또한, 기온과 강수량 데이터에 대해 함수적 회귀모형을 적합시켜 두 변수간의 함수관계를 살펴보았다.

경쟁 위험 회귀 모형의 이해와 추정 방법 (Estimation methods and interpretation of competing risk regression models)

  • 김미정
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1231-1246
    • /
    • 2016
  • 경쟁위험에 대한 연구 중 주로 쓰이는 방법은 Cause-specific 위험 모형과 subdistribution을 이용한 비례 위험 모형 방법이다. 그 이후에도 많은 모형이 제시되었지만, 추정 방법 면에서 설명력이 부족하거나 알고리즘으로 구현하기 어려운 단점을 가지고 있어서 잘 활용되고 있지 않다. 이 논문에서는 Cause-specific 위험 모형, subdistribution을 이용한 비례 위험 모형과 비교적 최근에 제시된 이항 회귀 모형(direct binomial model), 절대 위험 회귀 모형(absolute risk regression model), Eriksson 등 (2015)의 비례 오즈 모형(proportional odds model)을 소개하고 추정 방법을 간단히 설명하고자 한다. 각 모형에 대하여 SAS와 R을 이용한 활용 방법을 제시하고, 두 가지 경쟁위험이 존재하는 데이터를 R을 이용하여 분석하였다.