• 제목/요약/키워드: 모형선택

검색결과 2,184건 처리시간 0.026초

부분선형모형에서 LARS를 이용한 변수선택 (Variable selection in partial linear regression using the least angle regression)

  • 서한손;윤민;이학배
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.937-944
    • /
    • 2021
  • 본 연구는 부분선형모형에서 변수선택의 문제를 다룬다. 부분선형모형은 평활화모수 추정과 같은 비모수 추정과 선형설명변수에 대한 추정의 문제를 함께 포함하고 있어 변수선택이 쉽지 않다. 본 연구에서는 빠른 전진선택법인 LARS 를 이용한 변수선택법을 제시한다. 제안된 방법은 LARS에 의하여 선별된 변수들에 대하여 t-검정, 가능한 모든 회귀모형 비교 또는 단계별 선택법을 적용한다. 제안된 방법들의 효율성을 비교하기 위하여 실제데이터에 적용한 예제와 모의실험 결과가 제시된다.

베이지안 비선형회귀모형의 선택과 진단 (Bayesian Mode1 Selection and Diagnostics for Nonlinear Regression Model)

  • 나종화;김정숙
    • 응용통계연구
    • /
    • 제15권1호
    • /
    • pp.139-151
    • /
    • 2002
  • 본 논문에서는 베이지안 기법을 이용한 비선형회귀모형의 선택법을 제안하였다. 베이즈요인에 기초한 이 방법은 주로 대표본의 경우에 이용되는 고전적 모형선택법에 비해 사전정보를 이용하는 측면과 비내포모형 및 소표본의 경우에 대해서도 효과적으로 사용될 수 있다는 장점을 가진다. 본 논문에서는 정보적 사전분포를 고려하였으며, 베이즈요인의 추정 방법으로 Laplace - Metropolis 추정 법을 제안하였다. 또한 MCMC 과정을 통해 추정된 모수의 수렴진단에 대해서도 고려하였다. 실제자료에 대한 최적의 모형선택 및 진단과정을 구체적으로 제시하였다.

무응답을 가지고 있는 범주형 자료에 대한 모형 선택 방법 (Model selection method for categorical data with non-response)

  • 윤용화;최보승
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.627-641
    • /
    • 2012
  • 본 연구는 다차원 분할표 형태로 정리된 범주형 자료가 결측치나 무응답을 가지고 있을 때 주어진 자료를 가장 잘 설명하고 예측의 정확도를 높일 수 있는 모형의 추정과 모형의 선택 문제를 다루었다. 무시할 수 없는 무응답 (non-ignorable non-response)체계하에서 최대우도 추정에서 발생할 수 있는 변방값 문제를 해결하기 위하여 계층적 베이지안 모형을 고려하였다. 또한 모형 적도를 높이기 위한 변수 조합을 찾는 모형 선택의 문제를 함께 다루었다. 베이지안 접근하에서 모형 선택의 문제를 다루기 위하여 베이즈 인자 (Bayes factor)를 모형 선택의 기준으로 이용하였다. 제시된 방법은 2004년 실시된 우리나라 국회의원 선거를 앞두고 수행된 여론조사 데이터를 이용하여 실증분석을 수행하였다. 분석결과 무시할 수 없는 무응답 체계하에서 설명변수로 투표참여여부를 이용하는 것이 가장 적합한 모형으로 판명되었다.

기업의 부채조달원 선택에 관한 연구: 패널표본선택모형의 적용 (Corporate Debt Choice: Application of Panel Sample Selection Model)

  • 이호선
    • 한국콘텐츠학회논문지
    • /
    • 제15권7호
    • /
    • pp.428-435
    • /
    • 2015
  • 우리 기업의 타인자본조달에 관한 통계지표를 살펴보면 대기업은 은행의 기업대출과 회사채 등의 직접금융을 함께 사용하여 자본을 조달하고 있는 반면, 중소기업은 은행대출에 계속 의지하고 있음을 확인할 수 있다. 이러한 현실을 감안하여 본 연구에서는 기업의 타인자본조달을 실증분석하는데 있어 표본선택편의가 존재하고 이를 감안한 연구모형을 사용해야 한다고 주장한다. 이러한 주장을 뒷받침하기 위해 1990년부터 2013년까지의 상장기업 자료를 통해 부채구조를 설명하는 실증분석을 수행한 결과 선행연구에서와 마찬가지로 기업의 회사채사용에 있어 기업규모, 1대주주 지분율, 유형자산 구성비, 수익성, 배당성향 등이 영향을 미치고 있음을 확인할 수 있었으며, 패널표본선택모형에 투입된 Inverse Mills Ratio 변수가 유의하게 나타나 패널표본선택모형을 사용하는 것이 타당함을 확인하였다. 이러한 결과는 기업의 타인자본조달에 있어 표본선택편의가 존재하며 이에 관한 연구에서 이를 반드시 감안해야 함을 의미한다.

준모수적 계층적 선택모형에 대한 베이지안 방법 (A Bayesian Method to Semiparametric Hierarchical Selection Models)

  • 정윤식;장정훈
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.161-175
    • /
    • 2001
  • 메타분석(Meta-analysis)은 서로 독립적으로 연구되어진 결과들을 전체적인 하나의 결과로 도출하기 위해 사용되어지는 통계적 방법이다. 이러한 통계적 방법을 설명할 모형으로는 선택모형(selection model)을 포함한 계층적 모형(hierarchical model)을 사용하며, 이러한 모형들은 베이지안 메타분석에 유용한 것으로 알려져 있다. 그러나, 메타분석의 자료들은 일반적으로 출판편의(publication bias)를 갖고 있으므로 이를 극복하고자 가중함수(weight function)를 이용하여 분포함수를 새롭게 정의하여 사용한다. 최근에 Silliman(1997)은 계층적 모형(hierarchical model)에 가중함수를 첨부한 계층적 선택모형(hierarchical selection model)을 정의하고 모수적 베이지안 방법을 제시하였다. 본 연구에서는 미관측된 연구효과에 디리슈레 과정 사전분포(Dirichlet process prior)를 적용한 준모수적 계층적 선택모형(semiparametric hierarchical selection models)을 소개한다. 여기서 제시된 준모수적 계층적 선택모형을 베이지안 방법으로 추정하기 위하여 마코프 연쇄 몬테칼로(Markov chain Monte Carlo)방법을 이용한다. 제시된 방법을 적용하기 위하여 실제 자료(Johnson, 1993)인 충치를 예방하기 위한 두 가지의 예방약의 효과에 대한 차이를 비교하기 위해 얻어진 12개의 연구를 이용하여 메타분석을 한다.

  • PDF

교통법규준수선택모형을 이용한 통행시간가치의 추정에 관한 연구 (The Estimation of VTTS using Traffic Regulation Obedience Choice Model)

  • 송영남
    • 대한교통학회지
    • /
    • 제19권4호
    • /
    • pp.49-57
    • /
    • 2001
  • 절약된 통행시간의 가치는 교통시설투자의 가장 중요한 편익이기 때문에, 우리나라를 비롯한 여러 나라에서 시간가치의 추정을 위한 많은 연구가 이루어졌으며, 통행수단선택모형을 이용한 연구가 주를 이루었다. 본 연구에서는 기존의 연구에서 전혀 시도되지 않았던 새로운 모형, 법규준수선택모형, 을 적용하여 통행시간가치를 추정하고자 시도하였다. 본 연구의 목적을 위하여 조건부가치측정법을 응용한 설문조사를 행하였고, 설문조사 결과와 법규준수선택모형을 이용하여, 통근자들의 통행시간가치를 추정하였으며, 결과는 선행된 연구결과와 일관성이 있음을 알 수 있다.

  • PDF

교통수요관리정책의 효과분석을 위한 다항로짓모형의 적용 - 서울시 사례 - (Parameter Estimation and Validation of a Multinomial Logit Model for the Prediction of Mode Shift as a Result of TDM Schemes in Seoul)

  • 황기연;김익기;이우철
    • 대한교통학회지
    • /
    • 제16권4호
    • /
    • pp.53-64
    • /
    • 1998
  • 본 연구의 목적은 '96년말 서울시에서 실시한 가구통행조사를 이용하여 서울시 수단선택모형을 구축하고 그 예측결과를 남산 혼잡통행료 전후저사자료와 비교하여 보다 구체적으로 그 정확성을 검증한 뒤 향후 서울시 교통수요관리 방안의 시행에 따른 수단선택변화 예측의 기본 모형으로 활용하는데 있다. 5가지의 대안모형의 분석결과 통행비용변수(승용차의 경유 주차요금포함)와 총통행시간변수(OVTT와 IVTT의 합), 승용차, 지하철, 택시상수로 구성된 모형이 최적모형으로 분석되었다. 이모형에 의한 시간가치는 9,395원, 승용차의 비용탄력성은-0.6767로서 기존 연구결과의 범위 내에 속한 것으로 나타났다. 최적모형을 이용하여 승용차통행비용이 증가한 경우를 모사분석결과 남산1,3호 터널 혼잡통행료 징수효과와 유사하게 승용차 분담율이 13% 가까이 감소한 것으로 나타나서 모형의 현실적합성도 비교적 높은 것으로 판명되었다. 향후 본 연구에서 선정된 최적수단선택모형을 통행배정모형과 결합하여 다양한 교통수요관리 방안에 따른 효과를 예측하는데 활용하면 서울과 같은 대도시의 단기적 교통관리의 수준을 한 단계 높이는데 기여할 것으로 판단된다.

  • PDF

벌점함수를 이용한 부분최소제곱 회귀모형에서의 변수선택 (Variable Selection in PLS Regression with Penalty Function)

  • 박종선;문규종
    • Communications for Statistical Applications and Methods
    • /
    • 제15권4호
    • /
    • pp.633-642
    • /
    • 2008
  • 본 논문에서는 반응변수가 하나 이상이고 설명변수들의 수가 관측치에 비하여 상대적으로 많은 경우에 널리 사용되는 부분최소제곱회귀모형에 벌점함수를 적용하여 모형에 필요한 설명변수들을 선택하는 문제를 고려하였다. 모형에 필요한 설명변수들은 각각의 잠재변수들에 대한 최적해 문제에 벌점함수를 추가한 후 모의담금질을 이용하여 선택하였다. 실제 자료에 대한 적용 결과 모형의 설명력 및 예측력을 크게 떨어뜨리지 않으면서 필요없는 변수들을 효과적으로 제거하는 것으로 나타나 부분최소제곱회귀모형에서 최적인 설명변수들의 부분집합을 선택하는데 적용될 수 있을 것이다.

도시 여가활동의 참여행태 및 요인분석 (Analysis of Participation Behavior and Factors of Urban Leisure Activity)

  • 김상황;윤대식;김갑수
    • 대한교통학회지
    • /
    • 제22권3호
    • /
    • pp.41-48
    • /
    • 2004
  • 본 연구에서는 지금까지 여가활동수요를 충족시키기 위한 비통근통행에 대한 연구가 통근통행에 대한 연구에 비해 극히 부진하였다는 점을 감안하여 도시민의 여가활동을 위한 통행행태를 분석하고자 하였다. 이러한 연구목적을 충족시키기 위해 여가활동 유형을 6개의 범주로 구분하여 도시민의 여가활동 유형별 참여요일과 참여시간대에 대한 선택을 분석하고자 하였다. 본 연구를 위해 2003년 4월에 대구 및 포항 시민들을 대상으로 설문조를 실시하였고, 이 자료를 이용하여 네스티드 로짓모형을 추정하고 그 결과를 논의하였다. 본 연구를 통해 도시민의 여가유형별 참여요일 및 참여시간대 선택행태를 분석한 결과를 요약해서 살펴보면 다음과 같다. 참여시간대 선택모형(조건부 모형)의 추정결과를 보면 나이, 성별, 소득, 여가 유형별 1회 평균 소요시간, 여가활동 소요시간(1주일), 주5일 근무제 시행에 따른 여가시간의 증가가 도시민의 여가활동 참여시간대 선택에 의미있는 영향을 미치는 것으로 확인되었다. 참여요일 선택모형(한계 모형)의 추정결과를 보면 나이가 많을수록, 주중에 여가시간이 많을수록 주중에, 그리고 남성일수록, 소득이 많을수록(레저스포츠 활동은 제외), 여가 유형별 1회 평균 소요시간이 많을수록 주말에 여가활동에 참여하는 경향이 있음을 경험적으로 확인하였다. 아울러 모형의 경험적 추정결과는 본 연구에서 가설화된 네스티드 로짓모형의 타당성을 입증케 한다. 즉 도시민의 여가활동 참여시간대 선택은 참여요일 선택과 밀접한 관련을 가지면서 이루어진다는 사실을 확인할 수 있었다.

포아송 모형에서의 설명변수 선택문제 - 정규분포 설명변수하에서 - (Subset Selection in the Poisson Models - A Normal Predictors case -)

  • 박종선
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.247-255
    • /
    • 1998
  • 일반선형 모형의 하나인 포아송모형에서 설명변수들을 선택하는 문제를 고려하여 보았다 설명변수들이 정규분포를 따르는 확률변수일 때 반응변수의 조건부 분포를 통하여 모형에 필요한 설명변수의 부분집합을 선택하는 방범을 제시하였다.

  • PDF