• 제목/요약/키워드: 선택변수모형

검색결과 608건 처리시간 0.025초

로지스틱회귀모형에서 로그-밀도비를 이용한 변수의 선택 (Variable Selection with Log-Density in Logistic Regression Model)

  • 강명욱;신은영
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.1-11
    • /
    • 2012
  • 로지스틱회귀모형에서 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 어떤 설명변수가어떻게모형에포함되는지에대한변수선택문제에서유용한정보를제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하다. 여러 가지 모의실험을 수행한 결과를 보면, $x{\mid}y$ = 0과 $x{\mid}y$ = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

대형 데이터에서 VIF회귀를 이용한 신속 강건 변수선택법 (Fast robust variable selection using VIF regression in large datasets)

  • 서한손
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.463-473
    • /
    • 2018
  • 연구에서는 선형회귀모형을 가정한 대형 데이터에서의 변수선택 알고리즘을 다룬다. 방법의 속도와 강건성에 주안점을 둔 여러 알고리즘들이 제안되었다. 그 중에서 streamwise 회귀 접근법을 사용한 VIF회귀는 신속하고 정확하게 수행된다. 그러나 VIF회귀는 최소제곱방법에 의해 모형이 추정되므로 이상치에 민감하다. 변수선택방법의 강건성을 높이기 위해 가중 추정치를 사용한 강건측도가 제안되었으며 강건 VIF회귀도 제안되었다. 본 연구에서는 잠재적 이상치를 탐지하여 제거한 후 VIF회귀를 수행하는, 빠르고 강건한 변수선택 방법을 제안한다. 제안된 방법은 모의실험과 데이터 분석 통해 다른 방법들과 비교된다.

통행목적별 수단별 통행시간가치도출 및 유의성 검정 (VOT Derivation for Different Trip Purposes, Travel Modes and Testing of Their Significance)

  • 김현;오세창;최기주
    • 대한교통학회지
    • /
    • 제17권1호
    • /
    • pp.113-129
    • /
    • 1999
  • 통행시간가치가 교통수단의 선택 및 교통계획의 평가에 있어서 중요한 역할을 함에도 불구하고 이를 정확히 판단하는 것은 쉬운 일이 아닌 것으로 되어왔다. 통상, 통행시간가치에 있어서 업무와 비업무통행으로만 구분하여 연구되어진 반면, 본 연구는 다항로짓모형을 적용하는데 있어 통행목적에 따른 모형 구성변수에 있어 통계적신뢰성 및 모형의 적합도, 수정우도비, 교통수단선택의 행태특성을 반영하여 적중율의 동일성이 검정하였고, 또한 통행 목적별 수단별 시간가치 값의 유의적인 차이가 있음을 검정하였다. 한편, 구체적으로 제시된 결과로는, 첫째 교통수단선택의 효용함수를 정산결과 모형 I (통근+통학)의 경우 선정된 11개 변수는 유의수준 5%이내에서 높은 설명력이 나타나, 신뢰구간 95%에서 모형을 구성하는 변수의 통계적 신뢰성이 있음을 검정하였고, 둘째, 모형별 통행시간가치 도출결과 모형 I (통근+통학)의 경우 승용차 8,198원/시, 버스 639원/시, 지하철 1,083원/시이며, 모형II(업무)는 승용차 14,074원/시, 버스 1,219원/시, 지하철 1,062원/시로 산정되었으며, 모형III(통근)의 경우 승용차10.947원/시, 버스 972원/시, 지하철 987원/시로 산정되었다. 모형의 적합도에 있어서는 모형II가 가장 큰 값을 나타냈으며, 다음은 모형III, 모형 I의 순으로 나타났다 셋째, 통행 목적별 각 모형 상호간 적중율차이에 대한 동일성은 유의수준 5%이내에서 인정되어 예측력에 따른 통행시간가치의 변화는 없을 것으로 판단되며, 또한 통행시간 가치값의 도출에 영향을 미치는 통행시간, 승용차비용, 버스요금 지하철요금 등의 매개변수가 유의수준 5%에서 검정결과 유의적인 차이가 인정된 만큼 통행목적 별 수단별 통행시간 가치값은 상호간에 유의적인 차이가 있음을 확인하였다. 본 연구 결과 향후 경제성 평가는 통행목적에 따른 수단별 통행시간가치가 적용될 수 있을 것으로 기대되며, 또한 수단선택모형의 매개변수 정산시에는 통행목적별 시간가치를 비교하여 모형의 타당성을 입증하는 요인으로 적용될 수 있을 것으로 기대된다.

  • PDF

공정변수를 갖는 혼합물 실험 자료를 활용한 최적조건 찾기에 관한 소고 (A Note on Finding Optimum Conditions Using Mixture Experimental Data with Process Variables)

  • 임용빈
    • 품질경영학회지
    • /
    • 제41권1호
    • /
    • pp.109-118
    • /
    • 2013
  • 혼합물 성분비와 공정변수들에 관한 실험 자료가 주어진 경우에, 주어진 실험 자료를 잘 설명하는 적절한 결합모형을 찾는 것은 중요한 과제이다. 우선 모형 선택 기준에 부합하는 시작모형의 후보들을 교적모형의 범주에서 찾고, 다음으로 선택된 시작모형을 완전모형으로 간주하여, 모형의 간결성의 원칙에 따라서 완전모형의 부분모형으로 구성된 적절한 결합모형들을 찾는데, 일반적으로 여러 개의 결합모형들이 추천된다. 주어진 실험 자료에 대한 적절한 모형으로 여러 개의 모형이 추천된 경우에, 엔지니어들의 실용적인 관심사는 각각의 결합모형에 대한 반응변수의 기대값의 예측치와 예측치의 표준편차의 추정치를 동시에 최적으로 하는 최적조건의 찾기이다. 이를 위한 실용적인 방법으로 반응변수가 여러 개인 다중 반응표면 분석에서 동시 최적화 기법을 활용한 최적조건을 찾는 방법을 제안하고, 잘 알려진 혼합물성분-공정변수 실험 자료에 대해서 Design Expert 8.0을 활용하여 적절한 결합모형들을 찾고, 이 모형들을 동시에 최적화하는 최적조건 찾기가 예시된다.

예비 고령자의 경제적 은퇴계획에 따른 고령자 주택선택에 관한 연구 (A study on the Housing Choice of the Elderly according to the Financial Retirement Planning of Pre-seniors)

  • 김창곤;이주형
    • 지적과 국토정보
    • /
    • 제45권2호
    • /
    • pp.175-189
    • /
    • 2015
  • 본 연구는 예비 고령자의 노년기 경제적 은퇴계획 특성에 따른 고령자 주택의 주택유형별 선택요인을 분석하고, 향후 고령자 주택의 개발방안을 도출하는 데 연구의 목적이 있다. 본 연구에서는 기존 선행연구의 변수를 통제변수로 하고, 새로이 '노년기 경제적 은퇴계획'의 변수를 본 모형을 통해 검증했다는 점에 의의가 존재하며, 세부 모형 간 차이가 있음을 도출했다. 분석결과를 종합해보면 고령자 주택유형 선택모형에서는 노년기 경제적 은퇴계획에서 노인복지시설을 기준으로 단독주택, 공동주택의 선택요인의 차이가 존재하는 것을 알 수 있었다.

다중회귀모형에서 전진선택과 후진제거의 기하학적 표현 (Geometrical description based on forward selection & backward elimination methods for regression models)

  • 홍종선;김명진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.901-908
    • /
    • 2010
  • 다중회귀모형에서 변수선택법 중에서 전진선택과 후진제거의 과정을 기하학적으로 표현하는 그래픽적 방법을 제안한다. 반지름이 1인 반원의 제1사분면에는 전진선택 과정을, 제2사분면에는 후진제거 과정을 표현한다. 각 단계에서 회귀제곱합을 벡터로 표현하고, 추가제곱합 또는 부분결정계수를 벡터 사이의 각도로 나타내며 벡터의 끝을 연결할 때 통계적으로 유의하면 점선으로 표현하여 부분가설검정의 통계적 분석결과를 인지할 수 있도록 작성한다. 이 방법을 이용하면 전진선택과 후진제거 방법에 의한 최종모형을 비교 분석하고 전체적으로 모형의 적합도를 파악할 수 있다.

이중 양분선택형 질문 CV자료에서의 정박효과 검토

  • 신영철
    • 자원ㆍ환경경제연구
    • /
    • 제8권1호
    • /
    • pp.51-73
    • /
    • 1998
  • 조건부가치측정법(CVM)의 지불의사 유도방법인 이중 양분선택형 질문법은 단일 양분선택형 질문 CV자료의 통계적 비효율성을 극복하기 위한 방법으로 제안되었다. 이 방법은 여러 가지 장점에도 불구하고 출발점 편의의 심리학적 근거인 정박효과 (anchoring effect)의 발생 가능성을 의심받고 있다. 그러므로 본 논문에서는 이중 양분선택형 질문 CV자료에서 정박효과를 검토할 수 있는 일반적 지불의사금액모형을 제시하고, 그 모형으로부터 정박효과를 검토할 수 있는 방법을 제안한다. 모형은, Cameron and Quiggin(1994)이 제안한 이변량 모형에 두 번째 내재 지불의사금액의 설명변수로서 처음 제시된 특정금액에 대한 양분선택적 응답결과를 포함시킨 형태이다. 이 모형에서 처음 제시된 특정금액에 대한 양분선택적 응답결과의 계수 부호가 음(-)이고 통계적으로 유의하다면 정박효과가 발생하는 것으로 볼 수 있다. 그러나 만약 이러한 계수 검토에서 정박효과 발생을 확인할 수 없는 경우, 두 번의 응답에서 두 지불의사금액 추정치들의 평균이 다르다고 볼 수 없다면 정박효과를 우려할 필요가 없다. 이 검토 모형 및 방법을 본 연구에서 한강 수질 개선에 대한 CV자료에 적용해 본 결과 정박효과를 우려할 필요가 없음을 확인할 수 있다.

  • PDF

무응답을 가지고 있는 범주형 자료에 대한 모형 선택 방법 (Model selection method for categorical data with non-response)

  • 윤용화;최보승
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.627-641
    • /
    • 2012
  • 본 연구는 다차원 분할표 형태로 정리된 범주형 자료가 결측치나 무응답을 가지고 있을 때 주어진 자료를 가장 잘 설명하고 예측의 정확도를 높일 수 있는 모형의 추정과 모형의 선택 문제를 다루었다. 무시할 수 없는 무응답 (non-ignorable non-response)체계하에서 최대우도 추정에서 발생할 수 있는 변방값 문제를 해결하기 위하여 계층적 베이지안 모형을 고려하였다. 또한 모형 적도를 높이기 위한 변수 조합을 찾는 모형 선택의 문제를 함께 다루었다. 베이지안 접근하에서 모형 선택의 문제를 다루기 위하여 베이즈 인자 (Bayes factor)를 모형 선택의 기준으로 이용하였다. 제시된 방법은 2004년 실시된 우리나라 국회의원 선거를 앞두고 수행된 여론조사 데이터를 이용하여 실증분석을 수행하였다. 분석결과 무시할 수 없는 무응답 체계하에서 설명변수로 투표참여여부를 이용하는 것이 가장 적합한 모형으로 판명되었다.

신호제어를 고려한 가로망 설계모형의 구축에 대한 연구

  • 강환민;박창호
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1998년도 제34회 추계 학술발표회
    • /
    • pp.115-115
    • /
    • 1998
  • 가로망은 사회의 발전과 더불어 날로 늘어나고 있는 통행수요를 직접적으로 처리하게 되는 기반시설이다. 따라서 가로망의 구성과 운영은 심각하게 대두되고 있는 교통혼잡 등의 제반문제들을 해결하기 위해 기본적으로 고려되어야 한다. 이를 위해서 연구되어온 가로망 설계 모형들은 새로운 도로의 건설이나 기존 도로의 확장 등을 통해 가로망을 조정하여, 사용자들의 선택에 영향을 줌으로써 통행 흐름을 원활하게 하고자 한다. 이러한 가로망 설계 과정에서 사용자들에 의해서 초래된 통행비용의 개선과 이를 위해 사용된 투자비용 사이의 관계를 고려하여 적절한 대안을 선택하게 된다. 일반적으로 도시부의 경우, 차량들의 통행패턴은 가로망의 물리적 구성(기하구조, 용량 등)뿐만 아니라, 신호제어(주기, 녹색시간 등)에 의해서 결정된다. 그러므로 가로망 설계 모형에서 고려되는 사용자의 통행비용의 경우, 단순히 가로망의 통행시간 뿐만 아니라 신호제어에 의해서 부가되는 지체도 고려해야 하며, 이를 통해 가로망의 계획단계에서 중요하게 생각해야하는 요소의 하나인 차량의 이동성과 접근성의 부여도 가능하게 될 것이다. 즉, 이동성을 중요시하는 도로와 접근성을 위주로 하는 도로 각각의 기능에 부합하는 가로망 설계가 필요한 것이다. 위에서 언급한 것처럼 기존의 가로망 설계모형의 경우, 단순히 용량의 변화에 대한 링크 통행시간과 이로 인한 통행량의 변화만을 고려하고 있는 상황이다. 하지만, 도시부에서 실제 차량의 통행패턴은 단순히 도로의 기하학적 용량뿐만 아니라, 교차로에서의 신호제어에 의한 지체에도 상당한 영향을 받게 되며, 가로망 설계 모형에서 이를 반영할 수 있어야 한다. 따라서, 본 논문에서는 이러한 신호제어의 영향들을 고려함으로써 가로망 설계 과정에서 가로망의 상반된 역할인 이동성과 접근성의 비교가 가능한 보다 현실적인 가로망 설계 모형을 구축하고자 한다. 지금까지 소개된 가로망 설계모형들은 용량변화에 대한 설계변수의 형태에 따라 이산적 가로망 설계 모형과 연속적 가로망 설계모형으로 나뉘어지게 된다. 본 논문의 경우, 계산속도의 향상 측면에서는 연속적 가로망 설계 모형을 도입할 수 있지만, 이때 요구되는 도로용량이 이산적인 변수(차선 수)로 결정되어야만 신호제어 변수를 결정할 수 있기 때문에, 이산적 가로망 설계 모형이 사용된다. 하지만, 이산적 설계모형의 경우 조합최적화 문제이므로 정확한 최적해를 구하기 위해서는 상당한 시간이 소요되며, 경우에 따라서는 국부 최적해에 빠지게 된다. 이러한 문제를 극복하기 위해, 우선 이상적 모형의 근사화, 혹은 조합최적화문제를 위해 개발된 Simulated Annealing기법의 적용, 연속적 모형의 변수를 이산화하는 방법 등 다양한 모형들을 고려해 본 뒤, 적절한 모형을 적용할 것이다. 가로망 설계 모형에서 신호제어를 고려하기 위해서는 주어진 가로망에 대한 통행 배정과정에서 고려되는 통행시간을 링크통행시간과 교차로 지체시간을 동시에 고려해야 하는데, 이러한 문제의 해결을 위해서 최근 활발히 논의되고 있는 교차로에서의 신호제어에 대응하는 통행배정 모형을 도입하여 고려하고자 한다. 이를 위해서 지금까지 연구되어온 Global Solution Approach와 Iterative Approach를 비교, 검토한 뒤 모형에 보다 알맞은 방법을 선택한다. 차량의 교차로 통행을 고려하는 performance function의 경우 비신호 교차로와 신호교차로에 대한 적절한 비교가 현재로서는 고려되고 있지 못하기 때문에, 구성되는 가로망의 경우 신호교차로들로만 구성되며, 부득이한 경우 입체교차의 형태로 구성되는 것으로 가정한다. 실제 가로망의 경우, 교통향이 많은 도시부의 경우 주가로망은 대부분 신호교차로와 입체교차로 구성되기 때문에 가능할 것으로 생각된다. 기존의 신호제어 모형과 가로망 설계모형을 결합하여 통합된 가로망 설계모형의 구축하기 위해, 기존의 연구결과들을 종합하여 보다 적절한 모형을 선택하고, 개선하며, 이의 적용성을 시험하기 위해서, 가상 가로망을 구성하여 모형의 적용 결과를 분석한다.

  • PDF

제주시 지역주민들의 님비 행위 결정요인에 대한 연구: 2변수 선택모형의 적용 (Determinants of NIMBY Attitudes of Local Residents in Jeju, Korea - An Application of Two-choice Model -)

  • 김현철
    • 자원ㆍ환경경제연구
    • /
    • 제13권4호
    • /
    • pp.685-715
    • /
    • 2004
  • 본 연구는 대규모 퇴비화 시설물이 특정 지역에 건립될 경우 지역주민들의 님비(NIMBY) 행태의 결정요인에 대해 2변수 선택 모형에 근거하여 경제적 분석을 한다. 실증분석을 위해 제주시 지역주민들을 대상으로 한 설문데이터를 이용 로짓추정을 한다. 실증분석 결과는 이론모형에서 유도된 실증모형이 예측하는 바와 일치됨을 보였다 즉, 부(負)의 근린특성변수(긍정적 부(富)의 속성변수)가 지역주민들의 님비 행태에 정(부)의 영향을 끼친다. 반면 본 연구에서 인구통계 요인은 유의하지 않았으며 이는 정책 입안자가 혐오시설 입지 선정시 타 지역에서 유의하게 밝혀진 인구 통계 요인을 다른 지역에 단순 외삽(外揷)할 경우 정책실효성에 문제가 있을 수 있음을 시사한다.

  • PDF