• 제목/요약/키워드: 모형선택

검색결과 2,186건 처리시간 0.029초

혼합회귀모형에서 콤포넌트 및 설명변수에 대한 벌점함수의 적용 (Joint penalization of components and predictors in mixture of regressions)

  • 박종선;모은비
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.199-211
    • /
    • 2019
  • 주어진 회귀자료에 유한혼합회귀모형을 적합하는 경우 적절한 성분의 수를 선택하고 선택된 각각의 회귀모형에서 의미있는 예측변수들의 집합을 선택하며 동시에 편의와 변동이 작은 회귀계수 추정치들을 얻는 것은 매우 중요하다. 본 연구에서는 혼합선형회귀모형에서 성분의 개수와 회귀계수에 벌점함수를 적용하여 적절한 성분의 수와 각 성분의 회귀모형에 필요한 설명변수들을 동시에 선택하는 방법을 제시하였다. 성분에 대한 벌점은 성분들의 로그값에 SCAD 벌점함수를 적용하였고 회귀계수들에는 SCAD와 더불어 MCP 및 Adplasso 벌점함수들을 사용하여 가상자료와 실제자료들에 대한 결과를 비교하였다. SCAD-SCAD 벌점함수 조합과 SCAD-MCP 조합의 경우 기존의 Luo 등 (2008)의 방법에서 문제가 되었던 과적합 문제를 해결함과 동시에 선택된 성분의 수와 회귀계수들을 효과적으로 선택하였으며 회귀계수들의 추정치에 대한 편의도 크지 않았다. 본 연구는 성분의 수가 알려져 있지 않은 회귀자료에서 적절한 성분의 수와 더불어 각 성분에 대한 회귀모형에서 모형에 필요한 예측변수들을 동시에 선택하는 방법을 제시하였다는데 의미가 있다고 하겠다.

이질적 지하철승객 기반의 동적 출발시간선택모형 개발 (도심을 목적지로 하는 단일 지하철노선을 중심으로) (Development of A Dynamic Departure Time Choice Model based on Heterogeneous Transit Passengers)

  • 김현명;임용택;신동호;백승걸
    • 대한교통학회지
    • /
    • 제19권5호
    • /
    • pp.119-134
    • /
    • 2001
  • 본 연구에서는 지하철망에서 각 노선을 운행하는 차량과 승객을 동적으로 시뮬레이션 할 수 있는 동적 지하철차량 시뮬레이션 모형과 동적 지하철승객 시뮬레이션 모형을 개발하고, 이를 이용해 통행자 기반의 동적 지하철 출발시간 선택 알고리듬을 개발하였다. 개발된 모형은 개별적인 통행자들의 행태를 이질적(Heterogeneous)으로 설정해 기존에 이용되던 통행자간의 동질성 가정을 완화하였다. 또한, 통행자들은 불완전한 정보와 제한적인 합리성을 가진다고 가정하여 보다 현실적인 시뮬레이션이 가능하도록 하였으며, 간단한 예제 가로망에 대해 모형을 분석하였다. 분석결과 통행자들을 이질적으로 가정한 경우와 동질적으로 가정한 경우간에 출발시간선택에 명확한 차이를 보였다. 통행자들을 동질적으로 가정한 경우 출발시간선택과정에서 기종점에 관련된 특성들이 중요한 역할을 하는 반면 이질적으로 가정한 경우 개별 통행자의 선호특성이 출발시간 선택에 중요한 역할을 하는 것으로 나타났다. 특히 통행자들을 동질적으로 가정할 경우 출발시간 선택결과가 비현실적으로 나타날 수 있음도 보였다. 또, 기존의 확률과정과 달리 선택 차원이나 선택 대안의 수가 많아질 경우 추가적인 고려가 있어야 학습과정을 보다 현실적으로 모형화할 수 있음을 알 수 있었다. 본 연구모형에서는 지하철 통행자의 동적 출발시간 선택과정을 묘사하기 위해 인지 및 의사결정과정으로서 추론과정과 귀납적인 선호형성과정을 학습모형에 포함시킴으로써 보다 현실적인 분석결과가 도출되도록 하였다. 각 승객들은 충분한 학습을 거친 뒤에도 합리적인 선택을 하기보다는 자신의 경험에 따라 형성되는 선호의 영향을 받아 임의적으로 출발시간을 선택하는 문제도 나타날 수 있는 것으로 분석되었다. 이런 분석결과는 기존의 전통적인 교통수요모형(이용자균형 통행배정모형 등)들에서 주로 이용되는 통행자의 완전한 정보, 합리성 및 동질성 가정 등에 따른 집계적인 수요추정결과가 실제로 나타나는 개별적인 통행행태와 다를 수도 있음을 보여 주는 것이다.

  • PDF

데이터마이닝의 베이지안 망 기법을 이용한 교통수단선택 모형의 설계 및 구축 (Design and Implementation of Travel Mode Choice Model Using the Bayesian Networks of Data Mining)

  • 김현기;김강수;이상민
    • 대한교통학회지
    • /
    • 제22권2호
    • /
    • pp.77-86
    • /
    • 2004
  • 데이터마이닝 (Data Mining)은 대용량의 데이터에 존재하는 관계, 패턴, 규칙 등을 효율적으로 탐색하여 이를 모형화함으로써, 유용한 정보로 추출 변환하는 일련의 과정이다. 특히 베이지안 망 (Bayesian Network)은 신경망, 유전자알고리즘 퍼지이론 등과 더불어 데이터마이닝의 중요한 기법 중의 하나로서 베이지안 통계 이론(Bayesian Statistics Theory)를 적용하여 변수들간의 확률적인 관계를 기호화함으로써, 설명변수들과 종속변수들간의 인과관계를 파악할 수 있다. 이 연구는 기존에 적용된 바가 없는 데이터마이닝의 베이지안 망을 이용하여 수도권 교통수단선택 모형을 구축한다. 2002년도 수도권 가구통행실태조사 자료의 사회 경제적 특성과 교통체계 특성을 반영하여 베이지안 망을 이용한 교통수단선택 모형을 설계 구축하여, 각 변수들간의 상관관계와 인과관계를 분석함으로써, 설명변수인 성과 연령의 구성비가 변하였을 때, 교통수단선택의 변화율(확률)을 예측한다. 이 연구를 통해 현실에서는 내재하나 설명변수간의 복잡한 상관성을 배제하고 설명변수들과 교통수단선택간의 단순한 직선관계를 가정하는 기존 교통수단선택 모형의 한계를 극복할 수 있는 가능성을 제시한다. 또한 선택되지 않은 교통수단에 대한 정보의 부족으로 인한 교통수단선택 모형 구축의 어려움을 극복한다. 또한 다양한 교통정책에 따른 교통수단선택의 변화를 실시간으로 시뮬레이션 할 수 있는 방법론을 개발한다.

OLS 및 변수선택법에 의한 다중선형회귀모형 매개변수 산정 (Parameter Estimation for Multiple Linear Regession Model by OLS and Stepwise)

  • 김경탁;김주훈;박정술
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1161-1165
    • /
    • 2006
  • 본 연구는 OLS 및 변수선택법에 의해 통계학적 모형의 매개변수를 산정하여 모형의 적용성을 입증하고 하천 주요지점에 대한 홍수위 예측을 통해 홍수예보 및 예측 업무에 기여코자하는데 연구목적이 있다. 다중선형회귀모형을 구성하기 위한 독립변수는 예보지점의 수위/유출량 자료와 상류지점의 수위/유출량 자료, 그리고 유역의 선행 평균강우량 등의 자료를 독립변수로 하여 통계학적 홍수예측을 위한 다중선형 회귀모형을 각각 구성하여 적합성 여부를 판단하였다. 매개변수 산정은 OLS(Ordinary least square root method)와 변수선택(Stepwise)방법에 의해 산정하였으며, 중랑천 유역의 2002년부터 2005년까지의 수문사상 16개를 선정하여 모형에 적용한 결과 두 매개변수 산정방법 모두 30분에서 90분 예측은 상대적으로 정확한 결과를 나타내었으며, OLS 및 변수선택법에 의한 매개변수 산정결과 변수선택법에 의한 방법이 OLS 방법보다는 상관성이나 효율지수면에서 조금 더 정확한 값을 나타내고 있으나 독립변수의 일관성을 감안한다면 변수선택법보다는 OLS방법에 의한 매개변수 산정이 타당할 것으로 사료된다. 기존의 홍수예보 업무에 활용되고 있는 수문학적 홍수예측 모형인 저류함수법의 여러 매개변수 조정에 의한 홍수위 예측 방법보다는 비교적 간단한 통계적 방법에 의한 홍수위 예측 방법으로 홍수예보의 선행시간 확보가 필수적인 중랑천과 같이 유역면적이 작은 중소하천에서의 홍수예보 업무에 효과적으로 이용 가능할 것으로 사료된다.

  • PDF

선택기반 화물데이타를 이용한 개별로짓모형의 적용에 관한 연구 (A Study on the Application of Disaggregate Logit Models from Choice-Based Freight Data)

  • 남기찬
    • 한국항만학회지
    • /
    • 제7권1호
    • /
    • pp.25-42
    • /
    • 1993
  • 지난 20여년간 화물수송 분야에는 큰 변화가 있었다. 수송 공급 측면에서는 보다 다양하고 기술적으로 앞선 수송수단들이 등장했으며, 수송 수요 측면에서는 로지스틱스 개념의 도입으로 화주들의 보다 높은 수송 서비스가 요구 되었다. 수송수단의 수송 분담에 있어서도 특히 철도에서 공로로의 두드러진 화물이동 현상이 나타났다. 이러한 변화는 수송 현안 해결에 대한 관심을 높이고 화물수송수요 예측기법의 이론적, 개념적인 발달을 가져왔다. 그 중 두드러진 발달은 화주의 행태를 반영하는 행태모형의 개발과 새로운 자료수집 방법 및 자료형태이다. 전통적으로 화물수송 및 교통 연구에 널리 사용된 행태모형은 확률표본을 사용하여 왔으나, 80년대 부터 비확률 표본 사용에 관심이 높아졌다. 그 대표적인 것으로 기반근거 데이터를 들 수 있다. 이 데이터는 제한된 정보를 제공한다는 자료자체의 한계를 지니고 있으나, 자료수집이 용이하고 비용이 저렴하다는 장점을 가지고 있다. 화물수송 분야에서 선택기반 데이터를 이용한 연구는 현재까지 두 편이 발표 되어 있다. 따라서 볼 연구는 선택기반 데이터를 이용한 개별선택모형의 잠재력을 검증하는 것을 그 목적으로 하고, 네 종류의 제조품 그룹을 대상으로 기반근거 데이터를 수집하여 로짓모형을 추정하였으며, 추정결과를 이전 연구들의 결과와 비교하여 그 타당성을 검토 하였다. 추정된 결과는 통계적으로 유의하며 직관적으로 타당한 것으로 나타난다. 또한 그 결과는 문헌의 결과와도 일치하였다. 수송계획에 있어서 자료수집비용 절감의 필요성을 생각할 때 이것은 중요한 의미를 지닌다.

  • PDF

통근통행자의 통행패턴 선택행태의 분석 (Analysis of Urban Workers' Travel Pattern Choice Behavior)

  • 윤대식
    • 대한교통학회지
    • /
    • 제15권4호
    • /
    • pp.35-51
    • /
    • 1997
  • 본 연구에서는 1일(24시간) 단위로 표현되는 통근통행자의 통행패턴을 분석하기 위해 가정과 직장 및 기타 목적지를 선택하여 이루어지는 하루 동안의 통행패턴을 유형화하여 이들 선택대안의 선택행태를 분석하였다. 이러한 연구목적을 충족시키기 위하여 본 연구에서는 경산시와 영천시에 직장을 가진 직장인(통근통행 자)에 대하여 실시한 통행 설문조사자료를 이용하여 네스티드 로짓모형을 이용한 경험적 모형을 추정하고, 모형의 추정결과를 논의하였다. 본 연구에서는 통근통행자의 통행패턴이 단일목적 혹은 다목적 통행의 선택을 높은 단계, tour의 수를 낮은 단계의 선택으로 하는 네스티드 로짓모형에 의해 표현된다고 가정하였다. 이렇게 표현된 네스티드 로짓모형의 경험적 추정결과로부터 본 연구에서 가설화된 네스티드 로짓모형구조의 타당성을 확인할 수 있었다. 아울러 모형의 경험적 추정결과는 개인의 행태적 측면을 적절히 반영하는 것으로 확인되었다.

  • PDF

모형선택에서의 평활 적합도 검정

  • 윤용화;김종태
    • Communications for Statistical Applications and Methods
    • /
    • 제5권3호
    • /
    • pp.827-836
    • /
    • 1998
  • 본 연구의 목적은 평활 적합도 검정에 이용되는 모형선택 기법 중 AIC (Akaike information criteria) 기법과 BIC (Baysian information criteria) 기법을 사용한 검정통계량들에 대한 검정력을 비교 분석함에 있다. 또한 이 두 가지 기법을 이용한 새로운 검정 통계 량을 제시하고 기존의 검정 통계량들과 비교 분석하였다.

  • PDF

이항 선택 모형에서의 절단 모수 선택 (Truncation Parameter Selection in Binary Choice Models)

  • 김광래;조규동;구자용
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.811-827
    • /
    • 2010
  • 본 논문에서는 통계적 역문제로서 이항 선택모형에서의 밀도추정 방법에 대하여 연구하였다. 밀도함수의 추정을 위하여 직교열 기저를 이용하였으며, 모형의 복잡성과 예측의 정확성을 반영한 적절한 절단모수의 선택에 대하여 고려하였다. 이항 선택 모형에서 데이터에 의존하는 절단모수를 선택하는 방법에 대해 제안하고 모의실험, 실자료를 통해 제안한 방법의 성능을 규명하였다.

제2종 중단모형에서 FRACTIONAL BAYES FACTOR를 이용한 신뢰수명 모형들에 대한 베이지안 모형선택 (Bayesian Model Selection of Lifetime Models using Fractional Bayes Factor with Type ?$\pm$ Censored Data)

  • 강상길;김달호;이우동
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.427-436
    • /
    • 2000
  • 이 논문에서는 신뢰수명자료의 분석에 많이 사용되는 지수분포, 와이블분포, 로그정규분포에 대해, 현재의 자료가 어느 분포에 가장 적합한가를 알아보기 위한 베이자안 모형 선택방법을 제안한다. 일반적으로, 모수에 대한 사전분포가 부적절 분포인 경우, 베이즈 요인(Bayes factor)은 미지의 상수를 포함한다. 이러한 문제점을 해결하기 위하여 O’Hagan(1995)에 의해 제안된 fractional Bayes factor를 이용하여 자료를 가장 적합시키는 모형을 찾는다. 특히, 제2종 중도절단자료가 주어진 경우. 이 자료를 이용한 베이지안 모형선택에 대한 연구는 거의 이루어진 바가 없다. 실제 자료와 인위적인 자료를 이용하여 로그정규분포, 지수분포, 와이블모형중 어느 모형에 가장 잘 적합한지를 검정하는 예를 보인다.

  • PDF

시각적 선택에 대한 신경 망 모형FeatureGate 모형의 하향식 기제 (A Neural Network Model for Visual Selection: Top-down mechanism of Feature Gate model)

  • 김민식
    • 인지과학
    • /
    • 제10권3호
    • /
    • pp.1.2-1.2
    • /
    • 1999
  • 시각적 선택에 대한 과거 정신물리학적, 신경 생리학적 연구결과를 토대로 Feature Gate 라는 신경 망 모형을 제안하였다. 이 모형에는 공간 배치도가 위계 적으로 구성되어 있으며, 정보의 흐름이 위계의 각 수준으로부터 그 다음 수준으로 넘어갈 때 주의 게이트에 의해 조절되도록 되어 있다. 주의 게이트들은 독특한 세부 특징을 가진 위치에 반응하는 상향식 시스템과 표적 세부 특징이 있는 위치에 반응하는 하향식 기제 모두에 의해 조절된다. 본 연구는 Feature Gate 모형의 하향식 기제에 초점을 맞추어 모형을 설명하고, 현재 다른 모형들이 설명하지 못하는 Moran & Desimone(1985)의 연구결과를 이 모형이 어떻게 설명하는지를 제시하고자 한다. Feature Gate 모형은 병렬 적인 세부특징 검색, 계열 적 접합표적 검색, 단서에 의한 주의의 점진적 감소 모형, 세부특징-주도적인 공간적 선택, 주의의 분할, 방해자극 위치의 억제, 주변 억제 등을 포함한 시각적 주의 연구의 여러 가지 많은 현상들을 설명하는데 하나의 일관적인 해석을 제공해 준다. 앞으로 이 모형을 더욱 확장, 발전 시켜 세부특징의 조합된 배열에 반응하는 상위 수준의 유닛을 사용한다면 시각적 선택과정이 포함된 형태 재인 모형으로 개발될 수 있다.