• 제목/요약/키워드: 주요 변수 선택

검색결과 572건 처리시간 0.026초

주요성분분석과 상호정보 추정에 의한 입력변수선택 (Input Variable Selection by Principal Component Analysis and Mutual Information Estimation)

  • 조용현;홍성준
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.175-178
    • /
    • 2006
  • 본 논문에서는 주요성분분석과 상호정보 추정을 조합한 입력변수선택 기법을 제안하였다. 여기서 주요성분분석은 2차원 통계성을 이용하여 입력변수 간의 독립성을 찾기 위함이고, 상호정보의 추정은 적응적 분할을 이용하여 입력변수의 확률밀도함수를 계산함으로써 변수상호간의 종속성을 좀더 정확하게 측정하기 위함이다. 제안된 기법을 인위적으로 제시된 각 500개의 샘플을 가지는 6개의 독립신호와 1개의 종속신호를 대상으로 실험한 결과, 빠르고 정확한 변수의 선택이 이루어짐을 확인하였다.

  • PDF

대학 평가지표들에 대한 상관분석과 변수선택에 의한 선형모형추정 (The correlation and regression analyses based on variable selection for the university evaluation index)

  • 송필준;김종태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권3호
    • /
    • pp.457-465
    • /
    • 2012
  • 본 연구의 목적은 한국대학교육협의회 대학정보공시센터의 '대학알리미'에서 주요 대학지표들을 분석하고, 지표들 간의 연관성과 통계적 모형을 추정하는데 있다. 먼저 상관계수에 대한 통계적 검정을 이용하여 변수들 간의 통계적으로 유의한 상관성을 추정하고, 이들 주요 지표들의 모형을 추정하기 위해서 회귀분석 방법의 변수선택 방법을 이용하여 회귀 방정식을 추정하여 변수들 간의 연관성을 조사하였다. 변수선택의 판정기준에 따른 방법으로 전진선택법과 후진제거법, 단계별 회귀방법을 사용하였다.

분위수 회귀나무를 이용한 변수선택 방법 연구 (Variable selection with quantile regression tree)

  • 장영재
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1095-1106
    • /
    • 2016
  • Koenker 등 (1978)에 의해 제안 된 분위수 회귀분석법은 독립변수들이 주어졌을 때, 종속변수의 조건부 분위수에 초점을 맞추어 독립변수들과 종속변수의 해당 특정 분위수와의 관계를 분석하는 방법이다. 선형프로그래밍법 등을 이용한 분위수 회귀의 추정 과정을 생각해 볼 때, 고차원 대용량 자료의 경우에는 모형 적합에 어려움을 겪을 수 밖에 없다. 따라서 분위수 회귀의 문제에 있어서도 차원 축소의 문제, 조금 더 폭을 좁혀 생각해보면 변수선택의 문제를 통해 의사 결정에 영향을 미치는 주요 요인들을 파악하거나 적절한 규모의 모형을 적합하는 과정이 중요하다고 할 수 있다. 본 논문에서는 분위수 회귀의 변수선택의 문제를 보다 직관적이고 간단하게 해결하기 위한 방법으로서 회귀나무 모형을 응용하여 한국야구위원회에 등록된 선수들의 연봉과 기록 데이터를 분석해 보았다. 분석 결과, 각 분위수 별로 소수의 주요 변수가 선택되어 차원축소의 효과를 얻을 수 있었다. 또한 해당 분위수별로 선택된 변수도 해석상 의미 있는 것으로 평가할 수 있었다.

주요성분분석과 상호정보 추정에 의한 입력변수선택 (Input Variables Selection by Principal Component Analysis and Mutual Information Estimation)

  • 조용현;홍성준
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.220-225
    • /
    • 2007
  • 본 논문에서는 주요성분분석과 상호정보 추정을 조합한 입력변수선택 기법을 제안하였다. 여기서 주요성분분석은 2차원 통계성에 기반을 둔 기법으로 입력변수 간의 종속성을 빠르게 제거하여 과추정을 방지하기 위함이고, 상호정보의 추정은 적응적 분할을 이용하여 입력변수의 확률밀도함수를 계산함으로써 변수상호간의 종속성을 좀 더 정확하게 측정하기 위함이다. 제안된 기법을 각 500개 샘플의 7개 신호를 가지는 인위적인 문제와 각 55개 샘플의 24개의 신호를 가지는 환경오염신호를 대상으로 각각 실험한 결과, 빠르고 정확한 변수의 선택이 이루어짐을 확인하였다. 또한 주요성분분석을 수행하지 않을 때와 정규분할의 상호정보 추정 때보다 제안된 방법은 각각 우수한 선택성능이 있음을 확인하였다.

자본시장심리지수와 금융투자자 휴리스틱에 관한 연구

  • 김석환;강형구
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2020년도 추계학술대회
    • /
    • pp.179-184
    • /
    • 2020
  • 본 연구는 확장된 합리적 행동이론(ETRA)을 이용하여 주식투자 시 자본시장심리지수를 기반으로 한 어플리케이션의 선택행동에 영향을 끼치는 요인들과 투자자의 휴리스틱과의 관계를 알아보는데 있다. 연구자는 개별 투자자의 휴리스틱이 선택행동에 영향을 미칠 것으로 추정하고 대표성 휴리스틱, 가용성 휴리스틱, 감정 휴리스틱을 측정하여 선택행동에 영향을 미치는 매개변수로 분석을 하였다. 연구모델의 경로계수 분석결과는 다음과 같다. 첫째, 독립변수인 투자기회확장 그리고 매개변수인 휴리스틱 중 대표성 휴리스틱이 행동의도에 영향을 미치는 것으로 나타났다. 둘째, 행동의도가 종속변수인 선택행동에 영향을 미치고 매개변수인 가용성 휴리스틱이 선택행동에 영향을 미치는 것으로 나타났다. 연구모형에서 대표성 휴리스틱에 영향을 주는 독립변수는 혁신적 성향, 투자기회확장, 사용비용, 그리고 인지된 효익이며 반면에 가용성 휴리스틱에 영향을 주는 독립변수는 혁신적 성향과 투자기회확장으로 밝혀졌다. 매개효과 검증결과에 의하면 서비스다양성은 선택행동에 영향을 미치는데 휴리스틱의 매개효과가 없고 직접효과만 있는 것으로 밝혀졌다. 반면에 투자기회확장은 선택행동에 미치는 직접효과는 통계적으로 유의하지 않고 매개변수 휴리스틱의 간접효과 값이 0.217이고 통계적으로 유의하여 매개효과가 있는 것으로 밝혀졌다. 휴리스틱의 매개효과를 개별적으로 확인한 결과 첫째, 대표성 휴리스틱은 매개효과를 통한 간접효과가 없는 것으로 확인되었다. 둘째, 가용성 휴리스틱은 매개효과의 크기가 0.1360이고 경로계수가 통계적으로 유의하게 나타나 매개효과를 통한 간접효과가 있다는 것을 확인하였다. 따라서 독립변수 투자기회확장은 시장 심리지수를 기반으로 한 어플리케이션에 대한 선택행동에 영향을 미치는데 직접적으로 영향을 미치지 않고 투자자의 가용성 휴리스틱이 매개가 되어 간접적으로 선택행동에 영향을 나타내는 것을 실증적으로 확인하였다.

  • PDF

OLS 및 변수선택법에 의한 다중선형회귀모형 매개변수 산정 (Parameter Estimation for Multiple Linear Regession Model by OLS and Stepwise)

  • 김경탁;김주훈;박정술
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1161-1165
    • /
    • 2006
  • 본 연구는 OLS 및 변수선택법에 의해 통계학적 모형의 매개변수를 산정하여 모형의 적용성을 입증하고 하천 주요지점에 대한 홍수위 예측을 통해 홍수예보 및 예측 업무에 기여코자하는데 연구목적이 있다. 다중선형회귀모형을 구성하기 위한 독립변수는 예보지점의 수위/유출량 자료와 상류지점의 수위/유출량 자료, 그리고 유역의 선행 평균강우량 등의 자료를 독립변수로 하여 통계학적 홍수예측을 위한 다중선형 회귀모형을 각각 구성하여 적합성 여부를 판단하였다. 매개변수 산정은 OLS(Ordinary least square root method)와 변수선택(Stepwise)방법에 의해 산정하였으며, 중랑천 유역의 2002년부터 2005년까지의 수문사상 16개를 선정하여 모형에 적용한 결과 두 매개변수 산정방법 모두 30분에서 90분 예측은 상대적으로 정확한 결과를 나타내었으며, OLS 및 변수선택법에 의한 매개변수 산정결과 변수선택법에 의한 방법이 OLS 방법보다는 상관성이나 효율지수면에서 조금 더 정확한 값을 나타내고 있으나 독립변수의 일관성을 감안한다면 변수선택법보다는 OLS방법에 의한 매개변수 산정이 타당할 것으로 사료된다. 기존의 홍수예보 업무에 활용되고 있는 수문학적 홍수예측 모형인 저류함수법의 여러 매개변수 조정에 의한 홍수위 예측 방법보다는 비교적 간단한 통계적 방법에 의한 홍수위 예측 방법으로 홍수예보의 선행시간 확보가 필수적인 중랑천과 같이 유역면적이 작은 중소하천에서의 홍수예보 업무에 효과적으로 이용 가능할 것으로 사료된다.

  • PDF

댐호수의 특성별 휴양가치 분석 : 현시선호모형, 진술선호모형 및 그 혼합모형 (Valuing Recreational Benefits of Dam Lakes with a Combined Model of Revealed and Stated Preference Methods)

  • 권오상
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.247-253
    • /
    • 2006
  • 본고는 주요 댐호수의 휴양가치를 댐호수의 특성별로 도출하고자 실제로 댐호수를 선택한 행위를 분석하고, 아울러 선택실험을 통해 가상적으로 설정된 특성을 가진 댐을 방문할지를 선택하도록 하여 그 결과를 분석하기도 하였다. 또한 현시선호된 선택과 진술선호선택을 모두 결합하여 분석하는 기법도 사용하였다. 분석결과 진술선호자료와 현시선호자료간의 이질성이 상당한 것으로 나타났으나 두 자료를 결합함으로써 모든 특성변수들이 만족도에 미치는 영향이 직관과 부합되도록 도출되었다. 댐호수의 수량과 수질 모두가 레크리에이션 가치에 영향을 미치는 것으로 나타났으나, 특히 수질개선의 편익 증가효과가 매우 크다는 것이 확인되었다. 그 외에도 홍보관, 주변 숙박시설 및 음식점, 인근 휴양지와의 연계성 등도 휴양가치 증가에 영향을 미치는 주요 변수로 파악되었다.

  • PDF

약물유전체학에서 약물반응 예측모형과 변수선택 방법 (Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics)

  • 김규환;김원국
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.153-166
    • /
    • 2021
  • 약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.

ASPEN 코드를 이용한 석탄가스화기내 주요 변수들의 가스화 성능에 대한 영향

  • 이승종;마수만;윤용승;김형택
    • 한국에너지공학회:학술대회논문집
    • /
    • 한국에너지공학회 1993년도 추계학술발표회 초록집
    • /
    • pp.37-41
    • /
    • 1993
  • ASPEN 코드를 이용하여 석탄가스화기에 영향을 주는 온도, 압력, 산화제 및 증기를 변수로 선택하여 각 변수의 변화에 따른 가스화기의 온도 및 생성가스의 조성 변화를 살펴보았다. 석탄가스화기는 combustion zone, char gasification zone 및 gas shift reaction zone의 3부분으로 나뉘어 각 영역의 특성에 맞게 모사 되었다. 온도와 산화제는 석탄가스화기에 커다란 영향을 주는 요소로 나타났고, 압력과 증기 또한 주요 변수인 것으로 나타났다. 본 연구의 궁극적 목적은 석탄가스화기의 운전 조건을 최적화하는데 있다.

  • PDF

통행수단선택에 영향을 미치는 요인에 관한 연구 - 지역특성이 통행수단선택에 미치는 영향에 대해서 - (A study on the Factors Influencing Traveler's Mode Choice)

  • 권세나;김형진;손봉수
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 2007년도 제55회 학술발표회논문집
    • /
    • pp.181-190
    • /
    • 2007
  • 본 연구는 기존의 통행수단선택에 관한 연구들이 주로 다룬 개인 및 가구의 사회경제적특성에 관한 변수를 비롯하여 통행이 발생하는 지역의 특성에 관한 여러 가지 변수를 고려하여 통행수단 선택에 미치는 영향을 알아보고자 한다. 분석대상은 첨두시와 비첨두시의 대표적인 목적통행인 출근통행과 쇼핑통행으로 삼았으며 승용차, 버스, 지하철에 관한 다항로짓모형을 이용하였다. 연구결과, 변수들이 목적통행별로 상이한 영향을 미쳤고, 지역특성변수들이 모형의 설명력을 높여준다는 것을 알 수 있었다.

  • PDF