• 제목/요약/키워드: 회귀 모형 함수

검색결과 294건 처리시간 0.032초

희소주성분분석을 이용한 텍스트데이터의 단어선택 (Feature selection for text data via sparse principal component analysis)

  • 손원
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.501-514
    • /
    • 2023
  • 텍스트데이터는 일반적으로 많은 단어로 이루어져 있다. 텍스트데이터와 같이 많은 변수로 구성된 데이터의 경우 과적합 등의 문제로 분석에 있어서의 정확성이 떨어지고, 계산과정에서의 효율성에도 문제가 발생하는 경우를 흔히 볼 수 있다. 이렇게 변수가 많은 데이터를 분석하기 위해 특징선택, 특징추출 등의 차원 축소 기법이 자주 사용되고 있다. 희소주성분분석은 벌점이 부여된 최소제곱법 중 하나로 엘라스틱넷 형태의 목적함수를 사용하여 유용하지 않은 주성분을 제거하고 각 주성분에서도 중요도가 큰 변수만 식별해내기 위해 활용되고 있다. 이 연구에서는 희소주성분분석을 이용하여 많은 변수를 가진 텍스트데이터를 소수의 변수만으로 요약하는 절차를 제안한다. 이러한 절차를 실제 데이터에 적용한 결과, 희소주성분분석을 이용하여 단어를 선택하는 과정을 통해 목표변수에 대한 정보를 이용하지 않고도 유용성이 낮은 단어를 제거하여 텍스트데이터의 분류 정확성은 유지하면서 데이터의 차원을 축소할 수 있음을 확인하였다. 특히 차원축소를 통해 고차원 데이터 분석에서 분류 정확도가 저하되는 KNN 분류기 등의 분류 성능을 개선할 수 있음을 알 수 있었다.

요인분석 통계기법을 이용한 댐 운영에 대한 영향 요인 추출 (Extraction of Primary Factors Influencing Dam Operation Using Factor Analysis)

  • 강민구;정찬용;이광만
    • 한국수자원학회논문집
    • /
    • 제40권10호
    • /
    • pp.769-781
    • /
    • 2007
  • 요인분석은 시스템이나 현상에 대한 정보를 하고 관련 자료를 축약하는데 사용되는 다변량 분석기법의 하나이다. 이 기법은 변수들을 통계적 특성을 고려하여 몇 개의 요인들로 그룹화하고 분석결과는 중요도가 상대적으로 낮은 변수를 제거하는데 이용이 된다. 본 연구에서는 요인분석을 한강수계의 댐 군 연계운영에 대한 영향요인 추출에 적용하였다. 한강 수계에는 소양강댐, 충주댐과 같은 2개의 다목적 댐이 있으며, 이들은 이수기에 연계 운영되어 하류로 용수를 공급하고 발전을 실시하고 있다. 요인분석을 실시하기 위하여, 먼저 댐 운영에 관련된 자료(변수)들을 5개의 대분류(유입량, 용수수요량, 발전량, 저류량, 과거 운영 실적)로 나누어 수집하였다. 통계적 특성을 고려하여 수집된 변수 중에서 13개와 15개의 변수가 각각 선정되어 5개의 요인(소양강댐: 수문조건, 과거 댐 운영, 평수기 댐운영, 저류량 관리, 하류 댐 운영; 충주댐: 수문조건, 과거 댐 운영, 평수기 댐 운영, 용수수요, 하류 댐 운영)으로 분류되었다. 요인분석 결과의 적절성과 적용성을 평가하기 위하여 선정된 요인들을 설명변수로 이용하여 소양강댐과 충주댐의 연간 발전량을 예측하는 다중회귀모형을 개발하여 결과의 적용성을 평가하였으며, 댐군 운영에 사용된 목적함수들의 구성항목들과 비교하여 요인선정의 적절성을 평가하였다. 두 가지 고찰 과정을 통하여 본 연구에서 적용된 요인 추출방법이 만족할 만한 결과를 나타냄을 알 수 있었다. 또한, 추출된 요인들은 미래 상황과 과거 결과를 고려한 댐 운영 계획 수립에 적용이 가능할 것으로 사료된다.분뇨내 악취물질 발생량을 감소 시켰다. 운전 중 전체 공정은 안정적으로 작동하는 것을 확인할 수 있었다. 본 연구를 통해 다단계 막분리 공정을 통한 배가스에서 $CO_2$를 성공적으로 분리할 수 있었다.(AFM)과 Scanning Electron Microscopy(SEM)을 통해 관찰한 GST 다층박막시료의 고온 열처리 전후 표면미시거칠기 변화도 PRAM 기록기를 사용할 때에는 in-situ 타원계를 사용할 때보다 1/10 정도의 크기를 보여주어 PRAM 기록기와 분광타원계를 사용하여 결정한 GST의 고온광학물성의 신뢰성을 확인하여 주었다.>, 여자 $179.1{\pm}37.2%$이었다. 평균필요량에 비해 가장 낮은 양을 섭취한 영양소는 엽산으로서 남자 $60.1{\pm}10.8%$, 여자 $54.6{\pm}9.9%$로 조사되었다. 칼슘의 섭취량은 평균필요량에 비해 전체 $74.9{\pm}31.9%$로 나타났다. 에너지 섭취량에 있어서 남자 노인들은 모두가 필요추정량의 75% 미만을 섭취하고 있었고 여자 노인의 경우에도 97%가 필요추정량의 75% 미만을 섭취하여 에너지 섭취량이 매우 낮았다 반면에 단백질 섭취량에 있어서는 남자 노인의 경우 100%가 평균필요량의 125%를 초과하였고, 여자 노인의 경우에는 91%가 평균필요량의 125%를 초과하여 대조적이었다. 비타민 A와 E는 각각 평균필요량과 충분섭취량의 125%를 초과하는 비율이 높게 나타난 반면에 비타민 $B_2$

한국의 대미국 수출 결정요인의 장기적 영향에 관한 연구 (An Study on Long Run Effects of Determinants on Export of Korean Goods to US)

  • 최문성
    • 통상정보연구
    • /
    • 제16권5호
    • /
    • pp.409-433
    • /
    • 2014
  • 본 연구에서는 미국의 실질GDP와 원/달러 실질환율을 독립변수로 하고, 한국의 대미국 실질수출을 종속변수로 하는 한국의 대미국 수출함수를 설정하여 1990년부터 2013년까지의 연간 자료를 통해 이들 독립변수들의 한국의 대미 수출에 대한 장기탄력성을 추정하고, 이들의 연도별 변화추세를 살펴보았다. 공적분 검정과 VECM을 통해 구한 장기 추정식의 분석결과 장기소득탄력성과 장기환율탄력성 모두 양(+)의 부호를 가지는 것으로 나타나 이론적인 예상과 일치하였다. 한편, 전향적 회귀분석을 통한 연도별 장기탄력성 분석한 결과 장기소득탄력성은 2008년 글로벌 금융위기 전까지 비교적 높은 수준을 유지하다가 2008년 글로벌 금융위기 이후 급격한 감소를 보였으나, 최근 다시 2000년대 수준으로 다시 회복세를 보인 것으로 나타났다. 연도별 장기실질환율탄력성의 경우 모형과 연도에 따라 양(+)의 부호와 음(-)의 부호가 혼재되어 나타났고, 2008년 글로벌 금융위기 이후의 원/달러 실질환율에 대한 대미 한국수출의 민감도가 감소한 것으로 분석되었다.

  • PDF

국가 특성이 창업활동에 미치는 영향 실증 분석 (Seeking for the Determinants of Entrepreneurship from National Level Data)

  • 김형준;민태기;왕정복;디아나쉴러;오근엽
    • 벤처창업연구
    • /
    • 제15권6호
    • /
    • pp.55-65
    • /
    • 2020
  • 본 연구는 국가 경제 성장과 관련된 창업 (start-up) 활동에 영향을 미치는 요인을 분석하는 국가 수준에서의 실증 연구이다. 창업 활동의 기반인 기업가정신에 대한 개인 수준에서 분석과 달리 GEM (Global Entrepreneur Monitor)에서 발행한 연간 데이터베이스를 활용한 실증 분석을 수행하였다. 나라별 초기창업활동 (TEA: total early-stage entrepreneurial activity) 지수를 이용하여 TEA에 영향을 미치는 영향요인을 경제 요인과 비경제적 요인을 구분하여 분석하였다. 선행 연구를 기반으로 국민소득 수준, 실업률을 포함하여 국가의 문화적 특성 변수 등 9개 요인을 국가 창업 활동의 영향 요인으로 제시하였으며 경제발전 수준에 따라 요소주도형, 효율주도형, 혁신주도형으로 국가를 구분한 패널데이터를 회귀 분석 모형을 통하여 실증 분석하였다. 본 연구의 분석 결과, 기존연구들에서 설명하고 있는 국민소득 수준과 창업 활동 사이의 U자 형태'를 명시적인 2차 함수 회귀분석을 통하여 추정하였으며 그에 따라 창업활동의 변곡점이 되는 소득수준을 발견하였다. 이러한 결과를 통해서 요소주도형 및 효율성주도형 경제에서는 생계형 창업활동이 활발한 반면 혁신주도형 경제에서는 기회추구형 창업활동이 활발하다는 기존의 주장들을 설명할 수 있음을 보였다. 특히, 창업활동 활성화를 위한 정부지원 프로그램에 대해 실증분석해 본 결과, 요소주도형 및 효율성주도형 경제에서는 유의한 긍정적 효과를 미치고 있으나 혁신형 경제에서는 그 효과가 오히려 부정적이라는 결과를 발견하였다. 이는 창업지원 정책이 경제발전단계에 따라 달라져야 함을 보여주는 결과로서 많은 정책적 시사점을 제시한다. 마지막으로 창업관련 교육의 정도와 새로운 비즈니스를 지원하는 사회문화적인 규범으로서의 창업 문화는 국가의 경제 수준과 상관없이 모두 창업활동에 긍정적인 영향을 미치고 있음을 발견하였다. 이는 어느 단계의 경제이든 창업 문화 조성이 필요하다는 시사점을 함축하고 있다.

고속열차 객차의 임계속도 향상에 관한 연구 (A Study on Critical Speed Enhancement of High-speed Train Passenger Car)

  • 전창성
    • 한국산학기술학회논문지
    • /
    • 제17권12호
    • /
    • pp.603-610
    • /
    • 2016
  • 국내에 고속열차가 도입된 지 12년이 지났고, 국내기술로 개발된 KTX-산천도 운행한지 6년 정도 되었다. 호남선 고속철도의 개통으로 현재 국내 고속선로의 수송용량은 거의 포화상태가 되었고, 이에 따라 수송용량을 증대하기 위하여 열차의 운행속도를 높이는 연구 등 다양한 연구가 수행되고 있다. 본 연구는 그 중 일부로 KTX-산천 고속열차의 운행속도를 350km/h로 높이기 위하여 열차의 임계속도를 향상시키기 위해 수행되었다. KTX와 KTX-산천 영업운행 차량에서 측정된 차륜마모 데이터를 이용하여 KTX-산천 편성 모델에 대한 동역학해석을 수행하였고, KTX-산천 영업차량에서 측정된 진동가속도 측정결과와의 비교를 통하여 해석결과의 타당성을 검증하였다. 고속열차의 운행속도 향상을 위하여 열차의 임계속도 향상을 목표로 대차 주요 현가장치 파라미터에 대한 최적화 연구를 수행하였다. 민감도 분석을 통해 최적화를 위한 주요 현가장치 파라미터를 선정하였고, 반응표면분석법에 의해 2차 회귀 모형 함수를 추정하였다. 2차의 목적함수를 최소화시키는데 있어서 효율적인 성능을 발휘하는 SQP 방법을 사용하여 최적화를 수행한 결과 KTX-산천의 임계속도가 9.4%정도 증가함을 확인하였다. 최적화된 현가장치 파라미터는 KTX-산천 영업속도를 300km/h에서 350km/h로 향상시키기 위한 신규대차 설계 시 반영될 예정이다.

국제 자본이동과 환율 변동성에 관한 연구: 주요 통화대비 원화 환율을 중심으로 (The Relationship Between International Capital Flows and Foreign Exchange Volatility)

  • 최돈승
    • 무역학회지
    • /
    • 제42권4호
    • /
    • pp.1-20
    • /
    • 2017
  • 본 연구는 우리나라를 대상으로 국제 자본이동과 주요 통화대비 원화 환율 간의 동태적 관계를 분석하고 있다. 우선 그랜저 인과관계 검정 결과에 의하면 국제 자본이동은 단기적으로 주요 통화대비 원화 환율의 변동성에 Granger-cause하는 것으로 나타났다. 하지만 시간이 흐를수록 환율의 변동성이 국제 자본이동에 Granger-cause하는 것을 확인할 수 있었다. 글로벌 금융위기를 기준으로 전과 후를 구분하여 분석한 결과에 의하면 글로벌 금융위기 전에는 국제 자본이동이 원/달러 환율의 변동성에만 유의한 영향을 미치는 것으로 나타났지만, 글로벌 금융위기 이후의 기간에서는 환율의 변동성이 오히려 국제 자본이동에 Granger-cause하는 것으로 나타났다. VAR모형을 바탕으로 일반화된 충격반응함수의 그래프를 살펴보면 국제 자본이동과 환율 변동성은 금융위기를 기준으로 다른 양상을 보이고 있다. 글로벌 금융위기가 발생한 후에는 환율의 변동성이 국제 자본이동을 촉진하지만 시간이 흐르면서 그 영향력이 축소되는 반면 이전 기간에는 이러한 관계가 성립하지 않는다는 것을 알 수 있다. 이러한 실증분석 결과를 종합해보면 우리나라에서는 외환시장의 불확실성이 국제 자본이동에 중요하게 작용한다는 것을 알 수 있다. 따라서 국제 자본이동에 대한 직접적인 규제보다는 외환시장의 불확실성을 적절하게 통제하는 것이 더 효과적인 정책수단이 될 수 있을 것이다.

  • PDF

도시기반시설이 공동주택가격에 미치는 영향분석에 관한 연구 - 전력통신시설(변전소)을 중심으로 - (A Study on the Analysis of Apartment Price affected by Urban Infrastructure System - Electricity Substation)

  • 황성덕;정문오;이상엽
    • 한국건설관리학회논문집
    • /
    • 제16권1호
    • /
    • pp.74-81
    • /
    • 2015
  • 도심기반시설은 도시 내 인간의 활동을 위해 필수적으로 공급해야 할 시설이나 도심 내의 입지선정과 관련하여 위험시설로 인식되어 많은 갈등이 야기되고 있다. 대표적인 도심의 통신전력 기반시설인 변전소 역시 전력수요의 증가에 따라 도심지에 반드시 존치해야 함에도 불구하고 사회민원이 발생함에 따라 이러한 갈등을 구체적이고 과학적인 근거에 따라 판단하고 객관적인 해결방안을 도출할 필요가 있게 되었다. 이에 본 연구에서는 아파트 가격을 결정짓는 일반적인 요소들과 아파트 단지와 변전소의 직선상의 거리를 독립변수로 사용하고, 아파트 가격을 종속변수로 단위면적당 매매가를 선정하여, 시설 위치를 포함한 아파트가격 결정요인들이 각각 어떠한 영향을 주었는지를 헤도닉 가격모형을 활용한 회귀분석과 인공신경망 분석을 통해 분석하였다. 결과 일부 대상 변전소의 경우 아파트 단지와 거리가 가까울수록 매매가격이 떨어지며 변전소가 아파트가격에 미치는 영향력의 범위는 600m이내 인 것으로 나타났다. 본 연구에서는 변전소의 입지가 아파트 가격에 영향을 미치는지를 객관적 데이터와범 용적인 모형으로 분석함으로써, 변전소의 입지가 부동산의 경제적 가치를 분석하는 방법적 토대를 제공하였다.

주택가격 결정인자의 공간적 다양성 모델링 (Modelling Spatial Variation of Housevalue Determinants)

  • 강영옥
    • 대한지리학회지
    • /
    • 제39권6호
    • /
    • pp.907-921
    • /
    • 2004
  • 주택은 여러 가지 요인들의 집합체로 구성되기 때문에 헤도닉 기법을 이용하여 개개요인들의 주택에 내재된 가격을 현시화하고자 하는 연구가 많이 수행되었다. 그러나 이러한 요인들은 서로 상호작용할 수 있으며. 공간적으로 변화할 수 있다는 것을 설명하는데 한계를 가지고 있다. 본 연구는 서울시의 공동주택을 대상으로 주택가격에 영향을 미치는 결정요인들이 공간적으로 다양하게 변화함을 모델링하고자 하였다. 주택가격에 영향을 미치는 인자들간의 상호작용을 밝히기 위해 Casetti의 확장형 회귀분석방법을 사용하였다. 본 연구의 주요결과를 살펴보면 다음과 같다. 초기모델에서는 서울의 공동주택가격을 추정함에 있어 주택규모, 근린환경 특성. 그리고 강남의 재건축아파트 여부가 주요 요인으로 작용하였다. 그러나 이러한 특성들은 도심, 부도심, 강과의 인접성 여부라는 접근성변수에 따라 서로 다르게 상호작용하고 있었다. 주택의 규모가 작은 공동주택은 도심이나 부도심까지의 거리에 따른 주택가격의 변동이 거의 없었으나, 주택의 규모가 큰 공동주택은 부도심에 가깝고, 강에 인접할수록 주택가격은 크게 상승하였다. 반면 부도심에서 거리가 먼 지역에서는 자가주택과 아파트 비율의 변화에 따른 주택가격의 변동이 심하지 않았으나, 부도심에서 가까운 지역에서는 자가주택과 아파트의 비율이 높은 지역에 위치한 공동주택일수록 주택가격은 크게 상승하였다. 모델의 잔차분석에서는 강남, 이촌동, 목동등의 대형평수 아파트들이 과소추정되고 있음을 나타내어 하부주택시장별로 서로 다른 주택가격모형을 적용할 필요성이 있음을 시사하고 있었다.

최대경계선을 이용한 벼 수량의 기상반응분석과 수량 예측 I. 최대경계선 분석과 수량예측모형 구축 (Upper Boundary Line Analysis of Rice Yield Response to Meteorological Condition for Yield Prediction I. Boundary Line Analysis and Construction of Yield Prediction Model)

  • 김창국;이변우;한원식
    • 한국작물학회지
    • /
    • 제46권3호
    • /
    • pp.241-247
    • /
    • 2001
  • 우리나라 벼 수량의 기상반응을 종합적으로 검토하여 벼 수량예측모델을 구축하고자 1985년부터 1999년까지 15년간 수행한 20개 지역의 벼 지역적응시험 자료를 이용하여 기상에 대한 수량반응의 최대경계선(boundary line)분석을 하였으며, 이에 근거하여 수량예측모형을 설정하였다. 1. 벼의 생육기간을 영양생장기, 생식생장기, 등숙기로 구분하고 각 발육단계를 15-20일 간으로 구분하여 각 시기의 기상요소에 대한 수량반응의 최대경계선은 평균기온( $T_{a}$ )과 일조시수( $S_{h}$)에 대해서는 지수함수 f( $T_{a}$ )=$\beta$$_{0}$(1-exp(-$\beta$$_1$/$\times$ $T_{a}$ ), f( $S_{h}$)=$\beta$$_{0}$(1-exp(-$\beta$$_1$$\times$ $T_{h}$)로 나타났으며 일교차(Tr)는 2차함수 f( $T_{r}$)=$\beta$0(1-( $T_{r}$-$\beta$$_1$)$^2$)로, 이 식에서 상수항 $\beta$$_{0}$를 제거하여 수량에 대한 각 기상요소의 영향도를 0-1로 나타내는 기상지수로 나타내었다. 2. 각 생육시기의 평균기온, 일조시간 및 일교차에 대한 수량반응의 최대경계선이외에 불임에 의한 등숙률 저하와 그에 따른 수량감소를 고려하기 위하여 Uchijima(1976)가 제안한 냉각도일수(cooling degree day)를 출수전 30일간의 생식생장기에 계산하여 이에 대한 수량과 등숙률 반응의 최대경계선을 계산하였는데 냉각도일수가 증가하면 수량이 감소하는 지수함수로 잘 표현되어 기존의 연구들과 같은 결과였다. 3. 기상지수는 벼의 생육기간을 영양생장기, 생식생장기 및 등숙기로 구별하고 각 시기별로 수량 기상지수를 각 기상요소 기상지수를 기하평균하여 산출하였는데 각 시기별 수량기상지수의 수량변이 설명도는 각각 0.383-0.430, 0.460-0.534, 0.4603-0.587로 결정계수는 영양생장기<생식생장기<등숙기의 순으로 컸다. 4. 최대경계선 분석방법을 통하여 얻어진 각 생육시기별 수량기상지수를 기하평균하여 구한 종합수량기상지수와 수량과의 직선회귀식을 구하여 수량예측모형(Model I, II, III)을 작성하였다. Model I, II, III)은 각각 결정계수가 0.6512, 0.6703, 0.6129로 모든 생육단계에 걸쳐서 기간을 15-20일 단위로 세분하여 모든 기간의 수량에 대한 기상지수를 고려하여 전 생육기간의 종합수량기상지수를 산출한 Model II가 기상변화에 따른 수량변이의 설명도가 가장 높았다.

  • PDF

아파트가격에 내재된 도로교통소음가치 추정 (Estimation of the Value of Road Traffic Noise within Apartment Housing Prices)

  • 임영태;손의영
    • 대한교통학회지
    • /
    • 제19권4호
    • /
    • pp.19-33
    • /
    • 2001
  • 선진 외국과는 달리 우리나라의 경우 외부효과의 계측과 가치화에 대한 노력이 미미하여, 공학적 뿐만 아니라 경제학적 입장에 입각하여 교통소음 이라는 환경재에 대한 가치화를 대도시 도로주변 아파트가격과 실제 소음측정을 통해 본 논문에서 최초로 분석하였다. 그리고 본 논문의 목적은 자동차 소음이라는 환경재의 비시장적 가치를 시장가치로 환산하여 아파트 가격에 내재된 소음가치를 특성가격기법과 회귀분석에 의해 추정하는 것이었다. 즉 소음수준에 따라서 아파트 매매가격에 영향을 미치는 정도가 다르므로 소음차이로 인한 아파트 매매가격에 내재된 한계소음가격 도출이 가능하였다. 구체적으로는 평형대별 한계소음가격을 도출함으로써 소음 IdB(A)의 증가(혹은 감소)가 주택가격에 미치는 영향의 정도를 분석하였다. 본 논문에서 도출된 결과를 정리해 보면, 먼저 대도시권의 교통소음이 아파트 가격에 내재된 가치를 추정하기위해 $\ulcorner$준-특성가격기법$\lrcorner$을 이용하였으며, 자료의 한계를 극복하기 위하여 소음변수를 제외한 다른 요인에 의한 주택가격 차이를 제거할 수 있는 표본을 선정하고, 선정된 표본집단의 소음수준을 측정한 자료를 활용하여 소음에 의한 주택가격의 한계소음가치를 측정하였다. 선형, 준로그, 역준로그, 이중로그 회귀모형식을 이용하여 소음수준에 따른 주택가격 차이를 분석하였으며, 그 중에서도 이중로그 함수식이 가장 적합성이 뛰어난 모형으로 나타났다. 한계소음가격은 대상지역과 주택의 평수에 따라 상당히 다른 것으로 분석되었다 즉, 서울시 지역의 소음가격은 경기도 지역보다 높은 것으로 나타났다. 또한, 큰 평수의 주택이 적은 평수의 주택보다 소음가격이 높은 것으로 나타났다. 한편, 서울시와 경기도에 있어서 소음 IdB증가가 주택가격에 미치는 영향은 서울시 주택가격이 경기도 주택가격에 비해 거의 3배나 되기 때문에 이들 두 지역에서의 소음 IdB증가가 주택가격에 미치는 영향에는 별 차이가 없었다. 즉, 서울시와 경기도의 소음 IdB증가가 주택가격에 미치는 영향은 평균 0.3%로 추정되었으며, 평형대별로는 규모가 큰 평수일수록 소음 IdB증가가 주택가격에 미치는 영향은 높은 것으로 분석되었다. 이상의 연구결과를 통해 볼 때 본 논문에서 도출된 교통소음의 가치를 교통시설의 타당성 평가에 적용할 수 있을 것으로 판단된다.

  • PDF