• Title/Summary/Keyword: 주요 변수 선택

Search Result 572, Processing Time 0.037 seconds

Accurate dam inflow predictions using SWLSTM (정확한 댐유입량 예측을 위한 SWLSTM 개발)

  • Kim, Jongho;Tran, Trung Duc
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.292-292
    • /
    • 2021
  • 최근 데이터 과학의 획기적인 발전으로 딥러닝(Deep Learning) 알고리즘이 개발되어 다양한 분야에 널리 적용되고 있다. 본 연구에서는 인공신경망 중 하나인 LSTM(Long-Short Term Memory) 네트워크를 기반으로 정확한 댐유입량 예측을 수행하는 SWLSTM 모델을 제안하였다. SWLSM은 모델의 정확도를 개선하기 위해 세 가지 주요 아이디어를 채택하였다. (1) 통계적 속성 (PACF) 및 교차 상관 함수(CCF)를 사용하여 적절한 입력 변수와 시퀀스 길이를 결정하였다. (2) 선택된 입력 예측 변수 시계열을 웨이블릿 변환(WT)을 사용하여 하위 시계열로 분해한다. (3) k-folds cross validation 및 random search 기법을 사용하여 LSTM의 하이퍼 매개변수들을 효율적으로 최적화하고 검증한다. 제안된 SWLSTM의 효과는 한강 유역 5개 댐의 시단위/일단위/월단위 유입량을 예측하고 과거 자료와 비교함으로써 검증하였다. 모델의 정확도는 다양한 평가 메트릭(R2, NSE, MAE, PE)이 사용하였으며, SWLSTM은 모든 경우에서 LSTM 모델을 능가하였다. (평가 지표는 약 30 ~ 80 % 더 나은 성능을 보여줌). 본 연구의 결과로부터, 올바른 입력 변수와 시퀀스 길이의 선택이 모델 학습의 효율성을 높이고 노이즈를 줄이는 데 효과적임을 확인하였다. WT는 홍수 첨두와 같은 극단적인 값을 예측하는 데 도움이 된다. k-folds cross validation 및 random search 기법을 사용하면 모델의 하이퍼 매개변수를 효율적으로 설정할 수 있다. 본 연구로부터 댐 유입량을 정확하게 예측한다면 정책 입안자와 운영자가 저수지 운영, 계획 및 관리에 도움이 될 것이다.

  • PDF

Variable Selection in Normal Mixture Model Based Clustering under Heteroscedasticity (이분산 상황 하에서 정규혼합모형 기반 군집분석의 변수선택)

  • Kim, Seung-Gu
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.6
    • /
    • pp.1213-1224
    • /
    • 2011
  • In high dimensionality where the number of variables are excessively larger than observations, it is required to remove the noninformative variables to cluster observations. Most model-based approaches for variable selection have been considered under the assumption of homoscedasticity and their models are mainly estimated by a penalized likelihood method. In this paper, a different approach is proposed to remove the noninformative variables effectively and to cluster based on the modified normal mixture model simultaneously. The validity of the model was provided and an EM algorithm was derived to estimate the parameters. Simulation studies and an experiment using real microarray dataset showed the effectiveness of the proposed method.

Network Theory Based Empirical Studies on the Factors Affecting Global Liners' Port Selection : Focused on Major Trade Port in Korea and China (Network 관점에서 본 글로벌해운선사의 항만선택 결정요인에 관한 연구 - 한국과 중국의 주요 무역항만을 대상으로 -)

  • Jang, Heung-Hoon;Han, Byoung-Sop
    • Journal of Korea Port Economic Association
    • /
    • v.25 no.2
    • /
    • pp.1-24
    • /
    • 2009
  • Transportation decisions of ship liners are crucial for policy formulation in ports and shipping lines. Ship liners' port selection depends on the location characteristic of port. With network theory based, we empirically investigated determinants of global ship liners' port selection focused on major trade ports in China and Korea during 1995-2007. We present a detailed discussion on the related literatures about port selection, and develop hypothesis using network-based view. With conditional logit model, empirical results show that global liners select globally positioned ports rather than domestic oriented ones. Global ship liners select ports which have intra national network centrality, global ship network centrality and global network linkage.

  • PDF

Environmental variable selection and synthetic sampling methods for improving the accuracy of algal alert level prediction model (변수 선택 및 샘플링 기법을 적용한 조류 경보 단계 예측 모델의 정확도 개선)

  • Jin Hwi Kim;Hankyu Lee;Seohyun Byeon;Jae-Ki Shin;Yongeun Park
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.517-517
    • /
    • 2023
  • 현재 우리나라에서는 4대강 및 주요 호소 29지점을 대상으로 조류경보제가 시행되고 있으며 조류 경보 단계는 실시간 모니터링지점에서 측정되는 유해 조류의 셀농도를 기반으로 발령 단계가 결정된다. 상수원 구간은 관심, 경계, 조류 대발생, 해제 또는 미발생 총 4구간으로 구성되며, 친수 활동 구간의 경우 조류 대발생을 제외한 3구간으로 구성된다. 현재 시행되는 조류 경보제의 목적은 유해 조류 발생 시 사후 대응 방안 마련에 보다 초점이 맞춰져 있으며 특히, 모니터링 주기 확대 여부, 오염원 관리 방안 마련, 조류 제거 여부 등의 의사 결정 수단으로 사용되고 있다. 하지만 조류 경보 단계에 대한 사전 예측이 가능한 경우 유해 조류의 성장을 억제할 수 있으며 이를 통해 안전하고 깨끗한 수자원을 확보할 수 있다. 본 연구에서는 조류 경보 단계의 사전적 예측을 위해 국가 실시간 측정망에서 제공하는 전국 보 모니터링 종합 정보 자료, 기상측정망 자료, 실시간 보 현황 자료를 활용하여 예측 모델을 구축하였다. 또한, 단계 예측의 정확도를 개선하기 위해 변수 선택 기법을 활용하여 조류 경보 단계에 영향을 미치는 환경변수를 선정하였으며 자료의 불균형으로 인해 모델 학습 과정에서 발생하는 예측 오류를 최소화하기 위해 다양한 샘플링 기법을 적용하여 모델의 성능을 평가하였다. 변수 선택 및 샘플링 기법을 고려하지 않은 원자료를 사용하여 예측 모델을 구축한 결과 관심 단계(Level-1) 및 경보 단계(Level-2)에 대해 각각 50%, 62.5%의 예측 정확도를 보인 반면 비선형 변수 선택 기법 및 Synthetic Minority Over-sampling Technique-Edited Nearrest Neighbor(SMOTE-ENN) 샘플링 기법을 적용하여 구축한 모델에서는 Level-1은 85.7%, Level-2는 75.0%의 예측 정확도를 보였다.

  • PDF

A Study on the Warrant of Permitted Left-Turning Movements based on the Korean Highway Capacity Manual (도로용량편람에 근거한 비보호좌회전 준거에 관한 연구)

  • 조원범;도철웅
    • Journal of Korean Society of Transportation
    • /
    • v.20 no.7
    • /
    • pp.31-41
    • /
    • 2002
  • 국내의 도로용량편람에 근거한 좌회전 신호의 선택기준은 4방향 접근로 각각의 방향별 교통량, 좌회전 전용차로의 유무, 차로수 등의 수많은 요인들을 통해 결정된다. 이 요인들은 각각의 특성에 따라 좌회전 신호의 선택기준에 미치는 영향력이 다르며 그 영향력의 크기에 따라 변수를 결정해야 한다. 그러나 국내에서 사용되고 있는 대부분의 좌회전 신호의 선택기준은 이러한 검토 없이 해당도로의 한 방향 좌회전 교통량과 이와 마주보며 진행하는 직진 교통량, 차로수만을 기준으로 결정되고 있다. 따라서 본 연구는 국내 도로용량편람의 알고리즘을 이용하여 좌회전 신호의 선택기준에 영향을 주는 주요 요인을 밝히고, 이 결과를 이용하여 임계좌회전 교통량 (비 보호좌회전 신호로 신호교차로의 운영효율을 극대화 할 수 있는 최대 좌회전 교통량)을 제시함으로서 비 보호 좌회전 준거를 설정하고자 하였다. 본 연구에 의한 결과는 다음과 같다. 첫째, 좌회전 신호의 선택기준에 영향을 주는 주요요인은 해당도로의 좌회전 교통량, 대향직진 교통량, 차로수, 교차도로의 교통량과 차로수이며, 이 요인들 중에서 해당도로의 차로수가 좌회전 신호의 선택기준에 가장 큰 영향을 미치는 것으로 분석되었다. 그러나, 비 보호좌회전은 일반적으로 2차로에서 운영되므로 보편적인 상황에서의 비 보호좌회전 신호의 선택기준은 해당도로의 좌회전 교통량. 대향직진 교통량 및 교차도로의 교통량에 좌우된다. 둘째, 대향직진 교통량이 커질수록 임계좌회전 교통량은 감소하는 것으로 분석되었다. 셋째. 교차도로의 교통량이 커질수록 임계좌회전 교통량은 감소하는 것으로 분석되었다.

A Study on Collusion Effects for Bid Award in Public Construction Works (공공 건설공사 담합이 낙찰에 미치는 영향 분석 연구)

  • Kim, Myeongsoo
    • Korean Journal of Construction Engineering and Management
    • /
    • v.21 no.1
    • /
    • pp.12-20
    • /
    • 2020
  • To estimate collusion effects on bid award in Public Construction works, this paper uses Logit Model, which is a choice variable model. Price, design, competition, and other factors are included, with a special focus on collusion, as independent variables in the model. The empirical results are as follows. First, collusion has little effects on bid award, but great impacts on bidding behavior. Secondly, the score of design is the most important and significant factors among all variables. Thirdly, competition has also significant effects on bid award. Finally it is analyzed that institutional framework and characteristics of public work have some effects on bidding award.

A Critique of Conventional Nonmarket Valuation - Attitudes and Action - (비시장 가치평가에 대한 비판적 고찰 - 선택행동과 심리변수에 대해서 -)

  • Choi, Andy Sungnok;Bennett, Jeff
    • Environmental and Resource Economics Review
    • /
    • v.15 no.5
    • /
    • pp.885-919
    • /
    • 2006
  • This paper revisits two conventional beliefs of environmental nonmarket valuation and examines their weaknesses and a new opportunity. The two beliefs are that willingness to pay (WTP) is an appropriate measure of nonmarket behaviour and that exogenous variables are relevant predictors of WTP whilst endogenous variables are not. The contemporary literature in psychology and economics is reviewed to demonstrate departures from these two beliefs. Tackling heterogeneity in stated preferences, both socio-demographic and psychological variables should be measured simultaneously to explain and predict choice behaviours more accurately.

  • PDF

IoT-based Feature Selection Technique Research Trend (IoT 기반의 특징 선택 기법 연구 동향)

  • Lim, Hwan-Hee;Lee, Tae-Ho;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.41-42
    • /
    • 2018
  • 특징 선택이란, 기계학습에서 분류 정확도를 향상시키기 위해서 많은 특징들을 분석해 가장 좋은 성능을 나타낼 수 있게끔 특징의 부분집합을 찾아내는 방법이다. 특징 선택 연구는 수십만개의 변수가 있는 데이터 세트를 이용하는 응용분야에서 주로 연구된다. 이러한 응용 분야는 주로 텍스트 처리, 유전자 배열 분석과 같은 고차원 데이터를 분석하는 분야이다. 또한, IoT 환경은 많은 데이터를 처리하기 때문에, 데이터 분류나 데이터의 가공을 위해서는 특징 선택 기법이 필수적이다. 본 논문에서는 특징 선택 기법에 대해 설명하고, IoT 환경에서 특징 선택 기법을 제안한다.

  • PDF

Movie Box-office Prediction using Deep Learning and Feature Selection : Focusing on Multivariate Time Series

  • Byun, Jun-Hyung;Kim, Ji-Ho;Choi, Young-Jin;Lee, Hong-Chul
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.6
    • /
    • pp.35-47
    • /
    • 2020
  • Box-office prediction is important to movie stakeholders. It is necessary to accurately predict box-office and select important variables. In this paper, we propose a multivariate time series classification and important variable selection method to improve accuracy of predicting the box-office. As a research method, we collected daily data from KOBIS and NAVER for South Korean movies, selected important variables using Random Forest and predicted multivariate time series using Deep Learning. Based on the Korean screen quota system, Deep Learning was used to compare the accuracy of box-office predictions on the 73rd day from movie release with the important variables and entire variables, and the results was tested whether they are statistically significant. As a Deep Learning model, Multi-Layer Perceptron, Fully Convolutional Neural Networks, and Residual Network were used. Among the Deep Learning models, the model using important variables and Residual Network had the highest prediction accuracy at 93%.

A Selection-Deletion of Prime Implicants Algorithm Based on Frequency for Circuit Minimization (빈도수 기반 주 내포 항 선택과 삭제 알고리즘을 적용한 회로 최소화)

  • Lee, Sang-Un
    • Journal of the Korea Society of Computer and Information
    • /
    • v.20 no.4
    • /
    • pp.95-102
    • /
    • 2015
  • This paper proposes a simple algorithm for circuit minimization. There are currently two effective heuristics for circuit minimization, namely manual Karnaugh maps and computable Quine-McCluskey algorithm. The latter, however, has a major defect: the runtime and memory required grow $3^n/n$ times for every increase in the number of variables n. The proposed algorithm, however, extracts the prime implicants (PI) that cover minterms of a given Boolean function by deriving an implicants table based on frequency. From a set of the extracted prime implicants, the algorithm then eliminates redundant PIs again based on frequency. The proposed algorithm is therefore capable of minimizing circuits polynomial time when faced with an increase in n. When applied to various 3-variable and 4-variable cases, it has proved to swiftly and accurately obtain the optimal solutions.