• Title/Summary/Keyword: 발생빈도값

Search Result 488, Processing Time 0.037 seconds

A Fuzzy Clustering Algorithm for Clustering Categorical Data (범주형 데이터의 분류를 위한 퍼지 군집화 기법)

  • Kim, Dae-Won;Lee, Kwang-H.
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.13 no.6
    • /
    • pp.661-666
    • /
    • 2003
  • In this paper, the conventional k-modes and fuzzy k-modes algorithms for clustering categorical data is extended by representing the clusters of categorical data with fuzzy centroids instead of the hard-type centroids used in the original algorithm. The hard-type centroids of the traditional algorithms had difficulties in dealing with ambiguous boundary data, which might be misclassified and lead to thelocal optima. Use of fuzzy centroids makes it possible to fully exploit the power of fuzzy sets in representing the uncertainty in the classification of categorical data. The distance measure between data and fuzzy centroids is more precise and effective than those of the k-modes and fuzzy k-modes. To test the proposed approach, the proposed algorithm and two conventional algorithms were used to cluster three categorical data sets. The proposed method was found to give markedly better clustering results.

Minimum magnitudes of earthquake catalog of Korea Meteorological Agency for the estimation of seismicity parameters (지진활동 매개변수 추정을 위한 기상청 지진목록의 최소규모 분석)

  • Noh, Myung-Hyun;Lee, Sang-Kook;Choi, Kang-Ryong
    • Journal of the Korean Geophysical Society
    • /
    • v.3 no.4
    • /
    • pp.261-268
    • /
    • 2000
  • Minimum magnitudes $(M_c)$ for estimation of seismicity parameters were analyzed for the earthquake catalog of Korea Meteorological Agency (KMA). The temporal variation of earthquake frequency suggests that a proper $M_c$ be 3.0 for the whole southern part of the Korean Peninsula. The b-value with $M_c$ of 3.0 is estimated to be 1.11, which is larger than those of the previous studies. To see the spatial variation of $M_c$, the southern part of the peninsula were divided into grids of $0.1{\times}0.1$ degree. At the greater portion of grid points, the local earthquake catalogs do not satisfy given statistical criteria. The grid points whose local earthquake catalogs meet the criteria mostly distribute in the eastern part. $M_c$ at these points range 2.4 to 3.5 and b values range 0.75 to 1.73 with the average of 1.08 which is comparable to that for the whole southern part of the peninsula.

  • PDF

A study on early operation in pumping station of flood stage prediction using neural network (신경망을 이용한 수위예측에 따른 빗물펌프장 조기가동)

  • Song, Yang Ho;Park, Moo Jong;Lee, Jung Ho
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.630-630
    • /
    • 2015
  • 기존의 내배수시설에 대한 모의 및 시스템 운영과 관련하여 기존의 연구들은 강우의 설계빈도 및 제한적 호우 시나리오에 국한된 침수의 모의 및 대응에 기반을 하고 있다. 이러한 연구들의 경우 해석에 따른 모의결과에 기반하고 있기 때문에 도시지역에 실시간으로 발생하는 수문현상을 적절하게 반영하지 못하고 있으며, 이에 따른 내배수시설의 효율적 운영 및 침수발생 지점의 예측에 대한 불확실성이 크다고 볼 수 있다. 본 연구에서는 도시하천에서의 외수위 변화 예측에 따른 단기간 내 펌프 조기가동의 효과를 검토에 따른 향후 내수침수 위험성을 감소시키고자 한다. 인공신경망을 이용하여 보다 정확한 단기간 내 외수위 변동성에 대한 분석을 실시하였으며, 상하류 관측수위 기반 펌프 조기가동에 대한 운영 알고리즘을 개선하고자 한다. 이를 위해 최근 몇 년간의 하천의 홍수사상들 중 교차상관계수($R^2$) 값이 비교적 높은 다수의 수문 관측 사상들을 수집 및 적용이 필요하다고 판단되었으며 도림천 유역 내에 위치한 펌프장들에 대한 외수위 관측자료들을 수집하여 연구에 적용하였다. 인공신경망 구성을 위해 입력값으로는 상류지점의 관측 수위지점 자료를 지정하여 입력을 실시하였으며, 출력값으로는 하류단 수위지점 자료를 지정하여 수위 예측을 실시하였다. 다만 수위예측의 경우에 있어 수위를 가장 잘 대변할 수 있는 수위관측소를 선정하는 것이 매우 중요하다고 판단되었으며, 해당 연구에서는 주요 빗물펌프장들의 외수위 자료를 대표 적용하였다. 선정된 지점과 하류의 수위예측지점을 연계하여 운영할 경우 효율적인 수위 예측이 가능하기 때문이다. 결과적으로 수위관측소 지점이 빗물펌프장임을 감안하여 상류단 빗물펌프장의 유역특성이 반영된 유출특성 및 토출특성으로 인하여 하류의 수위 변동에 영향을 미치며 이는 펌프장의 방류수문 개폐시기 및 조기가동의 시점을 선정하는데 있어 밀접한 연관이 있다고 판단된다.

  • PDF

A survey on the Minimum Time Scale by Southern Region of the Korean Peninsula for Daily SPI Application (일 단위 SPI 적용을 위한 한반도 남부지역별 최소 시간 척도 조사)

  • Chae Lim Lee;Ji Yu Seo;Jeong Eun Won;Sang Dan Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.328-328
    • /
    • 2023
  • 표준강수지수(Standardized Precipitation Index, SPI)는 강수량 변동의 정도를 표준화하여 나타낸 지수로, 가뭄 평가에 적용되고 있다. 일반적으로 SPI를 산정할 때는 월 단위의 시간 척도를 적용하며, 장기간의 가뭄에 대해 평가한다. 그러나 시간 척도가 길어질수록 가뭄 발생 후 가뭄을 감지하는 데 걸리는 시간이 더 길어지기 때문에 대처가 더욱 어려워진다. 또한, 기후변화로 인해 가뭄 빈도가 증가하고, 그 정도가 더욱 심화되면서 일 단위의 적용이 필요해지고 있다. 본 연구는 한반도 남부지역을 대상으로 일 단위의 SPI 적용을 위한 최소 시간 척도를 조사하였다. 대상 지역을 강원권, 수도권, 부울경, 대경권, 호남권, 충청권의 총 6개 지역으로 분리하여, 각 지역별, 계절별 최소 시간 척도를 조사하였다. SPI 산정을 위해 후보 분포형으로 Gumbel, Gamma, GEV, Loglogistic, Lognormal, Weibull을 적용하였으며, 시간 척도는 5일부터 365일까지 총 10개로 설정하였다. 본 연구에선 크게 적합도 검정과 정규성 검정으로 진행하였다. 적합도 검정에서는 Chi-square test를 적용하였으며, 이때 일 단위의 짧은 시간 척도를 적용할 경우 누가 강수 시계열의 값이 0으로, 0값이 시계열에 포함되면 SPI의 정확도가 떨어지는 문제가 발생하는데, 이를 보완하기 위해 누가 강수 시계열의 0값을 고려하였다. 마지막으로 각 후보 분포형을 적용하여 산정된 SPI가 표준정규분포에 합당한지를 검증하기 위해 Anderson-Darling test를 수행하였다. 결과적으로 대부분의 지역에서는 봄과 여름의 경우 최소 15일 정도의 시간 척도까지는 적용할 수 있을 것으로 판단되며, 겨울의 경우는 최소 30일 정도의 시간 척도를 적용해야 함을 확인하였다. 지역별로 차이가 크진 않지만, 이러한 연구 결과를 참고하여 각 지역별로 더 나은 가뭄 대책을 마련할 수 있을 것으로 기대된다.

  • PDF

Evaluation of Rainfall Erosivity Factor Estimation Using Machine and Deep Learning Models (머신러닝 및 딥러닝을 활용한 강우침식능인자 예측 평가)

  • Lee, Jimin;Lee, Seoro;Lee, Gwanjae;Kim, Jonggun;Lim, Kyoung Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.450-450
    • /
    • 2021
  • 기후변화 보고서에 따르면 집중 호우의 강도 및 빈도 증가가 향후 몇 년동안 지속될 것이라 제시하였다. 이러한 집중호우가 빈번히 발생하게 된다면 강우 침식성이 증가하여 표토 침식에 더 취약하게 발생된다. Universal Soil Loss Equation (USLE) 입력 매개 변수 중 하나인 강우침식능인자는 토양 유실을 예측할때 강우 강도의 미치는 영향을 제시하는 인자이다. 선행 연구에서 USLE 방법을 사용하여 강우침식능인자를 산정하였지만, 60분 단위 강우자료를 이용하였기 때문에 정확한 30분 최대 강우강도 산정을 고려하지 못하는 한계점이 있다. 본 연구의 목적은 강우침식능인자를 이전의 진행된 방법보다 더 빠르고 정확하게 예측하는 머신러닝 모델을 개발하며, 총 월별 강우량, 최대 일 강우량 및 최대 시간별 강우량 데이터만 있어도 산정이 가능하도록 하였다. 이를 위해 본 연구에서는 강우침식능인자의 산정 값의 정확도를 높이기 위해 1분 간격 강우 데이터를 사용하며, 최근 강우 패턴을 반영하기 위해서 2013-2019년 자료로 이용했다. 우선, 월별 특성을 파악하기 위해 USLE 계산 방법을 사용하여 월별 강우침식능인자를 산정하였고, 국내 50개 지점을 대상으로 계산된 월별 강우침식능인자를 실측 값으로 정하여, 머신러닝 모델을 통하여 강우침식능인자 예측하도록 학습시켜 분석하였다. 이 연구에 사용된 머신러닝 모델들은 Decision Tree, Random Forest, K-Nearest Neighbors, Gradient Boosting, eXtreme Gradient Boost 및 Deep Neural Network을 이용하였다. 또한, 교차 검증을 통해서 모델 중 Deep Neural Network이 강우침식능인자 예측 정확도가 가장 높게 산정하였다. Deep Neural Network은 Nash-Sutcliffe Efficiency (NSE) 와 Coefficient of determination (R2)의 결과값이 0.87로서 모델의 예측성을 입증하였으며, 검증 모델을 테스트 하기 위해 국내 6개 지점을 무작위로 선별하여 강우침식능인자를 분석하였다. 본 연구 결과에서 나온 Deep Neural Network을 이용하면, 훨씬 적은 노력과 시간으로 원하는 지점에서 월별 강우침식능인자를 예측할 수 있으며, 한국 강우 패턴을 효율적으로 분석 할 수 있을 것이라 판단된다. 이를 통해 향후 토양 침식 위험을 지표화하는 것뿐만 아니라 토양 보전 계획을 수립할 수 있으며, 위험 지역을 우선적으로 선별하고 제시하는데 유용하게 사용 될 것이라 사료된다.

  • PDF

Reliability Analysis for the Estimation of Frequency-Based Rainfall (확률강우량 산정방법의 신뢰도 분석)

  • Hong, Chang-Sun;Wone, Seog-Yeon;Ahn, Jae-Hyun;Ahn, Won-Sik
    • Journal of the Korean Society of Hazard Mitigation
    • /
    • v.1 no.3 s.3
    • /
    • pp.111-122
    • /
    • 2001
  • A reliability analysis is conducted on the process in estimating frequency rainfalls. 39 year of annual maximum data in Seoul station are collected to analyze the reliability in the frequency analysis technique. Frequency analysis is carried out for the nine types of distribution function and three types of parameter estimation method which are currently used in Korea. Reliability Analysis is conducted for the frequency rainfalls determined by 3 types(maximum, median, selected) of method to select the adequate rainfall. Computed rainfalls of each duration and return period are standardized to find the distribution of the frequency rainfall. It shows that the resulting rainfall distribution fairly represents the normal distribution. Coefficient of variation of 0.0456 is computed to be used in estimating the reliability based design rainfall.

  • PDF

Femtocell Searching Technique Using Synchronization Signals for Next-Generation Mobile Communication Systems (차세대 이동통신 시스템에서 동기신호를 이용한 펨토셀 탐색 기법)

  • Kim, Yeong Jun;Cho, Yong Soo
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.38A no.1
    • /
    • pp.44-57
    • /
    • 2013
  • In this paper, we propose a femtocell searching technique which can prevent a macrocell UE(user equipment) from losing synchronism to its serving macrocell near closed access femtocells in co-channel deployment due to the leakage of femtocell signals by using a CS(Common Signal). The CS, commonly transmitted by femtocells in a macrocell at the same time, enables the macrocell UEs to be kept synchronized with their serving macrocells since the CINR(Carrier to Interference and Noise Ratio) of base stations in macrocell can be kept high even near closed access femtocells. Also, the CS is designed in such a way that a macrocell UE can recognize the existence of femtocell by using the metric CSCINR(Common Signal Carrier to Interference and Ratio) measured with CS. In addition, the proposed femtocell searching technique can reduce the frequency of femtocell searching trial by using the metric on mobility of a macrocell UE defined in this paper, and the reduction of the frequency of handover trial can be also expected as a byproduct.

Case Studies on Determination of Strength Parameters for the Analysis of Rock Slope Stability (암반사면 안정 해석을 위한 강도정수 산정 사례연구)

  • Kim, Hak Joon;Jeong, Jun-Ho
    • The Journal of Engineering Geology
    • /
    • v.30 no.1
    • /
    • pp.85-101
    • /
    • 2020
  • The estimation of strength parameters is very important for the stability analysis of rock slopes. Various methods for the determination of strength parameters were suggested by various researchers. The number of methods used for the estimation of strength parameters in the stability analysis of rock slopes were investigated based on literature reviews. The frequency of the method determining strength parameters were investigated with respect to failure types. The cohesion and friction angles of the rock and discontinuities are presented with RMR values. The cohesion shows wider range of values relative to those of friction angles according to current studies. Even though RMR does not show any correlation with cohesion values, RMR and the friction angle of the rock clearly shows a positive relationship. Proper methods should be utilized for the determination of strength parameters with consideration for failure types and be proved through literature reviews. The credibility of determining strength parameters is expected to improve if strength parameters data are accumulated from the back analysis performed for failed local rock slopes.

Outlook of Discharge for Dam Watershed Using RCM and SWAT Based on A1B Scenario (A1B시나리오 기반 RCM과 SWAT모형을 이용한 댐유역 유출량 전망)

  • Park, Jin-Hyeog;Kwon, Hyun-Han;Chae, Hyo-Sok;No, Sun-Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.354-354
    • /
    • 2011
  • 금강유역에 대한 기후변화 영향을 기후모형 및 수자원영향평가모형을 통하여 정량적으로 분석하기 위하여 한반도 최적 GCM모형으로 기상청에서 제공하는 ECHO-G GCM모형과 역학적 다운스케일링 기법을 이용한 공간해상도 27km의 지역규모의 MM5 RCM모형을 이용하였다. A1B시나리오 기반으로 고해상도 기후변화 시나리오를 작성하여 분석기간을 2015년대(2001-2030), 2045년대(2031-2060), 2075년대(2061-2090)로 구분하여 미래 연평균강수량, 기온 등을 전망하였고, 과거 30년 자료의 100년빈도 강수량과 미래의 100년 빈도강수량의 변동성을 평가하였다. 기본적으로 GCM 및 RCM은 시공간적 스케일의 상이성으로 인해 수자원 영향 평가를 위한 자료로서 직접적인 이용은 현실적으로 곤란하다는 점에서 본 연구에서는 RCM 격자자료를 유역단위에서 강우관측소 지점 단위로 공간적 Downscaling을 실시하였으며 RCM 월자료에 대해서 일단위 자료로 시간적 Downscaling을 수행하여 기후모델로부터 발생하는 시공간적 스케일의 문제점을 극복하였다. 또한 유역단위의 상세수문시나리오를 생산하기 위해서 다지점 비정상성 Downscaling 기법을 활용하여 기존 일강수량 모의기법에서 간과 되었던 비정상성을 고려하여 미래 기후변화에 따른 강수사상의 변동성을 다양한 방법으로 검토하였다. 2001년~2006년 기간동안 SWAT모형을 이용하여 용담댐유역 용담댐 지점의 유입량과 SWAT의 최종방류부의 유량분석값을 비교한 결과 모의치와 실측치가 90.1% 일치하는 것으로 나타났고, 천천수위관측소 지점의 유량을 모형결과와 비교분석 한 결과에서도 91.3% 일치하는 것으로 나타났다. 한편, 대청댐 지점의 유입량과 SWAT의 최종방류부의 유량분석값을 비교한 결과 모의치와 실측치가 84.4% 일치하는 것으로 나타나 금강유역내 용담댐 및 대청댐을 대상으로 유출분석 검토 결과 적용성이 있음을 확인하였다. 기후변화 분석기간은 2011년부터 2090년까지 80년을 대상기간 으로 선정하였으며, 분석결과 2011~2020년 사이 유출량이 18%증가하는 것으로 전망되었다.

  • PDF

Sparse Document Data Clustering Using Factor Score and Self Organizing Maps (인자점수와 자기조직화지도를 이용한 희소한 문서데이터의 군집화)

  • Jun, Sung-Hae
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.22 no.2
    • /
    • pp.205-211
    • /
    • 2012
  • The retrieved documents have to be transformed into proper data structure for the clustering algorithms of statistics and machine learning. A popular data structure for document clustering is document-term matrix. This matrix has the occurred frequency value of a term in each document. There is a sparsity problem in this matrix because most frequencies of the matrix are 0 values. This problem affects the clustering performance. The sparseness of document-term matrix decreases the performance of clustering result. So, this research uses the factor score by factor analysis to solve the sparsity problem in document clustering. The document-term matrix is transformed to document-factor score matrix using factor scores in this paper. Also, the document-factor score matrix is used as input data for document clustering. To compare the clustering performances between document-term matrix and document-factor score matrix, this research applies two typed matrices to self organizing map (SOM) clustering.