• Title/Summary/Keyword: 통계적 군집분석

Search Result 129, Processing Time 0.025 seconds

A Study on the Regional Frequency Analysis Using the Artificial Neural Network Method - the Nakdong River Basin (인공신경망 군집분석을 이용한 지역빈도해석에 관한 연구 - 낙동강 유역을 중심으로)

  • Ahn, Hyunjun;Kim, Sunghun;Jung, Jinseok;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.404-404
    • /
    • 2017
  • 이상기후현상으로 인해 극치 수문 사상들이 빈번히 발생함에 따라 상대적으로 높은 재현기간에 해당하는 극치 수문 사상해석에 대한 관심이 높아지고 있다. 그러나 우리나라의 경우 이러한 극치 수문 사상을 추정하기 위한 표본의 수가 부족한 실정이다. 지역빈도해석은 지점의 표본 수가 적거나 수문자료의 수집이 불가능한 미계측지점인 경우, 해당 지점과 수문학적으로 동질하다고 여겨지는 주변 지점들의 자료를 확보하여 확률수문량을 추정함으로써 상대적으로 지점빈도해석 보다 roubst한 추정값을 얻을 수 있다는 장점을 가지고 있다. 따라서 최근 확률수문량 산정 기법으로 지역빈도해석 방법에 관한 관심이 높아지고 있다. 지역구분은 지역빈도해석이 지점빈도해석과 구분될 수 있는 큰 특징이고 지역구분 결과 따라 지역의 표본 크기가 결정되기 때문에 수문학적으로 동질한 지역을 나누는 방법은 매우 중요하다고 볼 수 있다. 인공신경망은 인간의 뇌가 학습하는 방식을 모사한 통계적 모델링 기법이다. 즉, 인간의 뇌가 일정한 반복 학습을 통해 어떠한 문제의 해법을 추론하거나 예측, 또는 패턴을 인식하는 일련의 과정을 알고리즘화 하여 목적함수의 해를 찾는 방식이다. 특히, 주어진 자료들로 부터 특징을 추출하고 그 특징을 학습하여 전체 자료의 분류나 군집화를 이루는데 널리 이용되고 있다. 본 연구에서는 낙동강유역을 대상으로 인공신경망을 이용한 군집분석을 수행하고 구분된 지역을 이용하여 지역빈도해석을 수행하였다.

  • PDF

Correspondence Analysis of Reports and Persuasives based on a Newspaper Corpus (접속 부사의 사용에 따른 설득문과 보도문의 대응 분석)

  • Kim, Hye-Young;Kang, Beom-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.175-180
    • /
    • 2013
  • 본 논문은 동아, 조선, 중앙, 한겨레 신문의 2000~2011년 신문 사설과 보도문에서서 나타나는 접속부사의 사용에 대한 분석이다. 구체적으로, 텍스트 구조를 드러내는 표지의 기능을 하는 접속부사에 대해 논의하고자 한다. 12년 동안 출현한 고빈도 접속부사 '그러나, 하지만, 그런데, 그리고, 따라서, 그래서, 그렇지만, 그러면, 그러므로, 하물며'를 대상으로 보도문에서의 빈도 변화와 신문 사설에서의 빈도 변화를 대응 분석과 군집 분석을 통해 객관적, 통계적, 통시적으로 분석하였다. 연구 결과, 나열의 구조에서 보도문은 '그리고'를 선호하고 신문 사설은 '하물며'를 선호하여 사용하며, 대조의 표지로서 보도문은 '하지만'을 신문 사설은 '그러나, 그렇지만'을 선호하여 사용하였다. 화제 전환을 나타낼 때 보도문은 '그러면'을 사용하는 반면 신문 사설은 '그런데'를 사용하고, 문제에 대한 결과를 제시할 때 '보도문'은 '그러므로, 그래서'를 신문 사설은 '따라서'를 더 많이 사용하는 경향이 나타났다.

  • PDF

Multivariate Stratification Method for the Multipurpose Sample Survey : A Case Study of the Sample Design for Fisher Production Survey (다목적 표본조사를 위한 다변량 층화 : 어업비계통생산량조사를 위한 표본설계 사례)

  • Park, Jin-Woo;Kim, Young-Won;Lee, Seok-Hoon;Shin, Ji-Eun
    • Survey Research
    • /
    • v.9 no.1
    • /
    • pp.69-85
    • /
    • 2008
  • Stratification is a feature of the majority of field sample design. This paper considers the multivariate stratification strategy for multipurpose sample survey with several auxiliary variables. In a multipurpose survey, stratification procedure is very complicated because we have to simultaneously consider the efficiencies of stratification for several variables of interest. We propose stratification strategy based on factor analysis and cluster analysis using several stratification variables. To improve the efficiency of stratification, we first select the stratification variables by factor analysis, and then apply the K-means clustering algorithm to the formation of strata. An application of the stratification strategy in the sampling design for the Fisher Production Survey is discussed, and it turns out that the variances of estimators are significantly less than those obtained by simple random sampling.

  • PDF

Regional Characterization Analysis of Drought in Korea Using Multivariate Analyses (다변량 분석을 통한 우리나라 가뭄의 지역적 특성 분석)

  • Yoo, Ji-Young;Choi, Min-Ha;Kim, Tae-Woong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1462-1466
    • /
    • 2009
  • 우리나라 가뭄의 지역적 특성은 수문학적으로 동질한 지역의 구분 결과에 따라 달라진다. 지역의 구분에는 가뭄에 영향을 미치는 다양한 변수들이 사용될 수 있다. 가뭄을 특징짓는 요소로서 지속기간, 심도, 이외의 통계적 특성들이 있으며, 이 변수들을 정보화하여 변수의 유형을 구분지어 모든 변수들을 요약된 정보로 활용하여 가뭄의 특성을 구분할 수 있다. 본 연구에서는 우리나라 기상청 강우자료 75개 관측지점 중 30년 미만의 강우기록이 있는 17개의 지점을 제외한 58개 강우 관측 지점을 대상으로 가뭄지수(SPI)를 산정하여 가뭄사상의 특성을 정량화 과정으로 남한지역 가뭄특성을 분류하였다. SPSS를 활용한 다변량 분석기법인 주성분 분석(principal component analysis)을 통해 가뭄특성인자의 상관관계가 높은 변수들을 조합하여 그 변수들 중 가뭄정보를 가능한 많이 함축하고 있는 새로운 특성 변수를 만들어 내었으며, 선정된 변수들을 바탕으로 요인분석(factor analysis)의 직각회전 방식(Varimax)을 이용하여 변수들의 표준화를 통해 가뭄특성요인을 찾아내었다. 이를 통해 지역간 동질성을 파악하여 K-means기법을 적용하여 군집해석(clustering analysis)을 실시하였다.

  • PDF

Statistical Analysis of Receding Horizon Particle Swarm Optimization for Multi-Robot Formation Control (다개체 로봇 편대 제어를 위한 이동 구간 입자 군집 최적화 알고리즘의 통계적 성능 분석)

  • Lee, Seung-Mok
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.24 no.5
    • /
    • pp.115-120
    • /
    • 2019
  • In this paper, we present the results of the performance statistical analysis of the multi-robot formation control based on receding horizon particle swarm optimization (RHPSO). The formation control problem of multi-robot system can be defined as a constrained nonlinear optimization problem when considering collision avoidance between robots. In general, the constrained nonlinear optimization problem has a problem that it takes a long time to find the optimal solution. The RHPSO algorithm was proposed to quickly find a suboptimal solution to the optimization problem of multi-robot formation control. The computational complexity of the RHPSO increases as the number of candidate solutions and generations increases. Therefore, it is important to find a suboptimal solution that can be used for real-time control with minimal candidate solutions and generations. In this paper, we compared the formation error according to the number of candidate solutions and the number of generations. Through numerical simulations under various conditions, the results are analyzed statistically and the minimum number of candidate solutions and the minimum number of generations of the RHPSO algorithm are derived within the allowable control error.

Calculation of the Peak-hour Ratio for Road Traffic Volumes using a Hybrid Clustering Technique (혼합군집분석 기법을 이용한 도로 교통량의 첨두율 산정)

  • Kim, Hyung-Joo;Chang, Justin S.
    • Journal of Korean Society of Transportation
    • /
    • v.30 no.1
    • /
    • pp.19-30
    • /
    • 2012
  • The majority of daily travel demands concentrate at particular time-periods, which causes the difficulties in the travel demand analysis and the corresponding benefit estimation. Thus, it is necessary to consider time-specific traffic characteristics to yield more reliable results. Traditionally, na$\ddot{i}$ve, heuristic, and statistical approaches have been applied to address the peak-hour ratio. In this study, a hybrid clustering model which is one of the statistical methods is applied to calculate the peak-hour ratio and its duration. The 2009 national 24-hour traffic data provided by the Korea institute of Construction Technology are used. The analysis is conducted dividing vehicle types into passenger cars and trucks. For the verification for the usefulness of the methodology, the toll collection system data by the Korea Express Corporation are collected. The result of the research shows lower errors during the off-peak hours and night times and increasing error ratios as the travel distance increases. Since the method proposed can reduce the arbitrariness of analysts and can accommodate the statistical significance test, the model could be considered as a more robust and stable methodology. It is hoped that the result of this paper could contribute to the enhancement of the reliability for the travel demand analysis.

Statistical Classification of Dam Heightening Reservoirs for Classifying Rural Waterfront Development Type (농촌지역 친수공간의 개발유형 분류를 위한 둑높이기 저수지의 통계적 분류)

  • Jung, In-Kyun;Jung, Kwang-Wook;Kwon, Jin-Wook;Kim, Hae-Do;Lee, Kwang-Ya
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.707-707
    • /
    • 2012
  • 현재 농업용저수지 둑 높이기 사업이 전국 110개 저수지를 대상으로 추진되고 있다. 다양한 효과가 기대되고 있는 둑 높이기 사업과 더불어 농업생산기반시설 및 주변지역 활용에 관한 특별법의 시행으로 저수지 등 농업기반시설 및 그 주변지역을 본래의 기능을 유지하는 범위에서 개발할 수 있게 됨에 따라 다양한 시설물의 설치와 운영을 통해 지역의 수익창출이 가능하게 되었다. 그러나 저수지 수변지역으로 개발계획이 집중되어 있고 추가확보 되는 용수는 하천유지와 농업용수 공급에 주로 활용될 계획이므로 추가확보 용수의 보다 다양한 활용방안을 제고하여 더 많은 이익을 창출할 수 있는 방안이 요구되고 있다. 그 중 하나로 둑 하류지역 농경지의 관개배수체계를 정비하여 추가용수 이용의 효율을 향상시키고 농촌마을과 연계하여 친수공간을 조성함으로서 둑하류 농촌마을 주민의 삶의 질 향상과 경제적 이득을 창출할 수 있는 기회를 제공할 수 있을 것이다. 이와 같은 친수공간 개발은 둑높이기 저수지의 추가용수 확보규모 및 지역의 지형, 토지이용, 사회경제적 특성에 따라 달라질 수 있으나 유형화를 통해 대표적 특성에 대한 표준안을 개발 할 수 있을 것이다. 따라서 본 연구에서는 기초연구로서 둑 높이기 저수지의 특성 및 주변 현황자료를 수집하고 통계적인 기법을 이용하여 5개의 둑하류 농촌지역 친수공간 개발유형을 분류하였으며 지역 및 공간적 분포를 제시하였다.

  • PDF

Spatio-Temporal Patterns and Analysis Methods for Supporting the Efficient Investigation on Serial Crimes (효과적인 연쇄 범죄 수사 지원을 위한 시공간 패턴 및 분석 기법)

  • Hong, Dong-Suk;Seo, Jong-Soo;Han, Ki-Joon
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2008.06a
    • /
    • pp.477-484
    • /
    • 2008
  • 연쇄 살인과 같은 강력 범죄의 심각성이 사회적 이슈가 되면서 이에 대한 효과적인 과학 수사의 필요성이 증가되고 있다. 특히, 연쇄 범죄 데이타에 대한 공간 분석을 통해 범죄자의 거점 위치를 예측하는 지리적 프로파일링과 미래에 발생될 범행 장소의 위치, 즉 기존 범행에 이어 일어날 다음 범행 위치 예측에 관한 연구가 활발하다. 그러나, 이와 관련된 기존 연구는 물리적인 거리에 대한 통계적 기법을 적용하거나 단순한 공간적 분석만을 적용하므로 낮은 예측 정확도를 보이는 문제점이 있다. 본 논문에서는 이러한 문제를 해결하고 보다 효과적인 연쇄 범죄 수사를 지원하는 방법으로써 연쇄 범죄 발생에 대한 공간적 시간적 분포 특성에 따른 시공간 패턴을 기반으로 다양한 시공간 분석을 적용하는 거점 위치 예측 기법과 다음 범행 위치 예측 기법을 제안한다. 제안 기법은 중심축을 따라 나타나는 선형 분포의 연쇄 범죄에서도 정확도 높은 예측이 가능하고, 다수의 서로 다른 군집들에 대해 각 군집내 범행에 대한 지역적 예측과 대상 영역의 모든 범행에 대한 전역적 예측이 가능하다. 또한 방향 패턴을 활용하여 다음 범행 위치 예측 정확도도 개선하였다.

  • PDF

An Empirical Study and Policy Implications Regarding Correlations of Korean Small Businessman's Perception of Systematization Using Cluster Analysis (한국 소상공인의 조직화 인식도 상호관계에 관한 실증적 연구와 정책적 시사점 : 군집분석을 이용한 접근)

  • Suh, Geun-Ha;Lee, Kwang-No;Yoon, Sung-Wook
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.12 no.3
    • /
    • pp.1157-1164
    • /
    • 2011
  • In this study, association of small business is divided into four groups: Franchise, Joint Brand, Industry Association and Registered Retailer. Cluster analysis is taken to find what kind of strategic considerations associated small businesses choose when they set up new strategies. The results show that there are some differences in the perception of association, effects of association and final performance of management by gender, academic background, and age. The data also find three clusters: price competitive, marketing competitive and neither group. Implications of this study is that government should focus more on not only improving infrastructures of self-businesses but also associating small businesses, modernizing managerial systems in the future.

Computer-Aided Detection of Clustered Microcalcifications using Texture Analysis and Neural Network in Digitized X-ray Mammograms (X-선 유방영상에서 텍스처 분석과 신경망을 이용한 군집성 미세석회화의 컴퓨터 보조검출)

  • 김종국;박정미
    • Journal of Biomedical Engineering Research
    • /
    • v.19 no.1
    • /
    • pp.1-8
    • /
    • 1998
  • Clustered microcalcifications on X-ray mammograms are an important sign for early detection of breast cancer. This paper proposes a computer-aided diagnosis method for the detection of clustered microcalcifications and marking their locations on digitized mammograms. The proposed detection method consists of the region of interest (ROI) selection, the film-artifact removal, the surrounding texture analysis method for the detection of clustered microcalcifications, which is based on the second-order histogram in two nested surrounding regions on the current pixel. This paper also describes the effectiveness of the proposed film-artifact removal filter in terms of the classification performance with the receiver operating-characteristics(ROC) analysis. A three-layer backpropagation neural network is employed as a classifier. The appropriate marking for the locations of clustered microcalcifications can be used to alert radiologists to locations of suspicious lesions.

  • PDF