• Title/Summary/Keyword: 통계적 도구와 방법

Search Result 115, Processing Time 0.037 seconds

A Fuzzy-Rough Classification Method to Minimize the Coupling Problem of Rules (규칙의 커플링문제를 최소화하기 위한 퍼지-러프 분류방법)

  • Son, Chang-S.;Chung, Hwan-M.;Seo, Suk-T.;Kwon, Soon-H.
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.4
    • /
    • pp.460-465
    • /
    • 2007
  • In this paper, we propose a novel pattern classification method based on statistical properties of the given data and fuzzy-rough set to minimize the coupling problem of the rules. In the proposed method, statistical properties is used by a selection criteria for deciding a partition number of antecedent fuzzy sets, and for minimizing an coupling problem of the generated rules. Moreover, rough set is used as a tool to remove unnecessary attributes between generated rules from the numerical data. In order to verify the validity of the proposed method, we compared the classification results (i.e, classification precision) of the proposed with the conventional pattern classification methods on the Fisher's IRIS data. From experiment results, we can conclude that the proposed method shows relatively better performance than those of the classification methods based on the conventional approaches.

Estimation of Weights in Water Management Resilience Index Using Principal Component Analysis(PCA) (주성분 분석(PCA)을 이용한 물관리 탄력성 지수의 가중치 산정)

  • Park, Jung Eun;Lim, Kwang Suop;Lee, Eul Rae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.583-583
    • /
    • 2016
  • 다양한 평가지표가 반영된 복합 지수(Composite Index)는 물관리 정책의 우선순위 결정 및 정책성과의 모니터링에 유용한 도구로 사용되고 있다. 각 지표별 중요도를 나타내는 가중치는 최종 지수의 산정에 영향을 미칠 수 있으며, 그 결정방법도 Data Envelopment Analysis(DEA), Benefit of doubt Approach(BOD), Unobserved Component Model(UCM), Budget Allocation Process(BAP), Analytic Hierarchy Process(AHP), Conjoint Analysis(CA) 등 다양하다. 본 연구에서는 여러 가지 가중치 결정방법 중 통계적 방법인 주성분 분석(Principal Component Analysis, PCA)을 사용하여 Park et al.(2016)이 제시한 물관리 탄력성 지수(Water Management Resilience Index, WMRI)에 대한 가중치를 산정하여 동일 가중치를 적용한 기존 결과와 비교하였다. 물관리 탄력성 지수는 자연조건상 물관리 취약성(Vulnerability), 기존 수자원 인프라의 견고성(Robustness), 물위기 적응전략의 다양성(Redundancy)의 3가지 부지수(sub-index)는 각각 13개, 11개, 7개의 지표(Indicator)로 구성되어 있으며, 117개 중권역을 다목적댐 하류 본류유역(범주 1), 용수공급 및 유량조절이 불가능한 지류(범주 2)와 가능한 지류(범주 3)로 분류하여 적용되었다. 각 부지수별로 추출된 3개, 5개, 3개의 주성분이 전체 자료의 76.4%, 71.2%, 63.2%를 설명하는 것으로 분석되었으며 부지수별 주성분의 고유벡터(Eigenvector)와 고유값(Eigenvalue)를 계산하고 각 지표의 가중치를 산정하였다. 주성분 분석에 의한 가중치와 동일 가중치를 적용하였을 경우와 비교해보면 취약성 부지수 1.9%, 견고성 부지수 1.9%, 다양성 부지수 2.1%의 차이가 나타나며 물관리 탄력성 지수는 0.4%의 차이를 보임에 따라 Park et al.이 제시한 연구결과의 적정성을 확인할 수 있었다. 주성분 분석은 객관적인 가중치 설정을 위한 통계적 접근방법의 하나로써 다양한 물관리 정책지수 산정시 활용될 수 있을 것이며, 향후 다른 가중치 산정방법을 적용함으로써 각 방법에 따른 지수 결과의 민감도 및 장단점을 분석할 수 있을 것으로 판단된다.

  • PDF

Applying 6 sigma techniques in CMMI based software process improvement (CMMI 기반의 프로세스 개선을 위한 6시그마 활용방안)

  • Kim Han-Saem;Han Hyuk-Soo
    • The KIPS Transactions:PartD
    • /
    • v.13D no.3 s.106
    • /
    • pp.415-424
    • /
    • 2006
  • There are increasing numbers of foreign and domestic organizations that are using CMM/CMMI to establish their processes and keep improving them. CMMI and IDEAL models of SEI provide the best practices of processes and guide the organization using them based on processes maturity levels. However, they do not deal with their tools or methods that describe how to implement the processes in the organization. Therefore, in this paper, we developed a method in which various tools and statistical methodology of 6 sigma are applied to identify the process areas to be improved, to extract problems in those areas and to prioritize them. We expect this paper can contribute to the organizations that are searching for practical way of implementing CMMI based software process improvement and of identifying improvement items systematically. Also this method will be used to understand the result of improvement activities quantitatively.

Regular Polyprism Parallel Coordinate Plot as a Statistical Graphics Tool (통계적 그래픽스 도구로서의 정다각기둥평행좌표그림)

  • Jang, Dae-Heung
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.4
    • /
    • pp.695-704
    • /
    • 2008
  • The parallel coordinate plot is a graphical data analysis technique for plotting multivariate data. The parallel coordinate plot overcomes the visualization problem of the Cartesian coordinate system for dimensions greater than 4. But, using different ordering of coordinate axes in the parallel coordinate plot of the same data may make different interpretations. Hence, we can use the regular polyprism parallel coordinate plot as an alternative for overcoming the variable arrangement problem of the parallel coordinate plot.

A Parser for Noun's Definition in Korean Dictionary (국어사전의 명사 뜻풀이말 Parser)

  • Hur, Jeong;Kim, Jun-Soo;Lee, Soo-Kwang;Ok, Chul-young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.321-323
    • /
    • 2000
  • 국어 사전은 자연 언어 처리에서 필요로 하는 많은 정보를 구조적으로 포함하고 있으므로, 사전으로부터 다양한 언어 지식을 자동으로 획득할 수 있는 방법이 필요하다. 본 연구는 이러한 자동 지식 획득을 위한 기본적인 도구로서 국어 사전의 뜻풀이말 파서를 구현하는 것을 목적으로 한다. 이를 위해서 우선 국어 사전의 뜻풀이말을 대상으로 일정한 수준의 구문 부착 말뭉치를 구축하고, 이 말뭉치로부터 통계적인 방법에 기반하여 문법 규칙과 확률을 자동으로 추출한다. 본 연구는 이를 응용한 확률적 차트 파서를 구현하는 것이다. 그 결과 고려대 태거보다 11.61%의 정확률 향상을 보였는데, 이로써 구문 구조 정보가 품사 태깅에도 유용함을 알 수 있었다.

  • PDF

Developing English Language Learning Tools Adaptable to Users' Personality (사용자 성격 적응형 영어학습 도구에 관한 연구)

  • Lee, Inui;Kwon, Soonil;Lee, Kyoung-Rang;Kim, Soo-Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1649-1652
    • /
    • 2012
  • 본 연구에서는 사용자의 성격패턴을 사용자의 대화음성 정보만으로 자동 분류할 수 있는 방법과 이를 기반으로 사용자의 성격 맞춤형 학습전략을 적용하는 애플리케이션을 개발하는 것을 목적으로 하였다. 음성대화 속의 발화된 말의 빠르기(speech rate)나 말소리의 크기, 기본주파수(fundamental frequency)의 값과 그들의 변화패턴, 그리고 묵음구간의 여러 가지 통계적 정보 같은 비언어적 단서를 활용하여 성격패턴을 최고 86.3% 까지 정확하게 인식해 낼 수 있었다. 또한 성격 별 영어단어 학습방법을 개발하여 사전 및 사후테스트를 기반으로 실험한 결과 약 24% 성적 향상을 보였다. 이 연구를 통해 확보되는 원천기술은 각종 에듀테인먼트 콘텐츠에는 물론 로봇과의 대화시스템, 치료나 재활을 위한 기능성 콘텐츠 등에 유용하게 사용될 것이다.

A Study on Intra-Annual Variability of Parameters in Rainfall-Runoff Model (강우-유출모형 매개변수의 Intra-Annual Variability에 관한 연구)

  • Kim, Jin-Guk;Kim, Kue-Bum;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.422-422
    • /
    • 2015
  • 수문학적 모델링은 수자원계획에 있어 가장 핵심적인 도구 중에 하나이다. 강우-유출모형의 매개변수 추정시 장기간의 자료를 활용하는데 초점이 맞추어져 있으며, 일반적으로 5년 이상의 자료를 활용하여 매개변수를 추정하는 경년변동(inter-annual variability) 매개변수 추정 방법이 추천되고 있다. 수문학적 변동성 측면에서 볼 때 강우, 온도, 유역의 조건 등의 연내변동성(intra-annual variability)이 경년보다 크게 나타나고 있으나, 이러한 특성을 고려한 수문모형의 매개변수 추정은 이루어지고 있지 않다. 이러한 점에서 연내변동성으로 기인하는 비정상성을 고려한 매개변수 추정 방법의 도입이 필요할 것으로 판단되며, 본 연구에서는 계측유역을 대상으로 다양한 시간규모에서 매개변수 추정을 수행하고 최적의 시간규모를 도출하고자 한다. 이를 위해서 DDS(dynamically dimensioned search) 알고리즘을 도입하여 최적화를 수행하였으며, 다양한 시간 규모에서 모형의 적합특성을 평가하였다. 교차검증을 통하여 매개변수의 통계적 유의성을 확보하였으며, 전통적인 매개변수 추정 절차와 비교 검토를 수행하였다.

  • PDF

Image Interpolation Using Hidden Markov Tree Model Without Training in Wavelet Domain (웨이블릿 영역에서 훈련 없는 은닉 마코프 트리 모델을 이용한 영상 보간)

  • 우동헌;엄일규;김유신
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.4
    • /
    • pp.31-37
    • /
    • 2004
  • Wavelet transform is a useful tool for analysis and process of image. This showed good performance in image compression and noise reduction. Wavelet coefficients can be effectively modeled by hidden Markov tree(HMT) model. However, in application of HMT model to image interpolation, training procedure is needed. Moreover, the parameters obtained from training procedure do not match input image well. In this paper, the structure of HMT is used for image interpolation, and the parameters of HMT are obtained from statistical characteristics across wavelet subbands without training procedure. In the proposed method, wavelet coefficient is modeled as Gaussian mixture model(GMM). In GMM, state transition probabilities are determined from statistical transition characteristic of coefficient across subbands, and the variance of each state is estimated using the property of exponential decay of wavelet coefficient. In simulation, the proposed method shows improvement of performance compared with conventional bicubic method and the method using HMT model with training.

Classification Analysis for the Prediction of Underground Cultural Assets (매장문화재 예측을 위한 통계적 분류 분석)

  • Yu, Hye-Kyung;Lee, Jin-Young;Na, Jong-Hwa
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.14 no.3
    • /
    • pp.106-113
    • /
    • 2009
  • Various statistical classification methods have been used to establish prediction model of underground cultural assets in our country. Among them, linear discriminant analysis, logistic regression, decision tree, neural network, and support vector machines are used in this paper. We introduced the basic concepts of above-mentioned classification methods and applied these to the analyses of real data of I city. As a results, five different prediction models are suggested. And also model comparisons are executed by suggesting correct classification rates of the fitted models. To see the applicability of the suggested models for a new data set, simulations are carried out. R packages and programs are used in real data analyses and simulations. Especially, the detailed executing processes by R are provided for the other analyser of related area.

Changes in Statistical Knowledge and Experience of Data-driven Decision-making of Pre-service Teachers who Participated in Data Analysis Projects (데이터 분석 프로젝트 참여한 예비 교사의 통계적 지식에 대한 변화와 데이터 기반 의사 결정의 경험)

  • Suh, Heejoo;Han, Sunyoung
    • Communications of Mathematical Education
    • /
    • v.35 no.2
    • /
    • pp.153-172
    • /
    • 2021
  • Various competencies such as critical thinking, systems thinking, problem solving competence, communication skill, and data literacy are likely to be required in the 4th industrial revolution. The competency regarding data literacy is one of those competencies. To nurture citizens who will live in the future, it is timely to consider research on teacher education for supporting teachers' development of statistical thinking as well as statistical knowledge. Therefore, in this study we developed and implemented a data analysis project for pre-service teachers to understand their changes in statistical knowledge in addition to their experiences of data-driven decision making process that required them utilizing their statistical thinking. We used a mixed method (i.e., sequential explanatory design) research to analyze the quantitative and qualitative data collected. The findings indicated that pre-service teachers have low knowledge level of their understanding on the relationship between population means and sample means, and estimation of the population mean and its interpretation. When it comes to the data-driven decision making process, we found that the pre-service teachers' experiences varied even when they worked as a small group for the project. We end this paper by presenting implications of the study for the fields of teacher education and statistics education.