• Title/Summary/Keyword: 통계 분류

Search Result 2,140, Processing Time 0.028 seconds

80년대 한국 통계의 현황과 장래: 통계이론을 중심으로

  • 우정수
    • Journal of the Korean Statistical Society
    • /
    • v.20
    • /
    • pp.10-18
    • /
    • 1991
  • 한국통계학회 창립 20주년을 맞아 80년대의 한국통계의 현황과 장래의 나아갈 방향에 대해 의견을 교환하는 것은 뜻깊은 일이라 할 것이다. 그러나 통계이론에 관해 깊이 있는 의견을 제시하는 것은 쉬운 일은 아닌 것 같다. 10주년 기념호 통계학연구에서 백운붕 박사께서 통계이론의 범위를 광의의 수리통계학으로 해석하였듯이 필자도 통계이론을 이론통계학과 같은 차원의 넓은 의미로 사용하기로 한다. 한국통계에서의 통계이론의 현황을 살펴보기 위해서는 국제적인 현황을 먼저 살펴보아야 한다고 생각된다. 여기에는 여러가지 이유가 있겠지만 자연과학이라는 학문이 그러하듯이 통계학이란 학문 자체가 외국에서 발생되어 우리나라에 도입된 학문으로 우리나라에서 독자적으로 연구 교육되어온 학문이 아니기 때문에 당연히 국제적인 현황가 깊은 관계가 있으리라고 짐작되기 때문이다. 그러한 이유에서 먼저 1980년대에 Annals of Statistics와 JASA에 게재된 논문의 내용을 분류하여, 1970년대 후반기의 경향과 비교하여 1980년대의 흐름을 간략히 살펴보고자 한다. 물론 한국 통계의 현황을 알아보기 위해서는 한국통계학회지인 통계학연구를 분석해 보는 것이 무엇보다 필요하리라 생각된다. 그리고 한국통계학자들의 연구 동향을 고찰하기 위해서는 학술발표회의 논문을 분류하는 것이 타당하다고 생각된다. 따라서 본고에서는 1981년부터 1990년까지의 통계학연구지 논문과 1985년부터 1990년까지의 춘계 및 추계 학술논문발표회의 발표 논문을 분류하여 비교해 보고자 한다.

  • PDF

불완비 데이터에서 분류 나무의 구축

  • 우주성;김규성
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2001.11a
    • /
    • pp.105-108
    • /
    • 2001
  • 본 논문에서는 결측치가 있는 불완비 데이터에서 분류나루를 구축하는 방법을 고찰하였다. 기존의 결측치 처리 방법인 대리 분리 방법의 대안으로 대체 방법으로 결측치를 처리한 후 분류나무를 구축하는 방법을 제안하였다.

  • PDF

Empirical Bayesian Misclassification Analysis on Categorical Data (범주형 자료에서 경험적 베이지안 오분류 분석)

  • 임한승;홍종선;서문섭
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.1
    • /
    • pp.39-57
    • /
    • 2001
  • Categorical data has sometimes misclassification errors. If this data will be analyzed, then estimated cell probabilities could be biased and the standard Pearson X2 tests may have inflated true type I error rates. On the other hand, if we regard wellclassified data with misclassified one, then we might spend lots of cost and time on adjustment of misclassification. It is a necessary and important step to ask whether categorical data is misclassified before analyzing data. In this paper, when data is misclassified at one of two variables for two-dimensional contingency table and marginal sums of a well-classified variable are fixed. We explore to partition marginal sums into each cells via the concepts of Bound and Collapse of Sebastiani and Ramoni (1997). The double sampling scheme (Tenenbein 1970) is used to obtain informations of misclassification. We propose test statistics in order to solve misclassification problems and examine behaviors of the statistics by simulation studies.

  • PDF

A Musical Genre Classification Method Based on the Octave-Band Order Statistics (옥타브밴드 순서 통계량에 기반한 음악 장르 분류)

  • Seo, Jin Soo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.33 no.1
    • /
    • pp.81-86
    • /
    • 2014
  • This paper presents a study on the effectiveness of using the spectral and the temporal octave-band order statistics for musical genre classification. In order to represent the relative disposition of the harmonic and non-harmonic components, we utilize the octave-band order statistics of power spectral distribution. Experiments on the widely used two music datasets were performed; the results show that the octave-band order statistics improve genre classification accuracy by 2.61 % for one dataset and 8.9 % for another dataset compared with the mel-frequency cepstral coefficients and the octave-band spectral contrast. Experimental results show that the octave-band order statistics are promising for musical genre classification.

Standard Criterion of VUS for ROC Surface (ROC 곡면에서 VUS의 판단기준)

  • Hong, C.S.;Jung, E.S.;Jung, D.G.
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.6
    • /
    • pp.977-985
    • /
    • 2013
  • Many situations are classified into more than two categories in real world. In this work, we consider ROC surface and VUS, which are graphical representation methods for classification models with three categories. The standard criteria of AUC for the probability of default based on Basel II is extended to the VUS for ROC surface; therefore, the standardized criteria of VUS for the classification model is proposed. The ranges of AUC, K-S and mean difference statistics corresponding to VUS values for each class of the standard criteria are obtained. The standard criteria of VUS for ROC surface can be established by exploring the relationships of these statistics.

Development of Cause Classification Method for Improving Reliability of Electrical Fire Statistics (전기화재 조사 및 통계의 신뢰성 향상을 위한 원인분류방법의 개발)

  • Jeon, Jeong-Chay;Jeon, Hyun-Jae;Lee, Sang-Ick;Yoo, Jae-Geun
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.8 no.3
    • /
    • pp.466-471
    • /
    • 2007
  • Electrical fires form over 30 percent of fires, but the study on the reliability of electrical fire statistics is not performed. Electrical roe occupancy was very high due to investigating and classifying fires, which is not directly continuous with electrical cause, as electrical fire because insufficiency of cause classification method or system, and the problems of the reliability of electrical fire statistics were presented. So, the reliability of electrical fire statistics must be guaranteed by improvement of the existing cause classification method of electrical fire. This paper analyzed the problems of electrical rue statistics by the existing cause classification method of electrical fire and presented the new method to classify causes of electrical fire.

  • PDF

Partial AUC and optimal thresholds (부분 AUC와 최적분류점들)

  • Hong, Chong Sun;Cho, Hyun Su
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.2
    • /
    • pp.187-198
    • /
    • 2019
  • Extensive literature exists on how to estimate optimal thresholds based on various accuracy measures using receiver operating characteristic (ROC) and cumulative accuracy profile (CAP) curves. This paper now proposes an alternative measure to represented the specific partial area under the ROC and CAP curves. The relationship between ROC and CAP functions is examined using differential equations of the new defined partial area under curves. In addition, the relationship with the optimal thresholds under conditions of various accuracy measures for the ROC and CAP functions is also derived. We assume there are two kinds of distribution functions composing the mixed distribution as various normal distributions before finding the optimal thresholds. Corresponding type 1 and 2 errors are also explored and discussed under various conditions for accuracy measures.

Hotelling의 T$^{2}$ 통계량을 이용한 cDNA 마이크로어레이 분석

  • Kim, Byeong-Su;Lee, Seon-Ho;Kim, In-Yeong;Kim, Sang-Cheol;Ra, Seon-Yeong;Jeong, Hyeon-Cheol
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.05a
    • /
    • pp.295-297
    • /
    • 2003
  • 본 논의에서는 cDNA 마이크로어레이 분석에서 다변량 분석의 한 방법인 Hotelling의 T제곱 통계량을 이용하여 유의적 유전자군을 검색하고, 이 유전자군을 사용하여 검사자료를 두군으로 분류하는데 단변량 t통계량에 기초한 접근보다 얼마나 효율적인지를 평가하고자 한다.

  • PDF

A study on total registration statistics system development for after service of automobile (자동차의 사후관리를 위한 등록통계 시스템 개발에 관한 연구)

  • 강지호
    • Journal of the korean Society of Automotive Engineers
    • /
    • v.17 no.1
    • /
    • pp.31-43
    • /
    • 1995
  • 본 연구에서는 교통부 자동차 등록 원시자료를 이용하여 자동차제작사가 직접 사용할 수 있는 사후관리를 위한 등록통계 시스템을 개발해서 결과를 제시하고자 한다. 특히 통계 활용범위를 극대화하도록 하기 위해 차명은 코드화로 작성하여 통합차명으로 표준화, 업계재편과정으로 인한 종전 자동차 제작사는 합병, 인수한 최종 자동차제작사에 통합, 단산 및 양산 차명별로 차령별분류, 시.군.구의 행정단위별의 통계정보 수록 및 자동차소유자의 구매성형분석을 위한 년령별분류외 15개 유형별로 개발결과를 제시함으로써 효율적이고 과학적인 통계를 산출할 수 있도록 하고자 한다.

  • PDF

그룹분류가능계획를 이용한 최적 블록 CDC의 설계

  • 김진;배종성
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2001.11a
    • /
    • pp.109-114
    • /
    • 2001
  • m=2 또는 n=2이고, ${\lambda}_1<{\lambda}_2$인 그룹분류가능계획을 매개디자인으로 사용한 완전이면교배가 A-최적, D-최적임을 보였다. 또한, ${\lambda}_2={\lambda}_1+1$이면 일반화된 최적계획이 됨을 보였다.

  • PDF