• Title/Summary/Keyword: Statistics data

Search Result 13,789, Processing Time 0.035 seconds

Estimation of the Generalized Rayleigh Distribution Parameters

  • Al-khedhairi, A.;Sarhan, Ammar M.;Tadj, L.
    • International Journal of Reliability and Applications
    • /
    • 제8권2호
    • /
    • pp.199-210
    • /
    • 2007
  • This paper presents estimations of the generalized Rayleigh distribution model based on grouped and censored data. The maximum likelihood method is used to derive point and asymptotic confidence estimates of the unknown parameters. The results obtained in this paper generalize some of those available in the literature. Finally, we test whether the current model fits a set of real data better than other models.

  • PDF

Diagnostic In Spline Regression Model With Heteroscedasticity

  • Lee, In-Suk;Jung, Won-Tae;Jeong, Hye-Jeong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제6권1호
    • /
    • pp.63-71
    • /
    • 1995
  • We have consider the study of local influence for smoothing parameter estimates in spline regression model with heteroscedasticity. Practically, generalized cross-validation does not work well in the presence of heteroscedasticity. Thus we have proposed the local influence measure for generalized cross-validation estimates when errors are heteroscedastic. And we have examined effects of diagnostic by above measures through Hyperinflation data.

  • PDF

A Classification Method Using Data Reduction

  • Uhm, Daiho;Jun, Sung-Hae;Lee, Seung-Joo
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제12권1호
    • /
    • pp.1-5
    • /
    • 2012
  • Data reduction has been used widely in data mining for convenient analysis. Principal component analysis (PCA) and factor analysis (FA) methods are popular techniques. The PCA and FA reduce the number of variables to avoid the curse of dimensionality. The curse of dimensionality is to increase the computing time exponentially in proportion to the number of variables. So, many methods have been published for dimension reduction. Also, data augmentation is another approach to analyze data efficiently. Support vector machine (SVM) algorithm is a representative technique for dimension augmentation. The SVM maps original data to a feature space with high dimension to get the optimal decision plane. Both data reduction and augmentation have been used to solve diverse problems in data analysis. In this paper, we compare the strengths and weaknesses of dimension reduction and augmentation for classification and propose a classification method using data reduction for classification. We will carry out experiments for comparative studies to verify the performance of this research.

Food and Agriculture Statistics of the UN-FAO

  • Kim, Joo-Hwan
    • Communications for Statistical Applications and Methods
    • /
    • 제10권1호
    • /
    • pp.39-48
    • /
    • 2003
  • Quality in agriculture statistics at the international level is very important to all countries in the world. We investigate international organizations which produce worldwide agricultural statistics. The UN-FAO is one of the most important organization in agricultural statistics fields. We first introduce the Statistics division in FAO and present some considerations like production, reliability, quality of the agriculture data from my own experience as a consultant in FAO and Ministry of Agriculture and Forestry in Korea.

Spatial-Temporal Modelling of Road Traffic Data in Seoul City

  • 이상열;안수한;박창이;전종우
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권2호
    • /
    • pp.261-270
    • /
    • 2002
  • Recently, the demand of the Intelligent Transportation System(ITS) has been increased to a large extent, and a real-time traffic information service based on the internet system became very important. When ITS companies carry out real-time traffic services, they find some traffic data missing, and use the conventional method of reconstructing missing values by calculating average time trend. However, the method is found unsatisfactory, so that we develop a new method based the spatial and spatial-temporal models. A cross-validation technique shows that the spatial-temporal model outperforms the others.

  • PDF

Multivariate Nonparametric Tests for Grouped and Right Censored Data

  • Park Hyo-Il;Na Jong-Hwa;Hong Seungman
    • International Journal of Reliability and Applications
    • /
    • 제6권1호
    • /
    • pp.53-64
    • /
    • 2005
  • In this paper, we propose a nonparametric test procedure for the multivariate, grouped and right censored data for two sample problem. For the construction of the test statistic, we use the linear rank statistics for each component and apply the permutation principle for obtaining the null distribution. For the large sample case, the asymptotic distribution is derived under the null hypothesis with the additional assumption that two censoring distributions are also equal. Finally, we illustrate our procedure with an example and discuss some concluding remarks. In appendices, we derive the expression of the covariance matrix and prove the asymptotic distribution.

  • PDF

분위수 회귀를 이용한 가속수명시험 자료 분석 (Accelerated Lifetime Data Analysis Using Quantile Regression)

  • 노지연;김희정;나명환
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.631-638
    • /
    • 2008
  • 가속수명시험은 실제 사용조건보다 열악한 수준으로 시험하여 빠른 기간 내에 제품의 고장자료를 얻고, 실제 사용조건에서의 수명관련 품질 특성치를 추정하는 방법이다. 본 논문에서는 가속수명 자료를 이용하여 분위수 회귀추정 방법을 통해 정상 조건에서의 수명을 추정하는 방법을 제안한다. 대표적인 가속 스트레스인 온도와 전압을 갖는 실제 자료에 분위수 회귀 모형을 적용하여 수명을 추정하였다.

SUPPORT VECTOR MACHINE USING K-MEANS CLUSTERING

  • Lee, S.J.;Park, C.;Jhun, M.;Koo, J.Y.
    • Journal of the Korean Statistical Society
    • /
    • 제36권1호
    • /
    • pp.175-182
    • /
    • 2007
  • The support vector machine has been successful in many applications because of its flexibility and high accuracy. However, when a training data set is large or imbalanced, the support vector machine may suffer from significant computational problem or loss of accuracy in predicting minority classes. We propose a modified version of the support vector machine using the K-means clustering that exploits the information in class labels during the clustering process. For large data sets, our method can save the computation time by reducing the number of data points without significant loss of accuracy. Moreover, our method can deal with imbalanced data sets effectively by alleviating the influence of dominant class.

SUSHI 기반 학술정보 이용통계 수집 모델 연구 (A Study on the Acquisition of Usage Statistics based on SUSHI Project)

  • 김선태;임석종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.35-39
    • /
    • 2007
  • 최근 이용통계는 온라인 정보제공자로부터 폭넓게 제공받고 있다. 그러나 그 통계는 여전히 일치된 데이터 수집기로 이용할 수 없으며, 개별 정보제공자들의 관리 비용도 높은 상황이다. 표준화된 이용통계 수집을 주도하는 SUSHI는 정보제공사에서 제공한 이용통계를 도서관에 전자적으로 저장하기 위해 COUNTER 프로젝트를 실행할 자동화된 질의 응답 프로토콜을 개발하고 있다. SUSHI는 도서관들이 COUNTER 프로젝트의 통계를 활용함으로써 관리상의 업무부하 절감과 함께 의사결정을 지원할 것이다. 전자자원에 대한 이용통계의 기록과 교환에 있어서 출판사들이 COUNTER의 실무 규칙을 준수함으로써 최초로 저널과 데이터베이스들에 적용된다. 업체들은 COUNTER의 표준을 이용하여 엑셀이나 CSV 파일로 도서관 고객에게 제공할 수 있다. 그 결과 다양한 학술출판사와 정보서비스 기관에서 생성되고 있는 이용통계 데이터를 일관성, 신뢰성, 용이성을 확보할 수 있게 되는 것이다. 이에 본 연구에서는, 해외 전자저널 공동구매 컨소시엄인 KESLI의 전자저널 이용통계 수집 및 처리 절차를 분석하여, SUSHI에 기반한 전자저널 이용통계 수집 모델을 제안하고자 한다.

  • PDF

자료집합 비교 활동에서 나타나는 중학교 학생들의 통계적 추리(statistical inference)에 대한 연구 (Middle School Students' Statistical Inference Engaged in Comparing Data Sets)

  • 박민선;박미미;이경화;고은성
    • 대한수학교육학회지:학교수학
    • /
    • 제13권4호
    • /
    • pp.599-614
    • /
    • 2011
  • 통계교육에서 많은 연구자들이 자료집합 비교 활동을 통계적 추리를 위한 중요한 활동으로 강조한다. 자료집합 비교 활동은 2009년 개정 교육과정에서 중학교 확률과 통계 영역에 다시 포함되었다. 본 연구는 자료집합 비교 활동에서 중학교 학생들이 비형식적 추리를 경험하면서 추리통계에서 강조되는 어떠한 통계적 개념과 요소에 주목하는지, 자료집합 비교를 토대로 한 의사결정 과정에서 이러한 개념과 요소들을 어떻게 사용하는지 조사하고, 그 특성과 관점의 변화는 어떠한지 확인하였다. 연구 결과, 학생들은 비형식적 추리에서 자료값, 비교기준, 퍼짐, 표본과 같은 통계적 요소에 주목함을 확인하였으며, 학생들의 비형식적 추리에서 나타나는 특징을 자료값에 대한 관점, 비교기준에 대한 관점, 퍼짐에 대한 관점, 표본에 대한 관점, 네 가지로 구분하여 제시하였다. 그리고 자료집합 비교 활동이 중학교 학생들에게 비형식적 추리 경험을 제공함으로써 기술통계와 추리통계의 연결 도구가 될 수 있다는 가능성을 확인하였다.

  • PDF