2003.10a
-
일반적으로 모수에 대한 신뢰구간 추정량이 점 추정량보다 훨씬 더 선호되고 있으며 많이 알려져 있다. 그러나 이산형 분포의 경우에는 주로 대 표본 근사 이론에 입각한 근사 신뢰구간이 많이 사용되고 있다. 본 논문에서는 여러 가지 이산형 분포 가운데에서 가장 많이 활용되고 있는 이항분포와 포아송 분포의 모수에 대한 다양한 신뢰구간 추정량들을 소개하고 대 표본 근사 이론에 의한 신뢰구간뿐만 아니라 소 표본의 경우에도 유용하게 이용될 수 있는 신뢰구간 등을 살펴보고 이들 신뢰구간들을 비교하였다.
-
When the available sample is multiply type-II censored, the maximum likelihood estimators of the location and scale parameters of two- parameter exponential distribution do not exist explicitly. In this case, we propose several approximate maximum likelihood estimators by approximating the likelihood equations appropriately. We present an example to illustrate these estimation methods.
-
In this paper we present a new family of distributions that allows a continuous variation not only from normality to non-normality but also from unimodality to bimodality. Its properties are especially useful in studying and making inferences about models involving the univariate truncated normal distribution. The properties of the family and its applications are given.
-
In this paper, we obtain the estimator of system reliability for the bivariate Pareto model with bivariate type 1 censored data. We obtain the estimators and approximated confidence intervals of the reliability for the parallel system based on likelihood function and the relative frequency, respectively. Also we present a numerical example by giving a data set which is generated by computer.
-
The Bayes factors with improper noninformative priors are defined only up to arbitrary constants. So, it is known that Bayes factors are not well defined due to this arbitrariness in Bayesian hypothesis testing and model selections. The intrinsic Bayes factor by Berger and Pericchi (1996) and the fractional Bayes factor by O'Hagan (1995) have been used to overcome this problems. This paper suggests intrinsic priors for testing the equality of two lognormal means, whose Bayes factors are asymptotically equivalent to the corresponding fractional Bayes factors. Using proposed intrinsic priors, we demonstrate our results with a simulated dataset.
-
When X and Y have independent normal distributions, we develop a Bayesian testing procedure for the equality of two coefficients of variation. Under the reference prior of the coefficient of variation, we propose a Bayesian test procedure for the equality of two coefficients of variation using fractional Bayes factor. A real data example is provided.
-
This article provides integrated neural network models for the interest rate forecasting using change-point detection. The model is composed of three phases. The first phase is to detect successive structural changes in interest rate dataset. The second phase is to forecast change-point group with data mining classifiers. The final phase is to forecast the interest rate with BPN. Based on this structure, we propose three integrated neural network models in terms of data mining classifier: (1) multivariate discriminant analysis (MDA)-supported neural network model, (2) case based reasoning (CBR)-supported neural network model and (3) backpropagation neural networks (BPN)-supported neural network model. Subsequently, we compare these models with a neural network model alone and, in addition, determine which of three classifiers (MDA, CBR and BPN) can perform better. For interest rate forecasting, this study then examines the predictability of integrated neural network models to represent the structural change.
-
-
It is necessary to check the curvature of selected covariates in regression diagnostics. There are various graphical methods using residual plots based on least squares fitting. The sensitivity of LS fitting to outliers can distort their residuals, making the identification of the unknown function difficult to impossible. In this paper, we compare combining conditional expectation and residual plots(CERES Plots) between least square fit and robust fits using Huber M-estimator. Robust CERES will be far less distorted than their LS counterparts in the presence of outliers and hence, will be more useful in identifying the unknown function.
-
본 연구는 2000년 인구주택총조사에 기반하여, 국내 3,516개 읍면동 단위의 소지역을 마케팅 의사 결정 활용의 관점에서 유사한 인구 사회 경제 소비행태를 가지는 26개의 마이크로타겟(Micro Target) 군집을 구축하는데 그 초점을 두고 있다. 마이크로타겟 군집은 마케팅 의사결정과 마케팅 전략수립에 있어 핵심적 요건으로 기능하게 된다.
-
최근 활발히 행하여지고 있는 금융 CRM(customer relationship management)의 주요 목적은 고객의 이해도 증진을 통하여 은행의 수익성을 높이는데 있으며 또한 그 과정에서 높은 수익과 낮은 수익을 주는 고객을 여러 가지 유형으로 나누어 관리에 효율성을 도모한다. 일반적으로 고객 세분화의 중요변수로 고객수익성을 고려하고 이러한 고객 세분화 결과에 의해 마케팅 시사점을 도출하게 된다. 본 연구에서는 고객 세분화 그룹에 따른 수익성 변동과정을 모형화하여 보다 효율적인 고객관계 관리를 가능하게 하는데 있다. 수익성 변동의 모형화 과정은 수익금액에 따라 고객을 몇 개의 범주로 분류하여 여러 기간에 걸쳐 나타내는 고객별 범주의 변화 추이를 전이행렬(transition matrix)로 나타내고 마코프 모형을 이용한 전이 확률의 추정을 통하여 다음 시점에서의 각 범주별 고객의 수를 예측 가능함을 보인다.
-
최근 빈번한 여름철 집중호우로 인하여 인명과 재산에 큰 피해를 보고 있다. 이러한 여름철 집중호우에 대한 시, 공간적 변동 특성 분석의 필요성이 증가되고 있다. 이에 최근에 빈번히 집중호우가 발생하는 한반도 남서 지역에 18개 관측 지점에 대해 1981년부터 2000년까지 시간별, 연도별 집중호우의 빈도수를 조사하였다. 분석결과, 최근에 집중 호우의 빈도는 증가하였으며 1일 집중호우 빈도는 해안지방이 많았으며, 시간당 집중호우 빈도는 해안지역 뿐만 아니라 산악 또는 내륙 지역에서도 증가하였다. 또한 시간별 집중호우는 해안지역의 경우에는 새벽에 많았으나 산악 또는 내륙 지역은 오후에 빈도수가 많았다. 월별 집중호우는 8월, 7월, 9월, 6월 순으로 많았다. 8월이 가장 많은 이유는 장마 종료 후 태풍의 영향이 컸음을 알 수 있다. 이러한 분석 결과를 기초로 하여 향후 한반도 남서 지역 집중 호우 발생에 대한 시..공간적 변동의 기후학적 특성에 대한 이해력 향상에 도움이 될 것이다.
-
More elaborated methods allowing the usage of binary classifiers for the resolution of multi-class classification problems are briefly presented. This way of using FSVC to learn a K-class classification problem consists in choosing the maximum applied to the outputs of K FSVC solving a one-per-class decomposition of the general problem.
-
본 연구는 PC-cluster를 플랫폼으로 사용하는 호남지방 고해상도 기상예측시스템을 이용하여 기존에 광주의 고층자료만 사용했을 때와 흑산도의 고층자료를 추가하였을 때의 3차원 자료동화의 차이가 지리산을 중심으로 한 호남지방의 강수예측에 미치는 영향을 알아보고자 수치실험 결과와 호남지방의 관측결과를 통하여 모델을 통한 강수예측을 검증한 것이다. 광주와 흑산도의 자료로 강수예측 결과를 비교해 본 결과, 광주는 22일 12LST 이전부터 강수가 시작되었는데 광주의 고층자료만 사용한 EXP1에서는 강수가 나타나지 않는 반면에 흑산도가 추가된 EXP2에서는 강수예측이 향상된 것으로 나타났다. 따라서 흑산도의 고층 데이터가 추가된 3차원 자료동화가 광주 예측능력을 향상시킬 것으로 판단된다.
-
최근 30년간(1071-2000) 북동기류 유입시 목포지방 최고기온의 예측을 위하여 북동기류 유입시 통계적 특성을 분석하였다. 분석 내용은 최대풍향 발생빈도, 최고기온 및 풍속, 풍속별 최고기온, 전일 최고기온과 교차분석, 풍속별 최고기온 분석 및 전운량(하늘상태) 분석 등이다. 분석결과 계절에 따라 변화는 있으나 북동기류의 유입으로 인한 기온의 변화 경향에 몇 가지 특성을 발견할 수 있었다.
-
본 논문에서는 강수 자료의 예측에 사용되는 3-모수 카파 분포(KD3)에서의 모수 추정 방법을 알아보고 시뮬레이션을 통하여 모수 추정 방법에 따른 성능을 비교해 보았다. 이 분포의 모수
$\alpha,\;\beta,\;\mu$ 를 추정하기 위하여 적률추정법(MME), L-적률 추정법(LME), 최우추정법(MLE)을 적용하였다. 소표본의 경우뿐만 아니라 대표본의 경우에도 시뮬레이션을 통하여 추정법들의 성능을 비교하였다. 적률 추정법과 L-적률 추정법에서는 제약조건 하에서의 1차원 Newton-Raphson방법을 수정하여 이용하였다. MSE를 기준으로 한 시뮬레이션 결과, KD3의 모수 추정에 있어서 표본의 크기가 100보다 작으면 LME의 적용을 추천하고 표본의 크기가 100이상이면 MLE를 추천한다. -
본 논문에서는 일반화극치분포(GEV)와 r개의 순서통계량을 이용한 r-GEV를 기술하였다. 모수
$\mu,\;\sigma$ , k 를 추정하기 위해 최우추정법(MLE)과 Penalized MLE(P-MLE) 방법을 적용해 보았다. 이 분포를 원/달러 환율자료에 적용하여 일종의 재정위기 분석을 실시하였다. -
A tandem network in which all nodes have the same load is considered. We derive bounds on the probability that the total population of the tandem network exceeds a large value by using its relation to the stationary distribution. These bounds imply a stronger asymptotic limit than that in the large deviation theory.
-
본 논문에서는 로버스트 파라미터(robust parameter) 설계에서 다특성(multiple quality characteristics)인 경우 제어인자의 동시 최적화 조건을 찾는 방안으로 인자분석(factor analysis)에 의한 최적화 방안을 제시한다. 또한 하나의 사례를 들어 제안한 방안과 기존의 방안을 비교 연구하였다.
-
전기 설비의 가속 수명시험에서 절연재료의 열 수명 시험자료에 대한 통계적 분석지침으로 1987년 ANSI/IEEE Std. 101이 제정된 이래, 많은 실험의 결과 분석에 이용되어져 오고 있다. 그러나, ANSI/IEEE Std. 101 에서는 제한된 환경 하에서 얻어지는 소수의 자료를 분석에 이용하고 있어, 분석 결과의 정확성에 의문이 제기되고 있다. 본 논문에서는, ANSI/IEEE Std. 101에서 사용한 자료에서 얻은 통계량들을 근거로 Monte Carlo Simulation을 실시하여 분석지침에서 제시한 결과와 비교하여 보았다.
-
본 연구에서는 자동차용 방열기의 수명분포를 일반적으로 기계류에 적용하는 와이블분포라 가정하고 실험실 데이터를 이용하여 추정한다. 방열기 수명시험시 고려해야할 요소를 방열량, 기밀성, 내압 성능, 압력캡 시험 등 11가지로 정하고 이에 대한 신뢰성 관점에서의 해석 및 MINITAB을 이용한 추정을 주요내용으로한다.
-
본 연구는 확산모형의 계산에 필요한 바람장의 시간해상도의 타당성을 파악하고, 대기역학모형과 대기확산모형의 공간 분해능에 따른 시간분해능이 미치는 영향을 분석한 것이다. 연구결과, 수치실험에서 초기(24시)의 경우, 시간해상도에 따른 확산의 차이는 크지 않았으나 시간이 경과함에 따라 입자확산분포의 차이가 크게 나타났다. 또한, 3시간 이하의 높은 시간해상도의 경우 입자분포의 차이가 크지 않으나, 6시간보다 간격이 큰 자료를 이용할 경우, 황사 입자분포의 양적 측면에서 큰 차이를 나났다. 입력 바람장의 시간 간격이 큰 경우에 부유 입자는 지역의 주풍 성분을 따라 분포하였다. 한편, 시간간격이 작은 경우 주풍의 직각성분인 남북성분의 효과가 크게 나타났다.
-
Recently, the importance of livestock statistics is increasing because of the food consumption pattern in Korea is changing. We compare the old sample design based on the 1995 National Agriculture Census with the new sample design based on the 2000 National Agriculture Census. We present some considerations to improve the efficiency of the sample design in livestock sector survey.
-
One of the well-studied problems in data mining is the search for association rules. The goal of association rule mining is to find all the rules with support and confidence exceeding some user specified thresholds. In this paper we consider the relation between the measure of association and the criteria of association rule for ordinal data.
-
Decision tree algorithms are used extensively for data mining in many domains such as retail target marketing, fraud dection, data reduction and variable screening, interaction effect identification, category merging and discretizing continuous variable, etc. CHAID(Chi-square Automatic Interaction Detector), is an exploratory method used to study the relationship between a dependent variable and a series of predictor variables. CHAID modeling selects a set of predictors and their interactions that optimally predict the dependent measure. In this paper we explore CHAID algorithm in view of accuracy and speed by sampling proportion.
-
K-means clustering has been widely used in many applications, such that pattern analysis, data analysis, market research and so on. It can identify dense and sparse regions among data attributes or object attributes. But k-means algorithm requires many hours to get k clusters, because it is more primitive and explorative. In this paper we propose a new method of k-means clustering using the grid-based representative value(arithmetic and trimmed mean) for sample. It is more fast than any traditional clustering method and maintains its accuracy.
-
Decision tree algorithms are used extensively for data mining in many domains such as retail target marketing, fraud dection, data reduction and variable screening, etc. CHAID(Chi-square Automatic Interaction Detector), is an exploratory method used to study the relationship between a dependent variable and a series of predictor variables. In this paper we propose and CHAID algorithm by cube-based sampling and explore CHAID algorithm in view of accuracy and speed by the number of variables.
-
K-means clustering has been widely used in many applications, such that pattern analysis or recognition, data analysis, image processing, market research and so on. It can identify dense and sparse regions among data attributes or object attributes. But k-means algorithm requires many hours to get k clusters that we want, because it is more primitive, explorative. In this paper we propose a new method of k-means clustering using the grid-based sample. It is more fast than any traditional clustering method and maintains its accuracy.