Proceedings of the Korean Statistical Society Conference (한국통계학회:학술대회논문집)
The Korean Statistical Society
- 기타
Domain
- Mathematics > Models/Data analysis
2002.11a
-
In financial time series, the autoregressive conditional heteroscedastic (ARCH) models have been widely used for modeling conditional variances. In many cases, non-normality or heavy-tailed distributions of the data have influenced the estimation methods under normality assumption. To solve this problem, a robust function for the conditional variances of the errors is proposed and compared the relative efficiencies of the estimators with other conventional models.
-
본 논문에서는 급변하는 농촌의 환경을 충분히 반영할 수 있도록 1997년도에 설계되어 사용되고 있는 현행의 농가경제조사를 개선하였다. 새로운 표본 조사구를 선정하기 위하여 1999년도와 2000년도 농가경제조사 조사데이터와 2000년에 실시된 농어업총조사 결과를 심도 있게 분석하였다. 이를 기초로 현재의 농촌 실정에 적합한 조사모집단을 새롭게 구성하였고, 현재의 농촌 환경을 반영할 수 있는 층화 기준을 마련하여 표본 조사구를 추출하였다. 또한, 논벼를 비롯한 6개 주요작물들에 대한 농산물생산비조사의 정도(精度) 향상을 위해서 각 작물별 주산지를 표본 조사구로 선정하였다.
-
농업기본통계조사의 현행 표본은 1995년 농업총조사 결과를 모집단으로 선정한 것이므로 표본설계 시 고려되는 모집단의 기본 구조 변화 및
${\ulcorner}$ 2000년 농업총조사${\lrcorner}$ 결과에서 나타난 변화된 특성을 제대로 반영하지 못하고 있으므로${\ulcorner}$ 2000년 농업총조사${\lrcorner}$ 결과를 바탕으로 모집단을 새로이 구성하여 변화하는 농가 구조를 반영하고, 기존 표본의 노후화를 방지하며, 기존 통계 생산을 유지하면서 신규 통계를 생산할 수 있도록 표본설계를 하였다. -
본 연구에서는 2000년 어업총조사 결과를 토대로 전국의 어업별, 어종별 수산물의 비계통생산량에 관한 통계를 정도높게 산출할 수 있는 표본설계를 하고, 그에 따른 추정식을 마련함으로써 보다 편리하면서도 신뢰성이 높은 어종별 총생산량 통계를 산출하도록하였다. 본 설계에서는 가능한 한 기존의 설계에 비해 업무량이 크게 늘어나지 않는 범위내에서 효율적인 통계를 생산하는 것을 기본방향으로 하고 있으며 구체적인 방향들은 첫째, 조사 설계의 목적이 '비계통어업생산량'의 효율적인 추정인 만큼 각 어종들의 생산량 추정치의 정도를 높이는 것을 주목적으로 정하였다. 둘째, 조사대상 어종이 114종에 이르고 어종별 비계통생산량이 상이함으로 어종별 정도를 고려하면 거의 전수조사를 해야하는 실정이므로 해양수산부에서 요청한 주요 어종과 어류생산 어가가 많은 어류 등 41개 어로어업 어종과 11개 양식어업 어종의 생산총계가 정도높게 작성될 수 있도록 표본설계를 하였다. 셋째, 표본의 할당 및 추출은 조사원의 업무량의 범위를 크게 벗어나지 않도록 하였다.
-
본 연구에서는 2000년 어업총조사에서 얻은 어가를 모집단으로 하여 어가경세조사를 위한 표본설계룰 하였다. 진체 어가를 전업 및 1종 겸업어가를 포함하는 부차모집단1과 2종 겸업어가로 구성된 부차모집단2로 구분하였다. 새로운 표본설계에서는 최적 집락크기를 구하고, 층화를 위해서 SAS Enterprise Miner에서 제공하고 있는 의사결정나무모형(Decision Tree Model)을 이용하였다. 층별 표본배정은 네이만 배정법을 사용하였고 두 가지 추정법을 제시하였다.
-
이 글은 체육 및 운동과학 연구에서 각종 통계적 방법의 출현을 역사적으로 개관하고 이들 통계적 방법의 출현시기를 미국의 경우와 비교함으로써 한국 체육학연구의 학문적 성장을 확인하고 이들 방법 적용과정에서 나타난 문제점을 밝히는데 목적이 있다. 이러한 목적을 달성하기 위해 통계적 방법 관련논문을 분석하고 통계적 방법이 체육 현장에서 어느 정도 중요하게 다루어 질 수 있는지를 확인하기 위해 측정,평가 담당교수의 학문적 배경과 교육적 경력을 조사하였다. 전공자의에 대한 의 체육학이 아직 학문적으로 자리를 잡기 전인 최초 태동 시기에 적용된 통계적 방법을 미국의체육학회지(RQES)와 비교해 볼 때 동일한 통계적 방법의 적용시기는 약 30년 차이가 있다. 이러한 차이는 미국에서 1980년도에 나타나기 시작한 진보된 다변량 통계기법을 1990년대에 적용하기 시작하면서 급속도로 좁혀졌으며 현재는 동일한 시기에 나타나고 있다. 그러나 진보된 통계적 기법의 출현에도 불구하고 이들 기법을 적용하는데 필요한 기본가정이 충족되었는지에 대한 검토 없이 적지않은 논문이 보고되고 있다. 담당교수의 학문적, 교육적 배경이 통계학과 거리가 있는 교수가 47%로 나타남으로써 가르치는 내용과 범위에서 적지않은 제약이 따르고 있다. 또한 전문가에 의한 평가체제가 확립되지 못함으로써 적용된 통계적 기법의 적절성을 평가하는데 장애가 되고 있다.
-
스포츠 통계와 관련된 주제들은 경기결과의 설명 예측력 분석, 선수와 팀 평가, 경기내용의 요약, 경기의 환경적 요인 평가, 경기 규칙 분석, 경기결과의 시각적 표현, 토너먼트 구조 연구 등의 영역으로 다양하다. 이 글에서는 야구 축구 농구 테니스 종목을 중심으로 통계적 방법을 적용하여 스포츠 현장의 문제를 어떻게 접근하고 있는지를 개괄하였다. 전통적으로 스포츠 통계는 선수와 팀 그리고 전략의 평가가 주를 이루었지만, 오늘날 스포츠통계는 경기의 잠재적, 외적 요인 등의 주제로 관심영역을 넓혀가고 있다. 그러나 국내에서는 경기내용의 기술적(descriptive) 분석이 주류를 이루고 있으며, 전문적 수준의 통계적 접근은 활발하지 못하고 있다. 현장과 자료의 특성을 고려하여 통계와 스포츠(체육)분야의 다양한 협동연구가 필요하다.
-
통계학은 불확실성(uncertainty)에 대한 연구이다. 베이지안 통계 방법은 불확실성 아래서 통계 추론과 의사 결정 모두를 위한 완전한(complete) 패러다임을 제공한다. 베이지안 방법론은 합리적인 초기 정보와 결합하는 것을 가능하게 만들고, 전통적인 통계적 방법론에 의하여 직면하는 많은 어려움들을 풀 수 있는 coherent 방법론을 제공하면서 엄격한 수학적 기본에 근거하고 있다. 베이지안 패러다임은 일반적인 용어로써 확률이란 단어의 사용을 가장 잘 어울리게 하는 불확실성의 조건부 측도(conditional measure of uncertainty)로써 확률의 해석에 근거한다. 관심있는 것에 대한 통계적 추론은 증거의 관점에서 그 값에 대한 불확실성의 변형으로써 묘사되며, 베이즈 정리(Bayes' theorem)는 이러한 변형이 어떻게 만들어지는 가를 자세히 설명할 수 있다. 베이지안 방법들은 전통적인 통계적 방법론에 접근할 없는 복잡하고, 다양한 구조적 문제들에 응용할 수 있다.
-
본 발표에서는 베이지안이 생각하는 확률의 개념을 상호교환성(exchangeability)의 가정아래 어떻게 확장되어 해석되는지를 소개하고, 빈도학자들의 접근방법과 비교함으로서 베이지안에서 생각하는 확률이 어떠한 특징을 가지고 있는지를 설명하고자 하였다. 또한 Efron에 의하여 지적된 베이지안의 네 가지 문제점에 대하여 논의하고 특별히 과학적 객관성(scientific objectivism)의 한계점과 이러한 한계점을 베이지안에서 어떻게 해결하고 있는지에 대하여 논의하였다. 일반적으로 과학적 객관성에 대한 한계점은 빈도학자들의 방법론에서도 존재하게 된다. 즉, 연구자가 가설을 설정하고 이에 맞는 실험설계를 하고 유의수준을 설정하고 p값을 이용하여 의사결정을 내리는 모든 단계에서 연구자의 주관성이 들어갈 수밖에 없게 된다는 것이다. 베이지안 방법론에서는 이러한 비객관적인 체계를 인정하고 파악하여 사전확률(prior)에 포함시킴으로서 이를 객관적인 자료인 가능도함수(likelihood function)와 혼합하여 추론이나 의사결정을 진행하게 된다. 마지막으로 베이지안 학자들의 최근 객관적인 사전확률에 대한 다양한 형태의 연구를 소개하는 것으로 발표를 마무리하고자 한다.
-
We report several case of the statistical consulting in Oriental medicine. Recently, we are interested in the Oriental Gynecology. In this problem, the type of differentiation of symptoms and signs are classified based on a diagnostician in the questionnaire.
-
A phase III clinical trial of a new drug for neutropenia induced by chemotherapy is presented and consider adding random effects in crossover design which was used in the clinical study. The diagnostics for its heteroscedasticity based on score statistic is derived for detecting homoscedasticity of errors in crossover design. A small simulation study is peformed to investigate the finite sample behaviour of the test statistic which is known to have an asymptotic chi-square distribution under the null hypothesis.
-
통계상담 요약보고서는 상담원과 의뢰인간에 제한된 시간 내에 원활한 통계상담을 위해선 일정한 절차와 내용을 포함하고 있다. 즉, 연구제목, 연구목적, 연구내용, 자료의 구성 등을 차분히 의뢰인에게 물어 가는 것이다. 또한 의뢰인과 처음 상담 후에 상담실장과 면담시 상담내용을 검증 받기 위한 것으로 통계상담 요약 보고서의 활용을 생각할 수 있다. 상담원은 통계 상담요약 보고서를 꾸미고 이 내용을 상담실장에게 설명하면서 자신이 상담한 내용에 대해 구체적으로 인식하게되고 간결하게 요약 보고하는 능력도 기르게 된다. 사실상 상담실장과의 면담은 상담원이 의뢰인이 되고 상담실장이 상담원이 되는 역할을 경험해보는 좋은 과정으로 교육적 효과가 크다고 여겨진다.
-
본 연구는 현재 통계학회의 홈페이지(http://www.kss.or.kr)를 통해 서비스중인
${\ulcorner}$ 통계학용어 온라인 대조표${\lrcorner}$ 를 개인의 PC에 설치하여 보다 손쉽게 통계용어의 검색에 활용할 수 있도록 소프트웨어로 재구성한 것이다. 따라서 사용자는 웹에 접속이 불가능한 경우에도 알파벳이나 가나다순의 검색 및 키워드를 입력한 검색이 가능하며, 검색된 결과의 레이아웃이나 글꼴을 조정하여 출력도 가능하다. 구현된 소프트웨어는 앞으로 추가되는 자료가 있더라도 사용된 데이터베이스만을 업데이트하면 소프트웨어에 대한 추가수정 없이 재사용이 가능하도록 구성되었다. -
We consider an estimation of discontinuous variance function in nonparametric heteroscedastic random design regression model. We first propose estimators of a change point and jump size in variance function and then construct an estimator of entire variance function. We examine the rates of convergence of these estimators and give results on their asymptotics. Numerical work reveals that the effectiveness of change point analysis in variance function estimation is quite significant.
-
In this paper we propose a change-point estimator with left and right regressions using the sample Fourier coefficients on the orthonormal bases. The asymptotic properties of the proposed change-point estimator are established. The limiting distribution and the consistency of the estimator are derived.
-
In this paper, we obtain an explicit formula of the Laplace transform of the forward recurrence time at finite time t > 0 in an alternating renewal process, by adopting a Markovian approach. As a consequence, we obtain the first two moments of the forward recurrence time.
-
We consider a multi-state flow network consisted of undirected links and focus on how to find efficiently the union of minimal paths transmitting a required flow when minimal paths are known.
-
In this paper, we define an availability of network, when the states of links are modeled by alternating renewal processes. The actual availabilities of some simple networks are obtained and compared to each other.
-
네트워크를 설계하거나 평가하는데 있어 중요한 문제 중 하나는 그 네트워크를 구성하는 요소들간의 상대적 중요도(importance)에 관한 문제이다. 이런 중요도를 나타내는 여러 가지 측도들 중 하나인 Joint Reliability Importance(JRI)는 Hong & Lie(1993)에 의해 소개되었으며, 네 가지 파생된 서브그래프의 신뢰성을 구하여 JRI를 계산하는 방법이 제시되었다. 본 연구에서는 minimal path set을 이용하여 파생되는 서브 그래프 신뢰성 계산에서의 중복되는 계산과정을 줄임으로써 JRI를 보다 효율적으로 구하는 방법을 제시하고자 한다.
-
변량추출비 관리도는 현재의 관측값에 기초하여 다음 시점의 표본크기와 표본추출간격을 변화시키면서 공정의 변화를 탐지하는 관리도 절차이다. 만일 공정에서 추출한 현재의 관측값을 살펴볼 때 공정변화의 징후가 있는 경우에는 다음 시점의 표본추출비를 증가시켜, 즉 표본크기를 크게 하고 표본추출간격을 작게 하여 예상되는 공정변화를 더 빠르고 정확하게 탐지함으로보다 효율적인 공정관리를 수행하는 것이다. 본 연구는 변량추출비
${\bar{X}}$ 관리도에서 사용하는 표본크기와 표본추출간격의 수를 달리하며 각각의 경우에 대한 통계적 효율을 계산하고 이를 비교하고자 한다. -
In this article we consider the problem of constructing confidence intervals for a linear regression model with nested error structure. A popular approach is the likelihood-based method employed by PROC MIXED of SAS. In this paper, we examine the ability of MIXED to produce confidence intervals that maintain the stated confidence coefficient. Our results suggest the intervals for the regression coefficients work well, but the intervals for the variance component associated with the primary level cannot be recommended. Accordingly, we propose alternative methods for constructing confidence intervals on the primary level variance component. Computer simulation is used to compare the proposed methods. A numerical example and SAS code are provided to demonstrate the methods.
-
Burn-in is a widely used method to eliminate initial failures. Preventive maintenance policy such as block replacement with minimal repair at failure is often used in field operation. In this paper burn-in and maintenance policy are taken into consideration at the same time. The cost of a minimal repair is assumed to be a non-decreasing function of its age. The problems of determining optimal burn-in times and optimal maintenance policy are considered.
-
축점의 위치가 두 개의 수에 의하여 지정되는 변형된 중심합성계획을 제시하고 이 계획의 성질을 연구하였다. 이 계획이 직교계획이 되기 위한 조건과 회전계획이 되기 의한 조건을 구하였으며, 회귀계수들을 추정하는 관점에서 이 계획의 효율성을 다른 계획들과 비교하였다.
-
일반적으로 p-값은 귀무가설에 의하여 주어지는 통계적 모형과 현재 관측치 사이의 호환성의 측도로써 가장 널리 쓰이는 개념중의 하나로 간주될 수 있다. 이 연구에서는 고전통계학에서의 고전적 p-값에 대응하는 베이즈 관점에서의 베이즈 p-값을 제안하고 그 성질에 대하여 고찰한다.
-
전형적인 시공간모형은 시공간 변이도(semivariogram) 또는 공분산 함수(covariance function)를 필요로 한다. 본 논문에서는 계산하기 어렵고 현실적이지 못한 결합 공분산함수를 통한 고전적 모형 대신, 일련의 독립적인 조건분포를 이용하는 보다 현실적인 베이지안 계층모형을 이용한다. 미국 전 지역에 산재해 있는 138개 기온 관측소로부터 얻어진 61년(1920-1980) 동안의 연기온편차 자료에 시공간 베이지안 계층모형을 적용하고 순수시계열모형에서의 적합값과 제안된 모형의 적합값을 비교분석한다.
-
본 연구는 k개 지수분포 모수들의 기하평균에 대한 베이지안추정 방법을 제시하였다. 이를 위해 Tibshirani가 제안한 직교변환법으로 비정보적 사전확률분포를 도출하여 모수들의 결합사후확률분포를 유도해 내었으며, 이 분포 하에서 가중 몬테칼로 방법을 사용하여 기하평균을 추정하는 절차를 제안하였다. 모의실험과 실제자료의 예를 통해 제안된 베이지안 추정의 유효성 및 효용성을 보였으며, 본 연구에서 제안한 사전확률분포가 전통적인 포함확률을 기준으로 볼 때, Jeffrey의 사전확률분포 보다 더 유효한 추정을 함을 보였다.
-
A number of controlled selection methods, which have some advantages for practical surveys in considering controls beyond stratification, have developed throughout the last half-century. With respect to the optimization of sampling plan, it is obvious that we may use optimal controlled selection in preference to satisfactory controlled selection. However, there are currently certain restrictions on the employment of optimal controlled selection. We present further research to improve an algorithm for optimal controlled selection and to develop standard software.
-
층화 추출법에서 층의 경계점을 정하는 문제는 추정의 효율에 직접적으로 영향을 미치기 때문에 매우 실제적이고 중요한 문제이다. 층화변수가 일변량 연속변수인 경우 널리 알려진 방법으로는 누적도수제곱근법과 Ekman법이 있는데 이 두 방법은 모두 나름의 약점을 지니고 있다. 본 논문에서는 Breiman 등(1984)이 제시한 CART 기법 중 회귀나무(regression tree)모형을 이용하여 층의 경계점을 정하는 방법을 소개한다. 그리고 통계청의 어업총조사 자료를 사용하여 층의 경계점을 정하는 여러 다른 방법들의 효율을 비교한다.
-
본 논문에서는 초 모집단 모형 하에서 HT 추정량의 분산의 하한에 관계된 층화추정량의 효율성에 대해 다루었다. 특별히 Dalenius-Hodges 층화와 표본배분방법 중 멱배분(power allocation)을 적용했을 때 최소분산 성질에 대해 살펴보았다.
-
Sales of equity-indexed annuities (EIAs) have rapidly increased, but the growth rates in sales have recently shown signs of slowing down because the current volatile equity market increases the costs of guarantees in EIAs. New EIAs need to be designed that are similar to existing EIAs but have a cheaper guarantee and a higher participation rate. This paper proposes three types of EIAs with higher participation rates: up-and-in barrier EIA, aulual reset EIA with up-and-in barriers, and partial-time lookbackEIA. It also presents a probability distribution and the method of Esscher transforms, with which explicit pricing formulas for these EIAs are derived.
-
The healthy worker effect is an important issue in occupational epidemiology. We proposed a new statistical method to test the relationship between exposure and time to death in the presence of the healthy worker effect. In this study, we considered the healthy worker hire effect to operate as a confounder and the healthy worker survival effect to operate as a confounder and an intermediate variable. The basic idea of the proposed method reflects the length bias-sampling caused by changing one's employment status. Simulation studies were also carried out to compare the proposed method with the Cox proportional hazards models. According to our simulation studies, both the proposed test and the test based on the Cox model having the change of the employment status as a time-dependent covariate seem to be satisfactory at an upper 5% significance level. The Cox models, however, are inadequate with the change, if any, of the employment status as time-independent covariate. The proposed test is superior in power to the test based on the Cox model including the time-dependent employment status.
-
Post-genome 시대를 맞이하여 인류는 전 유전체에서의 염기서열에 대한 정보를 가질 수 있게 되었다. 이러한 정보를 이용하여서 인간에게 나타나는 다양성을 설명하기 위해서 SNP(Single Nucleotide Polymorphism)의 연구가 활발히 되고 있다. 하지만 인간 체세포의 염색체는 2쌍으로 되어있기 때문에 이러한 정보가 어떠한 쌍의 조합(haplotype)으로 나타나는가를 고려하여야한다. 현재 실험적 방법으로 이를 고려하기에는 여러 가지 제약이 따르므로 통계적인 방법으로 이를 모형화하려는 노력(in silico haplotyping)이 시도되고 있다. 이 논문에서는 통계적으로 haplotype을 정하는 대표적인 알고리즘인 Clark's algorithm, E-M algorithm 등에 대한 고찰을 통하여 유전체통계학에 대한 소개를 하고자 한다.
-
We study maximal second moment inequality and derive complete convergence for weighted sums of asymptotically almost negatively associated(AANA) random variables by applying this inequality. 2000 Mathematics Subject Classification : 60F05
-
In this paper, we establish weak laws of large numbers for weighted sums of convex-compactly uniformly integrable fuzzy random variables taking values in the space of upper-semicontinuous fuzzy sets in R
$^{p}$ . -
For a positive integer m, operator m-semi-stability and the strict operator m-semi-stability of probability measures on
$R^{d}$ are defined. The operator m-semi-stability is a generalization of the definition of operator semi- stability with exponent Q. Translation of strictly operator m-semi-stable distribution is discussed. -
표본의 크기가 작을 경우에 이항분포의 모수에 대한 신뢰구간을 구하는 대표적인 방법으로는 Clopper-Pearson 방법과 Blyth-Still 방법이 있다. Clopper-Pearson 방법에 의한 신뢰구간은 이항 모수가 포함되는 커버리지 확률이 목표로 하는 신뢰수준보다 상대적으로 크다는 문제점이 있다. Blyth-Still 방법은 이러한 문제점을 개선시켰다. 그러나, Blyth-Still에 의해서 표로 보고된 신뢰구간을 적용할 경우 표본의 크기와 이항 모수의 값에 따라서 커버리지 확률이 목표하는 신뢰수준보다 작은 경우가 발생한다. 그러나, 이는 Blyth-Still 방법 자체의 문제점이 아니며 단지 보고된 표의 유의한 소수점 자릿수와 관계가 있다. 본 논문은 Blyth-Still 방법에 의한 좀 더 정확한 신뢰구간을 제시한다.
-
통계학과 교육과정의 개선에 관한 연구를 비롯한 몇몇 응용 논문을 통하여 통계학과에서 데이터베이스 교육이 중요하다는 사실은 간혹 언급되어 왔으나, 그 구체적인 교육 방법에 관해 논의한 연구는 찾아보기 힘들다. 본 연구에서는 통계학과에서 데이터베이스 교육의 필요성 및 교육 방안에 관해 생각해보고자 한다. 따라서 본 논문의 목적은 통계학과에서 데이터베이스를 교육할 때 어떻게 통계학이라는 학문과 연관지어 교육할 수 있을 것인가에 대해 살펴보는 것이다.
-
통계학 과목 교수 시 보조 수단으로 자주 사용하는 것이 통계패키지이다 이러한 통계패키지 외에 수학패키지를 통계학 과목 수업에 활용하면 학습효과를 높이는 데 효과적일 것이다.
-
정보통신 기술의 발달로 인해 협동학습 영역에 대한 연구가 각 전공영역에서 활발히 진행되고 있다. 통계학 교육에서도 협동학습은 새로운 교육방법은 아니며, 협동학습을 통해 교육의 효과를 높이는 몇몇 연구가 수행되었다. 그러나 대부분의 연구들이 근래의 발달된 정보통신 기술들을 적절히 활용하지 못하고, 과거의 방식에만 얽매여있는 것이 현실이다. 본 연구에서는 정보통신 기술을 적절히 활용한 협동학습 지원시스템을 설계하고 구현 사례를 제시한다.
-
최근 다변량자료분석과 관련하여 이를 시스템으로 구현하려는 연구가 다양한 각도로 이루어지고 있다. 이러한 연구들의 공통적인 특징은 일반 사용자들에게 고급 통계분석기법을 편리하게 활용할 수 있도록 GUI(Graphical User Interface) 환경의 시스템을 제공해 준 것이다. 이런 연구의 연장선상에서 본 연구에서는 다변량자료분석 시스템을 구현하는데 있어 사회 각 분야에서 가장 널리 활용되고 있는 사무용 프로그램인 마이크로소프트(Microsoft) Excel을 활용하여 일반 사용자들도 다변량분석을 쉽게 활용할 수 있도록 대화식 시스템을 개발하였다.
-
기업의 입장에서 가장 중요한 이슈 중 하나는 자사에 있는 많은 고객들 중 회사에 수익을 가져다 줄 수 있는 고객이 누구인가라는 문제이다. 이러한 문제에 대한 기업의 고객 관리 전략 중 하나가 '교차판매(Cross-Selling)' 전략이다. 본 연구에서는 국내 A 손해보험사의 고객 데이터베이스를 활용하여 데이터마이닝프로세스가 어떻게 진행되고 있는지를 실제 프로젝트를 중심으로 설명하고자 한다. 특히, 본 연구에서 목표로 하고 있는 것은 기존의 자동차보험에 가입한 고객 중에서 장기보험에 추가로 가입하는 고객을 설명하기 위한 교차판매 스코어링 모델을 개발하는 것이다.
-
고객과의 커뮤니케이션 및 관계유지로 대변되는 CRM(Customer Relationship Management)이 기업들의 가장 중요한 이슈로 부각되고 있다. 특히 전사적 관점의 CRM에서 통합 데이터베이스 정보를 분석하고 모형화하여 고객관리를 과학적이고 전략적으로 접근하려는 분석 CRM(Analytical CRM) 분야의 움직임이 가속화되고 있다. 이런 관점에서 본 연구에서는 분석 CRM의 핵심 요소인 데이터마이닝 기법을 이용하여 개발한 이탈 고객 스코어링 모델을 마케팅 층(Marketing Layor)에 연결해주는 캠페인 시스템을 개발하고자 한다. 개발한 시스템은 이탈 스코어링 결과 및 고객 이탈방지를 위한 캠페인 대상자 선정 작업을 쉽게 할 수 있도록 GUI 환경에서 제공해줌으로서 일반 사용자들이 쉽게 활용할 수 있도록 하였다.
-
CLV(Customer Lifetime Value; 고객생애가치)는 한 고객이 기업의 고객으로 존재하는 전체 기간동안 그 기업에게 제공할 것으로 추정되는 잠재적인 수익의 합계로 정의할 수 있으며, CRM(Customer Relationship Management)이 기업의 경쟁력 강화를 위한 핵심 수단으로 등장하면서 고객가치에 대한 측정 및 분석의 필요성이 증가하고 있다. 본 연구에서는 CLV를 측정하기 위해서 제안된 여러 모형들을 소개, 비교하고 몇 가지 측면에서 기존 모형들의 단점을 보안할 수 있는 모형들을 제안하고자 한다.
-
An Integer-valued autoregressive integrated (INARI) model is introduced to eliminate stochastic trend and seasonality from time series of count data. This INARI extends the previous integer-valued ARMA model. We show that it is stationary and ergodic to establish asymptotic normality for conditional least squares estimator. Optimal estimating equations are used to reflect categorical and serial correlations arising from panel count data and variations arising from three random processes for obtaining observation into estimation. Under regularity conditions for martingale sequence, we show asymptotic normality for estimators from the estimating equations. Using cancer mortality data provided by the U.S. National Center for Health Statistics (NCHS), we apply our results to estimate the probability of cells classified by 4 causes of death and 6 age groups and to forecast death count of each cell. We also investigate impact of three random processes on estimation.
-
In this paper, with martingale argument we derive the explicit formula for the Laplace transform of the busy period of M/M/1 queue with bounded workload which is also called finite dam. Much simpler derivation than appeared in former literature provided.
-
In this paper we consider the problem of testing for structural changes in ARIMA models based on a cusum test. In particular, the proposed test procedure is applicable to testing for a change of the status of time series from stationarity to nonstationarity or vice versa. The idea is to transform the time series via differencing to make stationary time series. We propose a graphical method to identify the correct order of differencing.
-
최근 여러 분야에서 로지스틱 회귀에 대한 필요성과 그 응용이 급증하면서 이를 분석하기 위한 통계패키지가 많이 개발되어 사용되고 있다. 이 논문에서는 자료의 유형에 따라 활용할 수 있는 여러 형태의 로지스틱 회귀모형을 간단히 살펴보고, SPSS, SAS, STATA, MINITAB과 같은 통계패키지를 사용하여 로지스틱 회귀모형에 적용할 때 각각 다룰 수 있는 범위와 그 특징에 대해 다룬다.
-
We propose an improved version of Kim (2000) to the effect that in principle we may deal with a graphical model of any size. Kim (2000) proposed a method of estimating parameters for a model of categorical variables which is too large to handle as a single model. We applied the proposed method to a simulated data of 158 binary variables.
-
본 연구에서는 자궁 내 태아의 발육지연이 주산기 사망률 및 이환율을 증가시키는 고위험 임신의 한 예로써, 태아 발육제한증과 관련한 비선형적인 자료를 통계적인 방법으로 접근하는데 초점을 두었다. 이에 정상태아와 발육제한증 태아를 판별하기 위한 분석을 실시함에 있어 신경망 이론 중 하나인 다층 퍼셉트론 모형으로 예측하고자 하였다.
-
소지역에서 직접(direct) 시계열추정을 할 수 있다면, 소지역들 추정에서 최적선형 불편예측량(BLUP)을 일반화 시킬 수 있다. 특히 조사에서 얻어지는 관측 값의 오차가 시간상으로 상관관계가 있다면 Kalman-Filter(K-F)기법이 사용 될 수 있다. 이 연구는 소지역의 실업자 수 추정에서 K-F기법으로 경제활동인구수를 이용하여 현 시점의 소지역 실업자 수를 예측함수(BLUP)를 통해 추정하였다. 그리고 단순 회귀분석 추정치와 비교하였다.
-
자료행렬에서 개체와 변수간의 관계성을 시각적으로 표현하기 위한 방법 중의 하나가 행렬도이다. 본 논문에서는 전문적인 통계 패키지를 이용한 행렬도 구현이 아니라, 가장 널리 사용되는 응용프로그램 중의 하나인 Excel 에서 VBA를 이용하여 행렬도 시스템을 구현하였다.
-
상가건물임대차보호법의 시행령을 제정하는데 필요한 근거정보를 수집하기 위한 임차 사업체조사의 표본설계과정과 추정법을 설명하고 주요 조사결과를 제시하였다.
-
Variance estimation for the regression estimator for a two-phase sample is investigated. A replication variance estimator with number of replicates equal to or slightly larger than the size of the second-phase sample is developed. In these cases, the proposed method is asymptotically equivalent to the full jackknife, but uses smaller number of replications.