• 제목/요약/키워드: 파레토 분포

검색결과 57건 처리시간 0.026초

TTT 타점법을 이용한 웹서버 파일 분포의 후미성 분석 (A Analysis of Heavy Tailed Distribution for Files in Web Servers Using TTT Plot Technique)

  • 정성무;이상용;장중순;송재신;유해영;최경희
    • 정보처리학회논문지A
    • /
    • 제10A권3호
    • /
    • pp.189-198
    • /
    • 2003
  • 본 논문에서는 TTT 타점법을 이용하여 웹 서버가 서비스하는 파일의 크기에 대한 통계적 분포는 꼬리부분이 두꺼운 분포라는 것을 판단하는 방법을 제시한다. TTT 타점법은 신뢰성 공학에서 사용되는 방법으로써 TTT 통계량 타점결과의 직선성으로 지수분포 여부를 판단하는 방법이다. 본 연구에서 제안하는 방법을 모의실험과 실제 운영중인 웹서버의 자료를 사용하여 실험한 결과, 기존의 방법인 Hill 추정법과 LLCD 타점법에 비하여 후미성을 정확하게 판단하고 있으며, 판단의 효율성 면에서도 그들보다 우수하다는 것을 확인하였다. 특히 제안하는 방법은 기존의 방법이 웹서버의 파일 분포판정이나 통계학에서의 파레토 분포 판정시 나타날 수 있는 판정의 오류 가능성을 개선할 수 있다는 점도 확인하였다.

다목적함수를 이용한 PDM 모형의 유량 분석 (Prediction of Stream Flow on Probability Distributed Model using Multi-objective Function)

  • 안상억;이효상;전민우
    • 한국방재학회 논문집
    • /
    • 제9권5호
    • /
    • pp.93-102
    • /
    • 2009
  • 본 연구는 미호천 유역을 대상으로 유량곡선의 세부적인 특성을 고려한 다목적함수를 적용하여 Probability Distribution Model(PDM) 모형의 유량모의성능을 검토하였다. PDM은 유역을 한 개의 단위구역으로 개념화한 집중형 강우유출모형으로 영국의 지역화 연구 및 홍수량 산정방법에 대표적으로 이용되고 있다. PDM 모형의 5개 매개변수를 Monte Carlo 방법에 기반을 둔 분석도구(MCAT, Monte Carlo Analysis Toolkit)를 활용하여 사후검정분포, 검정근거 및 민감도 분석 등을 수행하였으며, 모형의 매개변수 중 cmax와 k(q)만이 뚜렷한 검정 근거가 있고 나머지 변수들은 동등성의 영향을 확인하였다. 또한, 유량곡선의 고유량 및 저유량의 특성을 맞춘 목적함수의 Trade-off를 고려한 매개변수의 파레토 최적해를 산정한 결과, 모든 목적에 최대한 부합하는 유량 산정의 가능성을 제시하였다. 검정(calibration)기간에서 NS*E=0.035, FSB=0.161, FDBH= 0.809로 안정적이며 만족할만한 모의성능을 나타내었고, 검증(validation)기간에 대해서도 안정적인 모의성능을 나타내었다.

원의 성질을 이용한 GINI INDEX의 추정 (Estimation of the Gini Index Based on the Properties of Circle)

  • 강석복;조영석
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.283-291
    • /
    • 2003
  • 소득분배의 가장 대표적인 불평등척도는 Gini index이며, 이것은 통계학자인 Gini가 제안한 지표로서 소득분배 에 관한 분석에서 가장 널리 이용되고 있다. 본 논문에서는 두 원의 호에 의해 Lorenz 곡선을 추정하고 코사인법칙을 이용하여 Gini index를 추정하기 위한 새로운 간편한 방법을 제시하여, 소득분포를 따르는 파레토분포에서모의실험을 통해 Ogwang and Rao (1996)의 추정방법과 평균제곱오차 면에서 비교 분석한다.

Likelihood based inference for the shape parameter of Pareto Distribution

  • Lee, Jae-Un;Lee, Woo-Dong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1173-1181
    • /
    • 2008
  • In this paper, when the parameter of interest is the shape parameter in Pareto distribution, we develop likelihood based inference for this parameter. Specially, we develop signed log-likelihood ratio statistic and the modified signed log-likelihood ratio statistic for the shape parameter. It is well-known that as sample size grows, the modified signed log-likelihood ratio statistic converges to standard normal distribution faster than the signed log-likelihood ratio statistic. But the computation of the modified signed log-likelihood statistic is hard or even impossible when the sufficient statistics and the ancillary statistics are not clear. In this case, one can consider an approximation to the modified signed log-likelihood statistic. Specially, when the parameter of interest is informationally orthogonal to the nuisance parameters, we propose the approximate modified signed log-likelihood statistic. Through simulation, we investigate the performances of the proposed statistics with the signed log-likelihood statistic.

  • PDF

파레토분포(分布)에서 두 모수(母數)의 함수(函數) 추정(推定) (Estimation for Functions of Two Parameters in the Pareto Distribution)

  • 우정수;강석복
    • Journal of the Korean Data and Information Science Society
    • /
    • 제1권
    • /
    • pp.67-76
    • /
    • 1990
  • For a two-parameter Pareto distribution, the uniformly minimum variance unbiased estimateors(UMVUE) for the function of the two parameters are expressed in terms of confluent hypergeometric function. The variance of the UMVUE is also expressed in terms of hypergeometric function of several variables. UMVUE's for the ${\gamma}th$ moment about zero and several useful parametric functions, and their variances are obtained as special cases. The estimators of Baxter(1980) and Saksena and Johnson(1984) are special cases of our estimator.

  • PDF

수면 모드를 사용하는 OBS 망에서 트래픽 패턴 및 버스트 어셈블이 에너지 절감과 지연시간에 미치는 영향 분석 (Effect of Energy Saving and Delay on Burst Assemble and Traffic Pattern in OBS Networks with Sleeping Mode)

  • 강동기;양원혁;이재영;김영천
    • 한국통신학회논문지
    • /
    • 제36권2B호
    • /
    • pp.111-119
    • /
    • 2011
  • 최근에 Green IT 에 대한 관심이 증가함에 따라 네트워크 장치에서 발생하는 에너지의 소비를 줄이기 위한 연구가 지속적으로 증가하고 있다. 본 논문에서는 수면모드 (sleeping mode)를 이용하는 OBS 네트워크에서 트래픽 패턴 및 버스트 어셈블 알고리즘이 에너지 절감율과 지연시간에 미치는 영향을 분석한다. 이를 위하여 OPNET Modeler 를 사용하여 지수 분포와 파레토 분포를 가지는 트래픽 생성 모델과 시간 및 길이 기반의 버스트 어셈블 알고리즘을 수행하는 라우터 모델을 구현하고 시뮬레이션을 수행한다. 구현된 시뮬레이터를 통하여 트래픽 패턴 및 버스트 어셈블 방식에 따른 슬리핑 시간, 상태 천이 횟수, 패킷 지연시간 및 에너지 절감율을 측정하고 분석한다.

국제현물원유가의 일일 상승 및 하락율의 극단값 분석 (Analysis of Extreme Values of Daily Percentage Increases and Decreases in Crude Oil Spot Prices)

  • 윤석훈
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.835-844
    • /
    • 2010
  • 극단값 통계 분석의 도구로는 전통적인 연간 최대값 방법과 현대적인 분계점 방법, 그리고 분계점 방법을 개선한 변형체 등으로 분류할 수 있다. 연간 최대값 방법은 시계열자료의 연간 최대값들에 대하여 일반화극단값분포를 적합시키는 것이고, 분계점 방법은 충분히 큰 하나의 분계점을 넘어서는 초과값들의 초과여분들에 대하여 일반화파레토분포를 적합시키는 것이다. 분계점 방법의 한 변형체로서 본 논문에서는 분계점 방법에 추가적으로 초과값들의 전체 개수가 포아송분포를 따른다고 가정하는 포아송-GPD 방법을 다루고, 이를 1988.01.04부터 2009.12.31까지 수집된 서부텍사스산중질유의 현물가격 자료로부터 계산된 일일 상승율과 일일 하락율에 적용한다. 이에 따르면 일일 상승율과 일일 하락율의 분포는 정규분포와 달리 두터운 꼬리를 갖는 분포로 나타났는데, 이는 오늘날의 많은 금융 자료분석에서 나타나는 일반적인 현상과 잘 부합하는 것이다.

한국의 미세먼지 시계열 분석: 장기종속 시계열 혹은 비정상 평균변화모형? (Time Series Modelling of Air Quality in Korea: Long Range Dependence or Changes in Mean?)

  • 백창룡
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.987-998
    • /
    • 2013
  • 이 논문에서는 한국의 대기질을 결정하는 중요한 수치인 미세먼지(PM10)에 대한 통계적 고찰을 한다. 2011년 매시 관찰된 자료 분석을 토대로 미세먼지가 매우 높은 시차에서도 강한 양의 상관관계를 가지는 장기 종속 시계열의 특징을 보임을 밝힌다. 또한 주변분포는 꼬리가 두터운 모형으로서 로그-정규분포보다는 일반화 파레토 분포가 훨씬 더 자료를 잘 적합함을 보인다. 하지만 이러한 높은 상관관계는 종종 단순한 평균변화 모형에 의한 그럴듯싸한 가짜 효과에 기인하기도 하여 통계모형을 세우는데 많은 혼동을 준다. 따라서 이 논문에서는 강한 종속성이 장기 종속 시계열에 의한 것인지 아니면 비정상 평균변화에 의한 것인지 근본적인 물리적 모형에 대한 논의를 통계적인 가설 검정을 통해 살펴본다. 그 결과 미세먼지의 강한 종속성은 구조변화에의한 착시 효과임을 밝힌다.

링크다운 시간에 따른 TCP와 SCTP의 웹 트래픽 분석 (Web Traffic Analysis according to the Link-down Duration of TCP and SCTP)

  • 최용운;조광문;이용진
    • 한국콘텐츠학회논문지
    • /
    • 제10권3호
    • /
    • pp.44-52
    • /
    • 2010
  • 인터넷에서 가장 많이 사용하고 있는 월드 와이드 웹(world wide web) 트래픽은 트랜스포트 계층 프로토콜로 TCP를 사용하고 있다. TCP는 단일 경로를 사용하므로 경로상의 링크가 다운(down)된 후 다시업(up)될 때까지의 시간동안 통신할 수 없다. 이에 비해 SCTP는 다중 경로를 사용하므로 1차 경로가 다운되어도 대체 경로를 이용하여 통신이 가능하다. TCP와 SCTP의 성능을 비교하는 기존 연구들은 주로 파일 전송을 사용하여 수행되었고, 링크다운 환경에서 웹 트래픽을 다룬 연구는 없었다. 자기-유사성의 특징을 갖는 웹 트래픽은 웹 파일의 크기에 영향을 주는 파레토 분포의 형태(shape) 파라미터와 평균 도착 시간간격에 의해 특징지어지므로 이 두 개의 파라미터에 따른 성능 비교가 필요하다. 따라서 본 연구에서는 링크다운 환경에서 웹 트래픽의 특성을 반영하는 두 개의 파라미터를 변화시키면서 TCP와 SCTP의 처리율을 비교하였다. NS-2 시뮬레이션을 사용한 웹 트래픽의 실험 결과는 멀티호밍을 사용한 SCTP의 처리율이 TCP의 처리율보다 우수함을 보여주었다. 특히 웹 트래픽의 특성과 관련해서는 TCP가 SCTP에 비해 평균 도착시간 간격과 형태 파라미터에 더 많은 영향을 받았다. 이 연구의 결과는 링크의 다운기간에 따른 웹 트래픽의 성능변화를 예측하는 데 이용될 수 있다.

L-모멘트법을 이용한 지역홍수빈도분석을 통한 금강유역 미계측 유역의 설계홍수량 산정 (Estimating design floods for ungauged basins in the geum-river basin through regional flood frequency analysis using L-moments method)

  • 이진영;박동혁;신지예;김태웅
    • 한국수자원학회논문집
    • /
    • 제49권8호
    • /
    • pp.645-656
    • /
    • 2016
  • 본 연구에서는 금강유역에 대한 지역홍수빈도분석을 실시하고 재현기간에 따른 홍수량을 추정하는 관계식을 제안하였다. 유역 내 유량자료의 수문학적 독립성과 동질성에 대한 검증을 위하여 Lag-1 자기상관성 분석, 동질성 검정, 이상치 검정, 불일치척도 검정을 수행하였다. 검정 결과, 금강유역의 대상 관측소들은 시간에 대하여 독립적이고 동질적 모집단에 속하며 이상치는 없었다. 일반 극치 분포(GEV), 3변수 대수정규 분포(LN-III), 피어슨-III 분포(P-III), 일반 로지스틱 분포(GLO), 일반 파레토 분포(GPA) 등 5개의 3변수 확률분포함수에 대한 L-모멘트비도와 평균가중거리(AWD), 그리고 $Z^{DIST}$ 적합도 산정 결과, GLO 분포함수가 금강유역의 최적 확률분포형으로 선정되었다. GLO 분포를 바탕으로 지역홍수빈도를 추정하는 회귀모형을 제안하였고, 강경 관측소의 관측 유량을 이용하여 회귀모형의 적용성을 검증하였다.