• 제목/요약/키워드: 로그-정규 분포

검색결과 81건 처리시간 0.021초

임의중도절단자료에 대한 로그정규성 검정 (Testing Log Normality for Randomly Censored Data)

  • 김남현
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.883-891
    • /
    • 2011
  • 수명시간에 대한 모형으로 로그정규분포가 자주 사용되며, 이는 자료의 변환에 의하여 정규성 검정과 동일한 문제로 생각할 수 있다. 따라서 자료의 로그정규성 검정을 위하여, 정규성 검정에 자주 이용되는 Shapiro-Wilk 형태의 검정통계량을 Kaplan-Meier의 product limit 경험분포함수를 이용하여 임의중도절단자료로 일반화한다. Cram er von Mises 통계량을 임의중도절단자료로 일반화한 Koziol과 Green (1976)의 통계량과 비교하였으며 이를 위하여 단순귀무가설을 가정하였다. 중도절단분포에 대한 모형으로는 Koziol과 Green (1976)에서 제시한 모형과 이와 유사한 다른 모형 두 가지를 고려하였다. 검정력 비교 결과 제시한 통계량이 로그정규성 또는 정규성 검정에 더 좋은 검정력을 보여주었으며 검정력은 중도절단분포 모형보다는 자료의 중도절단비율에 영향을 받는다는 것을 볼 수 있었다.

로그정규분포의 엔트로피에 대한 두 모수적 추정량의 비교 (Comparison of Two Parametric Estimators for the Entropy of the Lognormal Distribution)

  • 최병진
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.625-636
    • /
    • 2011
  • 본 논문에서는 로그정규분포의 엔트로피에 대한 모수적 추정량으로 최소분산비편향추정량과 최대가능도추정량을 제시하고 성질을 비교한다. 각 추정량의 분산을 유도해서 일치성을 밝히고 최대가능도 추정량의 편향이 추정에 미치는 영향을 분석한다. 델타근사방법을 이용해서 얻은 추정량의 분포를 제시하고 적합도 평가를 통한 유도한 분포의 확증을 위해서 모의실험을 수행한다. 평균제곱오차에 의한 상대적 효율성에 대한 조사를 통해 두 추정량의 성능을 비교한다. 모의실험의 결과에서 최소분산비편향추정량은 최대가능도 추정량보다 더 좋은 효율을 보이는 것으로 나타나며, 특히 표본크기와 분산이 동시에 작아짐에 따라 효율이 점점 높아지게 되어 월등히 나은 성능을 발휘함을 볼 수 있다.

1980년대 초 한국 석탄 탄광의 자료를 이용한 로그-정규분포의 적용 (Assessment of Coal Dust Exposure in Korean Mine in 1980's)

  • 이기영
    • 한국산업보건학회지
    • /
    • 제22권4호
    • /
    • pp.345-352
    • /
    • 2012
  • 1980년대 초 Sherwood교수가 한국에 와 있으면 당시 탄광의 호흡성먼지의 농도를 측정한 자료를 활용하여 로그-정규분포에 대한 분석을 한 자료이다. 탄광의 건조상태에서 농도는 물을 뿌리면서 하는 작업에 비해 매우 높은 수준을 보인다. 건조한 탄광에서 기하평균농도는 $26.1mg/m^{3}$이었고 물을 뿌린 탄광에서는 $4.1mg/m^{3}$이었다. 이는 매우 높은 수준이었음을 알 수 있다. 각 탄갱에서의 농도는 로그정규분포를 하였고 석탄을 접하는 탄갱에서의 농도는 $1.65mg/m^{3}$에서 $35mg/m^{3}$까지 다양하였다. 호흡성분진의 농도는 석탄을 접하는 탄갱에서 암석을 접하는 탄갱보다 높았는데 이는 분진의 원인이 석탄 때문이었다.

보험 청구액에 대한 새로운 복합분포 (New composite distributions for insurance claim sizes)

  • 정대현;이지연
    • 응용통계연구
    • /
    • 제30권3호
    • /
    • pp.363-376
    • /
    • 2017
  • 보험 시장은 포화되고 그 성장 동력은 소진되어 보험 산업이 저성장에 머물러 있는 가운데 보험사들은 치열한 경쟁 환경에 놓여있다. 이러한 상황에서 보험 상품에 대한 보험수리적 계산의 기초가 되는 보험 청구액의 흐름을 잘 설명할 수 있는 확률분포를 찾아내는 것은 중요한 쟁점이 될 것이다. 보험 청구액의 분포는 일반적으로 두꺼운 꼬리를 가지면서 왼쪽으로 치우친 로그정규분포나 파레토 분포로 잘 설명된다고 알려져 있으나 최근에는 기운 정규분포나 기운 t 분포가 보험 청구액 분포로 적절한 것으로 고찰되었다. Cooray와 Ananda (2005)는 로그정규분포와 파레토 분포의 장점을 모두 가진 로그정규-파레토 복합분포를 제시하고 단일분포보다 더 높은 적합도를 가짐을 확인하였다. 본 논문에서는 기운 정규분포와 기운 t 분포를 머리 부분으로 결합한 새로운 복합분포를 소개하고 덴마크의 화재보험 청구액 데이터와 미국의 배상 지불금 데이터에 적용하여 기존의 다른 복합분포들을 포함하여 여러 단일분포들과 그 성능을 비교한다.

ARMA(p, q) 모형에서 멱변환의 재변환에 관한 연구 - 모의실험을 중심으로 (Re-Transformation of Power Transformation for ARMA(p, q) Model - Simulation Study)

  • 강전훈;신기일
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.511-527
    • /
    • 2015
  • ARMA(p, q) 모형 분석에서 분산 안정화 또는 정규화를 위해 멱변환(power transformation)이 사용된다. 변환된 자료를 이용하여 분석이 이루어지며 원 자료의 예측을 위해 재변환이 사용된다. 이때 흔히 변환된 자료 분석에서 얻어진 예측값의 역함수 값이 원자료 예측값으로 사용되지만 이는 편향이 있는 것으로 알려져 있다. 이를 해결하기 위해 로그 변환의 경우 Granger과 Newbold (1976)는 로그-정규분포의 기댓값을 이용할 것을 제안하였다. 본 연구에서는 모의실험을 통하여 제곱근 변환과 로그 변환 후 재변환을 사용할 때 예측값으로 기댓값의 역함수를 이용하는 방법과 역함수의 기댓값을 사용하였을 때의 추정의 결과를 모의실험을 통하여 비교하였다.

부분 베이즈요인을 이용한 K개로 로그정규분포의 상등에 관한 베이지안 다중검정 (Bayesian Testing for the Equality of K-Lognormal Populations)

  • 문경애;김달호
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.449-462
    • /
    • 2001
  • 베이지안 다중 검정방법(multiple hypothesis test)은 여러 통계모형에서 성공적인 결과를 주는 것으로 알려져있다. 일반적으로, 베이지안 가설검정은 고려중인 모형에 대한 사후확률을 계산하여 가장 높은 확률은 갖는 모형을 선택하기 때문에 귀무가설의 기각여부에만 관심을 가지는 고전적인 분산분석 검정과는 달리 좀 더 구체적인 모형을 선택할 수 있는 장점이 있다. 이 논문에서는 독립이면서 로그정규분포를 따르는 K($\geq$3)개 모집단의 모수에 대한 가설 검정방법으로 O’Hagan(1995)이 제안한 부분 베이즈 요인을 이용한 베이지안 방법을 제안한다. 이 때 모수에 대한 사전분포로는 무정보적 사전분포를 사용한다. 제안한 검정 방법의 유용성을 알아보기 위하여 실제 자료의 분석과 모의 실험을 이용하여 고전적인 검정방법과 그 결과를 비교한다.

  • PDF

비정규분포를 이용한 표본선택 모형 추정: 자동차 보유와 유지비용에 관한 실증분석 (An Alternative Parametric Estimation of Sample Selection Model: An Application to Car Ownership and Car Expense)

  • 최필선;민인식
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.345-358
    • /
    • 2012
  • 표본선택 모형을 최우추정법으로 추정할 때 오차항의 분포를 제대로 가정하는 것이 매우 중요하다. 표본선택 모형의 선택 방정식과 본 방정식의 오차항 분포를 일반적으로 이변량 정규분포로 가정하지만, 이 가정이 오차항의 실제 분포를 과도하게 제약할 가능성이 있다. 본 연구는 표본선택 모형의 오차항 분포로 $S_U$-정규분포를 도입한다. $S_U$-정규분포는 분포의 비대칭성과 초과첨도를 허용한다는 측면에서 정규분포보다 훨씬 유연하면서, 동시에 정규분포를 극한분포의 형태로 포함하고 있다. 또한 정규분포처럼 다변량 분포함수가 존재하기 때문에 표본선택 모형과 같은 다변량 모형에서도 활용할 수 있다. 본 논문은 $S_U$-정규분포를 이용한 표본선택 모형에서 로그우도 함수와 조건부 기댓값을 도출하고, 시뮬레이션을 통해 정규분포 모형과 추정성과를 비교한다. 또한 자동차 보유 가구들의 자동차 유지비에 관한 실제 데이터를 이용하여 $S_U$-정규분포 표본선택 모형의 추정결과를 제시한다.

제2종 중단모형에서 FRACTIONAL BAYES FACTOR를 이용한 신뢰수명 모형들에 대한 베이지안 모형선택 (Bayesian Model Selection of Lifetime Models using Fractional Bayes Factor with Type ?$\pm$ Censored Data)

  • 강상길;김달호;이우동
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.427-436
    • /
    • 2000
  • 이 논문에서는 신뢰수명자료의 분석에 많이 사용되는 지수분포, 와이블분포, 로그정규분포에 대해, 현재의 자료가 어느 분포에 가장 적합한가를 알아보기 위한 베이자안 모형 선택방법을 제안한다. 일반적으로, 모수에 대한 사전분포가 부적절 분포인 경우, 베이즈 요인(Bayes factor)은 미지의 상수를 포함한다. 이러한 문제점을 해결하기 위하여 O’Hagan(1995)에 의해 제안된 fractional Bayes factor를 이용하여 자료를 가장 적합시키는 모형을 찾는다. 특히, 제2종 중도절단자료가 주어진 경우. 이 자료를 이용한 베이지안 모형선택에 대한 연구는 거의 이루어진 바가 없다. 실제 자료와 인위적인 자료를 이용하여 로그정규분포, 지수분포, 와이블모형중 어느 모형에 가장 잘 적합한지를 검정하는 예를 보인다.

  • PDF

부분 베이즈요인을 이용한 로그정규분포의 상등에 관한 베이지안검정 (Bayesian Testing for the Equality of Two Lognormal Populations with the fractional Bayes factor)

  • 문경애;김달호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제12권1호
    • /
    • pp.51-59
    • /
    • 2001
  • 독립이면서 로그정규분포를 따르는 두 모집단의 평균 차이에 대한 검정으로 O'Hagan (1995)이 제안한 부분 베이즈요인을 이용한 베이지안 방법을 제안한다. 이 때 모수에 대한 사전분포로는 무정보적 사전분포를 사용한다. 제안한 검정 방법의 유용성을 알아보기 위하여 실제 자료의 분석과 모의실험을 이용하여 고전적인 검정방법과 그 결과를 비교한다.

  • PDF

정규화 용어빈도가중치에 의한 자동문서분류 (Automatic Text Categorization by using Normalized Term Frequency Weighting)

  • 김수진;김민수;백장선;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.510-512
    • /
    • 2003
  • 본 논문에서는 문서의 자동 분류를 위한 용어 빈도 가중치 계산 방법으로 Box-Cox변환기법을 응용한 정규화 용어빈도 가중치를 정의하고, 이를 문서 분류에 적응하였다. 여기서 Box-Cox 변환기법이란 자료를 정규분포화 할 때 적용하는 통계적인 변환방법으로서, 본 논문에서는 이를 응용하여 새로운 용어빈도가중치 계산법을 제안한다. 문서에서 등장한 용어 빈도는 너무 많거나 적게 등장할 경우, 중요도가 떨어지게 되는데, 이는 용어의 중요도가 빈도에 따른 정규분포로 모델링 될 수 있다는 것을 의미한다. 또한 정규화 가중치 계산방법은 기존의 용어빈도 가중치 공식과 비교할 때, 용어마다 계산방법이 달라져, 로그나 루트와 같은 고정된 가중치 방법보다는 좀더 일반적인 방법이라 할 수 있다. 신문기사 8000건을 대상으로 4개의 그룹으로 나누어 실험 한 결과, 정규화 용어빈도가중치 계산방법이 모두 우위의 분류 정확도롤 가져, 본 논문에서 제안한 방법이 타당함을 알 수 있다.

  • PDF