• 제목/요약/키워드: 정규혼합모형

검색결과 53건 처리시간 0.025초

합성된 평균과 분산을 가진 군집 식별 (Identification of Cluster with Composite Mean and Variance)

  • 김승구
    • Communications for Statistical Applications and Methods
    • /
    • 제18권3호
    • /
    • pp.391-401
    • /
    • 2011
  • 본 논문에서는 자료 내의 군집 중에 '부(父) 군집'과 모(母) 군집'이라 부르는 두 군집 사이에, 합성된 평균 분산을 가지는 '합성군집' 즉 '자식 군집'이라 부르는 한 군집이 있을 경우에 주목하여, 그들의 관계를 평균과 분산에 관해 모형화하고 각각의 군집을 식별하는 방법을 제공하였다. 관측치는 정규혼합모형을 따른다고 가정하고, EM 알고리즘을 통해 모형 추정을 시도하였다. 추정 과정에 여러 난제가 있었으나, 근사적 방법으로 비교적 잘 극복할수 있었다. 그리고 수치실험을 통해 제안방법은 성공적으로 주어진 세 군집 즉 '군집족(族)'을 식별할수 있음을 보였다.

Gibbs알고리즘을 이용한 저축률의 정규분포혼합 추정 (Estimation of the Mixture of Normals of Saving Rate Using Gibbs Algorithm)

  • 윤종인
    • 디지털융복합연구
    • /
    • 제13권10호
    • /
    • pp.219-224
    • /
    • 2015
  • 본 연구는 우리나라 가계저축률의 정규분포혼합을 추정한다. 2014년 마이크로데이터인 MDSS를 이용하였고 추정방법으로는 깁스알고리즘을 이용하였다. 실증분석결과의 주요내용은 다음과 같다. 첫째, 정규분포혼합을 추정하기 위한 방법으로 깁스알고리즘은 잘 작동하였다. 즉 주요 모수추정치는 모두 정상적 분포를 갖는 것으로 나타났다. 둘째 저축률 자료는 적어도 2개의 성분, 즉 저축률이 평균 0%인 성분과 평균 29.4%인 성분으로 이루어져 있는 것으로 보인다. 즉 우리나라의 가계는 고저축률 집단과 저저축률 집단으로 나누어질 수 있다는 뜻이다. 셋째 정규분포혼합모형 자체는 어떤 가계가 첫째 성분 또는 둘째 성분에 속하는가를 설명할 수 없다. 이에 본 연구는 추가적인 분석을 수행하였지만 소득수준과 가구주 연령은 이에 대한 설명력을 지니지 못하는 것으로 판단된다.

일반화된 선형 혼합 모형(GENERALIZED LINEAR MIXED MODEL: GLMM)에 관한 최근의 연구 동향 (A Study for Recent Development of Generalized Linear Mixed Model)

  • 이준영
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.541-562
    • /
    • 2000
  • 일반화된 선형 혼합 모형(GLMM)은 자료가 계수의 형태로 나타나는 범주형 자료의 경우, 혹은 집락의 형태나 과산포된 비정규 자료, 또는 비선형 모형에 따르는 자료를 다루기 위한 모형 설정에 사용된다. 본 연구에서는 이에 대한 개요와 더불어, 이 모형의 적합을 위해 제시된 통계적 기법들중 의사가능도(quasi-likelihood: QL)를 이용한 추정 방법 및 Monte-Carlo 기법을 이용한 추정 방법들에 대해 조사하였다. 또한 GLMM에 대한 현재의 연구 방향 및 앞으로의 연구 가능 주제들에 대해서도 언급하였다.

  • PDF

정규혼합모델을 이용한 수중 천이신호 식별 (Classification of Underwater Transient Signals Using Gaussian Mixture Model)

  • 오상환;배건성
    • 한국정보통신학회논문지
    • /
    • 제16권9호
    • /
    • pp.1870-1877
    • /
    • 2012
  • 천이신호는 지속시간이 짧으면서 길이의 변화가 크고, 시변성 및 비정재성 특성을 갖는다. 이러한 천이신호의 식별에는 분석 프레임 단위로 참조신호에 대한 기준패턴을 만들어 입력신호와의 유사도를 비교하는 방법이 효과적일 수 있다. 본 연구에서는 참조신호의 기준패턴으로 프레임 기반의 특징벡터들에 대해 확률통계 모형인 정규혼합모델을 적용하는 방법을 제안하고, 다양한 수중 천이신호에 대한 식별 실험을 통해 제안한 방법의 타당성을 검증하였다.

로버스트 베이지안 메타분석 (Robust Bayesian meta analysis)

  • 최성미;김달호;신임희;김호각;김상경
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.459-466
    • /
    • 2011
  • 본 논문은 독립적으로 수행된 연구결과를 합쳐서 일반적인 결론을 도출하는 메타분석을 위한 로버스트 계층적 베이지안 모형을 고려한다. 사전정보가 정규분포를 따른다는 가정 대신 정규분포의 척도혼합을 사용하여 정규분포보다 더 두꺼운 꼬리를 가지는 사전분포를 사용한다. 나아가 개별 분석의 분산이 알려져 있지 않은 경우를 계층적 베이지안 모형에 포함하여 메타분석을 수행하고자 한다. 깁스 표집을 사용하여 추정값을 계산하고, 실제 자료를 사용하여 제안된 방법을 예시한다.

반복측정의 분할구 자료에 대한 혼합모형 (A mixed model for repeated split-plot data)

  • 최재성
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.1-9
    • /
    • 2010
  • 본 논문은 분할구 실험에서 반복측정 요인이 처치의 한 요인으로 고려될 때, 실험자료의 분석을 위한 혼합모형과 모형내 미지모수의 추론을 위한 방법을 논의한다. 반복측정 요인으로 공간요인을 고려하고 공간요인의 수준은 분할구에 할당되나 연구자가 임의로 배정할 수 없는 실험환경이 가정된다. 이러한 실험의 특성을 갖는 자료벡터의 확률분포로 복합대칭의 공분산 구조를 갖는 다변량 정규분포를 논의하고 있다. 또한, 가정된 실험환경에 부합하는 적합한 자료의 예를 통하여 제시된 모형의 타당성과 관련모수들의 추론방법을 다루고 있다.

혼합원형분포를 이용한 지방국도의 시간교통량 추정모형 (Modeling on Daily Traffic Volume of Local State Road Using Circular Mixture Distributions)

  • 나종화;장영미
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.547-557
    • /
    • 2011
  • 본 논문에서는 우리나라 지방국도의 특정지점에서 수집된 교통량 자료를 이용하여 일일 시간교통량 추정모형을 개발하였다. 본 연구의 특징은 일일 24시의 시간변수를 원형변수로 취급하고, 지방부 교통량 자료의 특성상 출퇴근 시간에 교통량이 집중되는 이봉형의 현상을 감안하여 원형분포의 혼합모형을 고려하였다. 또한 시간대별 교통량의 분포가 요일에 따라 유사한 패턴을 가지는 데 착안하여 요일별 모형을 제시하였다. 혼합원형분포의 모수추정에는 EM알고리즘이 사용되었으며, 모형의 성능비교를 위해 가변수 회귀모형과의 비교를 실시하였다. 제시된 요일별 지방국도의 시간교통량 적합모형은 계측기의 손상 등으로 인한 교통량 결측자료의 추정에 효과적으로 사용될 수 있다.

마코프 랜덤 필드 하에서 정규혼합모형에 의한 다중 결측값 대체기법: 색조영상 결측 화소값 대체에 응용 (Imputation of Multiple Missing Values by Normal Mixture Model under Markov Random Field: Application to Imputation of Pixel Values of Color Image)

  • 김승구
    • Communications for Statistical Applications and Methods
    • /
    • 제16권6호
    • /
    • pp.925-936
    • /
    • 2009
  • 자료의 독립성 가청 하에서 EM 알고리즘에 의한 경측치 대체 (imputation of missing values) 기법은 잘 알려져 있다. 그러나 공간자료를 다루는 응용문제에서는 독립성 가정이 확장된 마코프 랜덤 필드 (Markov random field; MRF) 하에서 다루어져야 할 것이다. 이에 본 논문에서는 마코프 랜덤 필드 모형 궁에서 다변량 자료 중에 다중의 결측치의 대체를 위한 EM 알고리즘을 제공한다. 이 기법은 몇 가지 현실척 가정하에서 결국 혼합모형에 의한 대체 기법 임을 보인다. 그리고 제공된 기법으로 3-변량으로 구성된 색조영상(color image)의 결측화소값 대체문제에 적용하여 그 유용성과 문제점을 밝히며, 문제정의 개선방안에 대해 논의한다.

정규혼합분포를 이용한 ROC 분석 (ROC Curve Fitting with Normal Mixtures)

  • 홍종선;이원용
    • 응용통계연구
    • /
    • 제24권2호
    • /
    • pp.269-278
    • /
    • 2011
  • 스코어 변수의 민감도와 특이도와의 관계로 표현한 ROC 곡선을 더욱 정확한 진단을 위하여 분포함수와 공변량을 고려한 연구가 많이 진행되었다. 공변량을 고려하는 회귀분석 방법을 사용하였으며 이때 분포함수를 정규분포로 가정하거나 잔차의 분포함수를 추정하여 ROC 분석을 하였다. 본 연구는 분포함수가 주어지지 않으며 진단에 영향을 주는 공변량을 모르는 일반적인 상황에서 논의하였다. 확률변수인 스코어와 두 개의 보모집단으로 구성된 신용평가 자료에 적합한 분포함수를 추정하기 위하여 여러 개의 정규분포가 혼합된 정규혼합분포를 사용하여 ROC 분석을 한다. 고전적인 비모수적이고 경험적인 ROC 곡선에 적합한지를 파악하기 위하여 AUC 통계량을 사용하여 비교하며, 본 연구에서 제안한 정규혼합분포를 이용한 ROC 곡선이 다른 방법으로 구한 ROC 곡선보다 적합함을 보였다.

정규혼합분포에서 최소오류의 분류정확도 측도 (Classification accuracy measures with minimum error rate for normal mixture)

  • 홍종선;;홍선우;김강천
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.619-630
    • /
    • 2011
  • 본 연구에서는 두 분포함수의 혼합된 자료에서 적절한 분류점을 추정하고 평가하기 위하여 많이 사용하는 아홉 종류의 분류정확도 측도인 MVD, Youden지수, (0,1)까지최단기준, 수정된 (0,1)까지 최단기준, SSS, 대칭점, 정확도면적, TA, TR을 다섯 개의 조건범주로 군집시킨다. 신용평가분석에서 정상과 부도상태의 스코어 확률변수가 정규분포를 따르며 전체부도율로 혼합되었다고 가정한다. 다양한 정규혼합분포의 상황에서 군집된 측도들의 최적분류점을 발견하고, 그 분류점에 대응하는 제I종 오류율과 제II종 오류율 그리고 두 종류의 오류율 합을 구하여 각각의 오류율이 최소인 경우를 탐색적으로 살펴본다. 현실자료에 적합한 정규혼합분포를 추정하여 본 연구 결과를 적용하면 최소 오류율이 보장되는 분류정확도를 선택할 수 있으며, 이를 사용하여 모형의 판별력을 향상시킬 수 있다.