• 제목/요약/키워드: 범주형 자료

검색결과 222건 처리시간 0.025초

확률론적 공간 자료 통합 모델을 이용한 산사태 취약성 분석

  • 박노욱;지광훈;권병두
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2005년도 춘계학술발표회 논문집
    • /
    • pp.254-260
    • /
    • 2005
  • 이 논문에서는 산사태 취약성 분석을 목적으로 확률론적 공간통합의 틀 안에서 범주형 자료와 연속형 자료를 효율적으로 처리할 수 있는 비모수적 우도비 추정 모델과 모수적 예측적 판별 분석 모델을 적용하였다. 적용 모델의 비교를 위해 1998년 여름철 산사태로 많은 피해를 입은 경기도 장흥 지역과 충청북도 보은 지역을 대상으로 사례연구를 수행하였다. 장흥 지역에서는 두 모델이 유사한 예측 능력을 나타내었으나, 보은 지역에서는 모수적 예측적 판별 분석 모델이 상대적으로 높은 예측 능력을 나타내었다. 결론적으로 제안한 두 모델은 산사태 취약성 분석을 위한 연속형 자료 표현에 효율적으로 적용될 수 있으며, 두 모델이 개별적인 연속형 자료 표현의 특성을 가지고 있기 때문에 다른 사례 연구를 통한 검증 작업이 병행되어야 할 것으로 생각된다.

  • PDF

$2{\times}2$ 분할표에서 동적 그래픽스로 구현된 겹쳐진 모자익 그림을 이용한 범주형 자료의 연관성 측정 (Measurement of Association of Categorical Data Using The Overlapped Mosaic Plot : Dynamic Graphics Approach for $2{\times}2$ Contingency Table)

  • 윤여창;오민권
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권2호
    • /
    • pp.457-464
    • /
    • 1999
  • Hartigan과 Kleiner(1981)는 분할표 자료에서 주변합의 비율에 대한 각 칸의 관측도수의 비율을 사각형의 면적으로 표현한 모자익 그림을 제안하였는데, 본 연구에서는 $2{\times}2$ 분할표에서 관측도수와 기대도수에 대한 두 개의 모자익 그림을 겹쳐서 나타낸 겹쳐진 모자익 그림을 이용한 범주형 자료의 연관성을 측정하고자 한다. 동적 그래픽스기법으로 개선시킨 겹쳐진 모자익 그림을 이용하면 범주형 변수의 연관성을 시각적으로 쉽게 파악할 수 있는데, 이러한 그림은 자료분석이나 통계 패키지에서 제공되고 있지 않다. 겹쳐진 모자익 그림은 변수들의 종속성 여부, 관측도수와 기대도수의 차이등을 제시된 통계량과 함께 시각적으로 파악할 수 있기 때문에 모형 설정시 매우 유용한 정보를 얻을 수 있다.

  • PDF

범주형 자료분석을 위한 최대절사우도추정 (Maximum Trimmed Likelihood Estimator for Categorical Data Analysis)

  • 최현집
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.229-238
    • /
    • 2009
  • 범주형 자료분석을 위해 고려할 수 있는 모형들은 일반적으로 최우추정에 의하여 적합이 이루어지므로 이상값에 쉽게 영향을 받을 수 있다. 본 연구에서는 분할표 자료에 포함된 이상칸(outlying cell)에 영향을 받지 않는 최대 절삭우도 추정 값(maximum trimmed likelihood estimates)을 얻기 위한 추정 방법을 제안하였다. 제안된 방법은 우도에 의존하여 분할표에 포함된 칸을 제거해나가며 절사우도의 최대값을 찾기 때문에 완전탐색(complete enumeration)에 비해 계산의 양이 매우 적다. 따라서 일반적인 다차원 분할표 자료분석을 위해 쉽게 적용될 수 있다. 실제 자료분석 예를 통해 제안된 추정방법을 설명하였으며, 모의실험을 통해 문제점과 특징을 토론하였다.

2007년 한국프로야구에서 도루성공모형 (Steal Success Model for 2007 Korean Professional Baseball Games)

  • 홍종선;최정민
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.455-468
    • /
    • 2008
  • 야구경기의 승패에 영향을 미치는 중요한 요인으로 간주되는 도루의 성공모형을 개발하기 위하여 2007년 한국프로야구 기록자료를 바탕으로 로지스틱 회귀모형들을 제안한다. 또한 한국프로야구의 도루성공과 실패에 대해 판별분석을 실시하고 분류 기준값을 결정하였으며, 판별분석 분류표를 이용해 로지스틱 회귀분석과 판별분석의 효율성을 비교한다. 전체적인 모형의 정확도는 로지스틱 회귀모형이 판별분석보다 더 좋은 것으로 나타났고, 연속형 자료를 범주형으로 변환한 자료에 대한 로지스틱 회귀모형도 유사한 효율성을 갖고있다.

다이아몬드 그래프의 활용 방법 (Applications of Diamond Graph)

  • 홍종선;고용석
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.361-368
    • /
    • 2006
  • 이차원 범주형 자료를 시각적으로 표현하는 이차원과 삼차원 그래프는 많이 존재한다. 그중에서 Li등(2003)은 삼차원 그래프를 이차원 평면에 투영시키는 다이아몬드 그래프를 제안하였다. 여기서 세번째 차원은 면적과 높이 그리고 길이가 관찰값에 대응하는 다이아몬드 모양으로 대체하였다. 본 논문에 서는 이차원 자료에 대하여는 두 범주형 변수의 독립성을 검정하기 위하여 다이아몬드 그래프를 이용한다. 그리고 삼차원 이상의 자료에 대해서는 자료에 가장 적합한 로그선형모형을 설정하는데 활용할 수 있다.

농촌생활지표조사에서 무응답 대체 : 사례 (An Imputation for Nonresponses in the Survey on the Rural Living Indicators)

  • 조영숙;천영민;황대용
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.95-107
    • /
    • 2008
  • 농촌생활지표조사는 2000년부터 농촌자원개발연구소에서 매년 실시하는 조사로서 통계청 승인통계이다. 본 연구에서는 2005년 농촌생활지표조사에 사용된 원자료를 이용하였다. 원자료에 대한 에디팅 과정을 거친 후 무응답이 포함된 개체를 제거하여 얻어진 1,582 가구를 대 상으로 하였으며 총 146문항 중에서 최종 선택되어진 15문항을 증심으로 무응답 대체를 실시하였다. 실험에 사용된 대체법과 각 대체법의 효율성은 자료의 종류에 따라 다르게 적용되었다. 먼저 연속형 자료에 대해서는 평균대체, 회귀대체, 수정된 그레이 기반 k-NN 대체(DU, DW, WU, WW) 방법을 사용하여 무응답을 대체하고 RMSB를 이용하여 실험결과를 비교하였으며, 범주형 자료에 대해서는 최빈값 이용, 확률 대체, 조건부 최빈간 이용, 조건부 학률 대체, 단순 임의 핫덱 대체 방법을 사용하여 무응답을 대체하고 정확도(Accuracy)를 이용하여 실험 결과를 비교하였다. 실험 결과에 의하면 연속형 자료에 대해서는 회귀대체 또는 그레이 기반 k-NN 대체가 적절하고, 범주형 자료에 대해서는 핫덱 대체가 가장 적절한 것으로 나타났다.

범주형 자료에서 연관성 측도들의 비교 분석

  • 홍종선;임한승
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.645-661
    • /
    • 1997
  • 연속형 변수들의 상관관계와 범주형 변수들의 연관성 측도들을 비교 연구하였다. 이 연구를 위하여 연속형 변수들이며 +1에서 -1까지 완벽한 상관관계를 갖고 있는 2 변량 정규분포를 이용하여 2$\times$2 분할표와 확장하여 일반적인 I$\times$J 분할표를 대신하는 3$\times$3 분할표를 생성하였다. 2 차원 분할표에서 정의된 연관성 측도들을 구하여 논의하였는데 2$\times$2 분할표에서는 교차적비 $\alpha$ 통계량과 교차적비의 함수로 표현되는 Yule [1912]의 Q와 Y의 통계량 그리고 상관계수 R 통계량과 R 통계량의 함수인 P 통계량을 설명하고 생성된 분할표에서 구한 통계량값을 분석하였으며, 3$\times$3 분할표에서는 Pearson의 독립성 검정통계량 $X^2$의 함수로 표현되는 P. T. V 통계량과 Goodman과 Kruskal [1954]의 $\lambda_{C/R}$통계량과 Light와 Margolin [1971]의 $\tau_{R/C}$ 통계량을 설명하고 그 값들을 Pearson의 상관계수와 비교 분석하였다.

  • PDF

저해상도 비율 자료로부터 고해상도 범주형 주제도 생성을 위한 지구통계학적 블록 시뮬레이션 (A Geostatistical Block Simulation Approach for Generating Fine-scale Categorical Thematic Maps from Coarse-scale Fraction Data)

  • 박노욱;이기원
    • 한국지구과학회지
    • /
    • 제32권6호
    • /
    • pp.525-536
    • /
    • 2011
  • 다양한 형태의 공간 자료를 이용하는 응용 분야에서 이용가능한 자료간 해상도 차이를 반영하고, 원하는 타겟 해상도로의 변환은 매우 중요하다. 이 논문에서는 저해상도 비율 자료로부터 고해상도 범주형 주제도를 제작하기 위해 베리오그램 디컨볼루션과 블록 시뮬레이션을 이용하는 지구통계학적 다운스케일링 방법론을 제시하였다. 우선 블록 기반 베리오그램으로부터 점 기반 베리오그램 모델의 추정을 위해 반복 연산 기반 베리오그램 디컨볼루션 방법을 적용하였다. 그리고 영역-점 변환 크리깅과 추정된 점 기반 베리오그램 모델을 이용하는 직접 순차적 시뮬레이션을 적용하여 고해상도 비율 정보를 제작하였다. 최종적으로 최대 사후 확률 결정 규칙을 적용하여 대안적 고해상도 범주형 주제도를 제작하였다. 점 기반 자료 없이 저해상도 블록 비율자료만을 이용한 토지피복도 제작 사례 연구를 통해 제안 분석 과정을 예시하였다. 제안한 다운스케일링 기법의 적용을 통해 원 저해상도 블록 비율 자료값을 재생산하는 고해상도 비율 자료를 생성하였으며, 이로부터 기준 토지피복도의 전반적인 패턴을 반영하는 대안적 고해상도 토지피복도 제작이 가능함을 확인할 수 있었다. 이렇게 생성된 고해상도 자료들은 해상도 변환의 영향 분석에 유용한 입력 자료로 이용될 수 있을 것으로 생각된다.

Collapsibility Criteria using Raindrop Plots

  • 홍종선;김범준
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.175-178
    • /
    • 2004
  • 범주형 자료분석에서 차원축소(collapsibility)는 오즈비로 설명되었다. 실제의 $2\times2\timesK$ 분할표 자료를 이 이론에 적용시켰을 때 오즈비의 값으로 차원축소가 가능한지의 여부를 판단하기는 어렵다. 오즈비를 시각적으로 표현하는 방법 중에서 Doi, Nakamura와 Yamamoto(2001)가 제안한 Contour plot을 통해서 분할표 자료를 설명하는 것은 가능하지만 차원축소의 가능성을 결정하기에는 한계가 있다. 본 연구에서는 오즈비의 신뢰구간을 시각적으로 표현할 수 있는 방법으로 Barrowman과 Myers(2003)가 제안한 Raindrop plot을 이용하여 $P_{\lambda,;,T}^M-policy$ 분할표 자료를 설명할 수 있으며 동시에 차원축소의 가능성을 판단할 수 있는 방법을 제안하고자 한다.

  • PDF

확률화응답에 대한 대수선형모형

  • 최경호
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.725-734
    • /
    • 1997
  • 많은 사회과학 조사에서 분할표 형태로 얻어진 범주형 자료에는 오분류(misclassification)로 인한 오차가 내재되는 경우가 종종 있다. 질적속성 추정을 위한 확률화응답은 이러한 오분류 문제의 한 특수한 경우로 여겨지기도 한다. 그래서 확률화응답을 통한 범주형자료는 혼합된 분할표(mixed-up contingency table)로 여길 수 있는 바, 본 논문에서는 이에 대해 대수선형모형(log-linear model)을 설정하고 Chen과 Fienberg(1976)의 Iterative scaling procedure(ISP)에 의하여 얻어진 최우추정량의 극한을 이용하였다. 이 결과 Warner(1965) 형태의 대칭기법에 대해서는 Singh(1976)에 의하여 제안된 최우추정량과 같아지게 됨을 보임으로써 Warner에 의해서 제시된 추정량이 최우추정량으로 적절하지 않음을 확인해 보고, 무관질문기법에 대해서는 Greenberg, et al.(1969)에 의해서 제안된 추정량이 추정의 관점에서 최우추정량으로 적절하지 않음을 알아 보았다.

  • PDF