• 제목/요약/키워드: 측도함수

검색결과 54건 처리시간 0.023초

Index of Union와 다른 정확도 측도들 (Index of union and other accuracy measures)

  • 홍종선;최소연;임동휘
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.395-407
    • /
    • 2020
  • 최적분류점에 대한 대부분의 정확도 측도들은 두 종류의 누적분포함수와 확률밀도함수를 기반으로 정의하거나 또는 ROC 곡선과 AUC를 기반으로 정의하는 방법으로 구분하는데, Unal (2017)은 두 가지 방법을 혼합하여 누적분포함수와 AUC를 모두 고려하는 정확도 측도 Index of Union (IU) 통계량을 제안하였다. 본 연구에서는 IU 통계량을 포함한 열 개의 정확도 측도들을 여섯 종류의 범주로 구분하여 각 범주에 속하는 측도들을 비교하면서 IU의 장점을 연구한다. 다양한 정규혼합분포를 설정하여 각각의 측도들에 대응하는 최적분류점들을 구하고 각 분류점에 대응하는 제1종과 제2종 오류 그리고 두 종류의 오류합을 구해서 오류들의 크기를 비교하면서 분류정확도 측도들의 판별력을 비교하면서 IU의 성격과 특징을 탐색한다. 두 종류 분포들의 평균 차이가 증가할수록 IU 통계량의 제1종 오류와 오류합의 크기가 최고의 분류정확도를 갖는 제2범주의 정확도 측도의 오류에 수렴하는 것을 발견하였다. 그러므로 IU는 모형의 판별력을 평가하는 정확도 측도로 활용할 수 있다.

범주형 자료에서 연관성 측도들의 비교 분석

  • 홍종선;임한승
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.645-661
    • /
    • 1997
  • 연속형 변수들의 상관관계와 범주형 변수들의 연관성 측도들을 비교 연구하였다. 이 연구를 위하여 연속형 변수들이며 +1에서 -1까지 완벽한 상관관계를 갖고 있는 2 변량 정규분포를 이용하여 2$\times$2 분할표와 확장하여 일반적인 I$\times$J 분할표를 대신하는 3$\times$3 분할표를 생성하였다. 2 차원 분할표에서 정의된 연관성 측도들을 구하여 논의하였는데 2$\times$2 분할표에서는 교차적비 $\alpha$ 통계량과 교차적비의 함수로 표현되는 Yule [1912]의 Q와 Y의 통계량 그리고 상관계수 R 통계량과 R 통계량의 함수인 P 통계량을 설명하고 생성된 분할표에서 구한 통계량값을 분석하였으며, 3$\times$3 분할표에서는 Pearson의 독립성 검정통계량 $X^2$의 함수로 표현되는 P. T. V 통계량과 Goodman과 Kruskal [1954]의 $\lambda_{C/R}$통계량과 Light와 Margolin [1971]의 $\tau_{R/C}$ 통계량을 설명하고 그 값들을 Pearson의 상관계수와 비교 분석하였다.

  • PDF

단조함수에 대한 불확실성 중요도 측도의 평가 (Evaluation of Uncertainty Importance Measure for Monotonic Function)

  • 조재균
    • 한국산업정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.179-185
    • /
    • 2010
  • 시스템의 민감도 분석을 위한 불확실성 중요도 측도란 어떠한 입력변수의 불확실성이 반응변수의 불확실성에 미치는 영향의 정도를 평가하여, 반응변수의 불확실성을 감소시키기 위해서는 어떤 입력변수들의 불확실성을 감소시키는 것이 효과적인지를 밝히는데 사용된다. 본 논문에서는 입력변수와 반응변수 간의 관계식이 단조함수일 때, 어떤 입력변수의 불확실성이 제거될 때 반응변수 분산의 기대되는 감소량을 백분율로 측정하는 측도를 평가하기 위한 방법을 제안한다. 제안된 평가 방법은 입력변수와 반응변수 간의 관계식이 선형 및 비선형 단조함수 모두에 적용될 수 있으며 입력변수의 분포에 제한이 없으며, 입력변수의 분포를 이산형 분포로 근사화하는 기법을 사용함으로써 불확실성 중요도 측도의 안정적인 추정치를 얻을 수 있다 반면에 제안된 평가 방법은 몬테칼로 시뮬레이션을 기반으로 하기 때문에 계산량이 많은 단점이 있다.

준 노름 퍼지 적분에 의해 정의된 퍼지 측도 (Fuzzy Measures Defined by the Semi-Normed Fuzzy Integrals)

  • Kim, Mi-Hye;Lee, Soon-Seok
    • 한국콘텐츠학회논문지
    • /
    • 제2권4호
    • /
    • pp.99-103
    • /
    • 2002
  • 본 논문에서는 t 준노름이 연속인 경우 이미 주어진 퍼지 측도에 관한 측정 가능한 함수의 준 노름 퍼지 적분을 이용하여 퍼지 측도를 정의하는 방법에 대해서 조사했다. 즉 (X, F, g)이 퍼지 측도 공간이라고 하고 h$\in$L$^\circ$(X), 이며 $\top$는 연속 t 준노름이라 하자. 그러면 임의의 $A\in$F에 대해 $\nu$(A)=$\int _A$h$\top$g에 의하여 정의된 집합치 함수 $\nu$는 (X, F)상에서 퍼지 측도이다.

  • PDF

혼동행렬의 상관계수를 이용한 최적분류점 (Optimal threshold using the correlation coefficient for the confusion matrix)

  • 홍종선;오세현;최예원
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.77-91
    • /
    • 2022
  • 의학통계와 신용평가 분야에서 혼합분포함수를 판별하는 최적분류점 추정하기 위하여 판별력을 측정하는 다양한 정확도 측도들이 존재한다. 최근에 혼동행렬 빈도수로 표현되는 Matthews의 상관계수와 정밀도와 재현율의 조화평균인 F1 통계량의 정확도 측도들이 최적분류점을 추정하는데 연구되었다. 본 연구에서는 이런 정확도 측도들 중에서 표본크기에 의존하는 정확도 측도들은 두 표본크기 차이가 많은 경우에 최적분류점을 설정하는데 적절하지 않음을 발견한다. 그리고 대안적인 정확도 측도로 혼동행렬의 비율들의 함수인 상관계수를 정의하고, 이를 최대화하는 분류점을 최적분류점으로 추정하는 방법을 제안하고 이 방법의 유용성과 활용성에 대하여 토론한다.

정규혼합에서 분류정확도 측도들의 최적기준 (Optimal Criterion of Classification Accuracy Measures for Normal Mixture)

  • 유현상;홍종선
    • Communications for Statistical Applications and Methods
    • /
    • 제18권3호
    • /
    • pp.343-355
    • /
    • 2011
  • 두 분포함수의 혼합모형을 가정한 자료에서 적절한 분류점을 찾고 평가하는 것은 중요한 문제이다. 분류정확도 측도로 많이 사용하는 아홉 종류의 MVD, Youden지수, (0,1)까지 최단기준, 수정된(0,1)까지 최단 기준, SSS, 대칭점, 정확도면적, TA, TR에 대하여 설명하고, 이 측도들의 관계를 발견하면서 정확도 측도들의 조건을 몇 개의 범주로 군집화한다. 정규혼합분포를 가정하여 군집된 측도들에 기반하는 분류점들을 구하고, 그 분류점에 대응하는 제I종 오류율과 제II종 오류율 그리고 두 종류의 오류율합을 구하여 크기를 비교하고 토론하다. 추정된 혼합분포에 대하여 어떤 분류 정확도 측도의 제I종과 II종 오류율 또는 오류율합이 최소인지를 탐색할 수 있으며 자주 인용하는 정확도 측도의 장점과 단점을 파악할 수 있다.

연관성 방향을 고려한 부호 헬링거 측도의 제안 (Signed Hellinger measure for directional association)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.353-362
    • /
    • 2016
  • 데이터 마이닝은 빅 데이터에 내재되어 있는 새로운 법칙이나 잠재되어 있는 지식을 탐색한 후, 이를 근거로 하여 의사결정에 활용하고자 하는 것이다. 위키 백과사전에 의하면 데이터 마이닝 기법 중의 하나인 연관성 규칙은 연관성 평가 기준에 의해 관심 있는 항목들 간에 관련성을 찾아내는 기법으로 많은 연구자들에 의해 연관성 평가를 위한 흥미도 측도들이 개발되어 왔다. 이들 중에서 헬링거 측도는 여러 가지 흥미도 측도들에 비해 많은 장점이 있으나 연관성의 방향을 판단하기가 곤란한 문제를 내포하고 있다. 이 문제를 해결하기 위해 본 논문에서는 부호를 가지는 헬링거 측도를 제안하고 몇 가지 예제를 통하여 유용성을 고찰하였다. 그 결과, 본 논문에서 제안하는 부호 헬링거 측도는 양의 연관성을 가지는 경우에는 양의 값으로 나타나고 음의 연관성을 가지는 경우에는 음의 값을 갖는 것으로 나타났다. 또한 동시발생빈도, 동시 비 발생빈도, 그리고 불일치 빈도가 증가함에 따라 기본적인 연관성 평가 기준들과 부호 헬링거 측도는 증감 여부가 동일한 것을 알 수 있었다.

위험도차이, 상대위험률, 그리고 교차비:그래프 방법 (Risk Difference, Relative Risk, and Odds Ratio: A Graphic Approach)

  • 조태경
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.163-170
    • /
    • 2006
  • 역학(epidemiology) 또는 임상(clinic) 자료를 분석하기 위한 주효 측도의 선택에 대한 연구가 계속되고 있지만, 주효 측도들이 일반적인 함수 형태로만 표현되는 경우에는 주효 측도들의 특징이나 관계를 이해하는 것이 쉽지 않다. 이 논문에서는 주효 측도의 선택 문제 보다는 이변량 자료에 대한 주효 측도 중에서 위험도차이(risk different: RD), 상대위험률(relative risk: RR), 그리고 교차비(odds ratio: OR)를 방사형 그림(radar diagram)을 사용하여 나타내고 이 그림을 이용하여 이들의 특성이나 관계를 살펴보았다. 방사형 그림은 이 측도들을 이해하는데 좋은 도구가 될 것이다.

상대적 소수 함수에 기반을 둔 새로운 유사성 측도와 언어 근사에의 응용 (A New Similarity Measure based on RMF and It s Application to Linguistic Approximation)

  • 최대영
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.463-468
    • /
    • 2001
  • 상대적 소속 함수(RMF)에 기반을 둔 새로운 유사성 측도를 제안한다. 본 논문에서는 RMF는 퍼지 부분 집합간의 상대성을 쉽게 나타내기 위해 제시되었다. 이러한 RMF의 형태는 매개변수값들에 따라 결정되기 때문에 매개변수 값들만을 조정해 줌으로써 퍼지 부분 집합간의 상대성을 쉽게 나타낼 수 있다. 그러므로 퍼지 부분 집합을 이용해 주관성을 표현할 때 개인이나 문화차이간의 상대성을 쉽게 반영해 줄수 있다. 이 경우이들 매개변수들은 퍼비 부분 집합의 구조를 결정해 주는 특징점들이라고 할수 있다. 결과적으로 퍼지 부분 집합간의 유사성 정도가 RMF의 매개변수들을 이용해서 빠르게 계산될 수 있다. RMF에 의해 퍼지 부분 집합간의 유사성 정도를 계산하기 위해 유클리디안 거리를 사용한다. 한편, 제안된 유사성 측도의 응용 분야로 새로운 언어 근사 방법을 제시하고 수치적인 예를 보여준다.

  • PDF

호도법에 관한 교수학적 고찰 (A Didactical Analysis on Circular Measure)

  • 강미광
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제50권3호
    • /
    • pp.355-365
    • /
    • 2011
  • The purpose of this study is to provide mathematical knowledge for supporting the didactical knowledge on circular measure and radian in the high school curriculum. We show that circular measure related to arcs can be mathematically justified as an angular measure and radian is a well defined concept to be able to reconcile the values of trigonometric functions and ones of circular functions, which are real variable functions. Radian has two-fold intrinsic attributes of angular measure and arc measure on the unit circle, in particular, the latter property plays a very important role in simplifying the trigonometric derivatives. To improve students's low academic achievement in trigonometry section, the useful advantage and the background over the introduction of radian should be preferentially taught and recognized to students. We suggest some teaching plans to practice in the class of elementary and middle school for enhancing teachers' and students' understanding of radian.