• 제목/요약/키워드: naive estimator

검색결과 6건 처리시간 0.023초

단순 추정량을 이용한 악성코드의 탐지척도 선정 (Selection of Detection Measures for Malicious Codes using Naive Estimator)

  • 문길종;김용민
    • 정보보호학회논문지
    • /
    • 제18권2호
    • /
    • pp.97-105
    • /
    • 2008
  • 네트워크 내의 다양한 악성코드는 변종들이 빠르게 생성되고 그 행위는 점차 지능화되어 피해도 커지고 있다. 본 논문에서는 효과적인 악성코드 탐지를 위해 탐지규칙 생성에 효과적인 척도선정 방법을 제안한다. 실험에 헤더 정보만을 활용함으로써 페이로드 데이터를 검사하는 과부하를 최소화하였고, 패킷의 단순한 정보가 아닌 네트워크 연결정보인 다양한 척도를 사용하여 악성코드의 특징 파악을 용이하게 한다. 실험에 사용된 80개의 연결정보 중 유용한 탐지척도를 선정하기 위해 히스토그램 방법을 이용해 확률 분포를 구하고, 단순 추정량에 적용한 후, 상대 복잡도를 이용한다. 단순 추정량 방법은 기존 방법인 히스토그램 방법의 단점인 임의로 나눈 경계 부근의 값에 대한 오분류를 해결하고, 악성코드 탐지에 유용한 척도의 선택을 유도한다. 선정된 척도를 바탕으로 탐지규칙을 생성하고, 탐지실험을 하여, 그 결과를 기존 방법과 비교 평가함으로써 제안하는 기법이 유용함을 보인다.

나이브 성향점수보정 추정량의 정확성 향상을 위한 이중 사후층화 방법 연구 (A study to improve the accuracy of the naive propensity score adjusted estimator using double post-stratification method)

  • 여이수;신기일
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.547-559
    • /
    • 2023
  • 표본조사에서 무응답의 적절한 처리는 추정의 정확성을 향상한다. 결측 메카니즘이 MCAR (missing completely at random) 또는 MAR (missing at random)인 경우에서는 이를 적절히 처리할 수 있는 다양한 방법이 연구되었다. 무응답이 발생하였을 때 사용하는 평균 추정량으로 흔히 성향점수보정 추정량이 사용되며 MAR 또는 MCAR 무응답인 경우, 알려진 표본 가중치와 타당한 방법으로 추정된 응답확률을 사용할 수 있으므로 성향점수보정 추정량은 불편추정량이 된다. 그러나 관심변수 값에 영향을 받는 무응답인 MNAR (missing not at random) 무응답에서는 정확한 응답확률을 구하는 것이 어려워 성향점수보정 추정량에 편향이 발생할 수 있다. Chung과 Shin (2017, 2022)은 무정보적 표본설계에서 MNAR 무응답이 발생하였을 때 평균 추정의 정확성을 향상하는 방법으로 단일 사후층화 방법을 제안하였다. 본 연구에서는 정보적 표본설계를 사용하고, MNAR 무응답이 발생한 경우에서 나이브 성향점수보정 추정량의 정확성 향상을 위한 이중 사후층화 방법을 제안하였다. 또한, 모의실험을 통해 제안된 방법의 우수성을 확인하였다.

Parametric Empirical Bayes Estimators with Item-Censored Data

  • Choi, Dal-Woo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제8권2호
    • /
    • pp.261-270
    • /
    • 1997
  • This paper is proposed the parametric empirical Bayes(EB) confidence intervals which corrects the deficiencies in the naive EB confidence intervals of the scale parameter in the Weibull distribution under item-censoring scheme. In this case, the bootstrap EB confidence intervals are obtained by the parametric bootstrap introduced by Laird and Louis(1987). The comparisons among the bootstrap and the naive EB confidence intervals through Monte Carlo study are also presented.

  • PDF

무응답 대체 방법과 대체 효과 (Imputation Methods for Nonresponse and Their Effect)

  • 김규성
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2000년도 춘계학술대회 조사연구의 방법론적 쟁점
    • /
    • pp.1-14
    • /
    • 2000
  • 사회.경제조사에서 흔히 발생하는 무응답에 대한 통계적 대처 방안을 고찰하였다. 항목 무응답이 발생했을 때 무응답 데이터를 포함하지 않는 완전 데이터를 만드는 방법으로 무응답 대체 방법이 널리 이용되고 있다. 본 논문에서는 여러 가지 대체 방법을 소개하고 각 방법의 장.단점을 비교.설명하였다. 또한 대체된 데이터를 응답 데이터인 것처럼 활용했을 때 발생하는 문제점들을 지적하였다. 무응답을 대체하면 대체된 값들 때문에 대체 후 추정량의 분산은 대체 분산만큼 증가하는 반면, 대체된 데이터에 기초한 통상적인 분산추정량은 대체 분산을 추정하지 못하므로 결과적으로 대체 후 추정량의 분산을 과소추정하게 된다. 이러한 분산의 과소추정의 원인을 이론적으로 고찰하였고, 모의실험을 통하여 그 결과의 심각성을 설명하였다. 마지막으로 분산의 과소 추정 문제를 해결하는 몇 가지 수정된 분산추정 방법을 소개하고 토의하였다.

  • PDF

무응답 대체 방법과 대체 효과 (Imputation Methods for Nonresponse and Their Effect)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제1권2호
    • /
    • pp.1-14
    • /
    • 2000
  • 사회${\cdot}$경제조사에서 흔히 발생하는 무응답에 대한 통계적 대처 방안을 고찰하였다. 항목 무응답이 발생했을 때 무응답 데이터를 포함하지 않는 완전 데이터를 만드는 방법으로 무응답 대체 방법이 널리 이용되고 있다. 본 논문에서는 여러 가지 대체 방법을 소개하고 각 방법의 장${\cdot}$단점을 비교${\cdot}$설명하였다. 또한 대체된 데이터를 응답 데이터인 것처럼 활용했을 때 발생하는 문제점들을 지적하였다. 무응답을 대체하면 대체된 값들 때문에 대체 후 추정량의 분산은 대체 분산만큼 증가하는 반면, 대체된 데이터에 기초한 통상적인 분산추정량은 대체 분산을 추정하지 못하므로 결과적으로 대체 후 추정량의 분산을 과소추정하게 된다. 이러한 분산의 과소추정의 원인을 이론적으로 고찰하였고, 모의실험을 통하여 그 결과의 심각성을 설명하였다. 마지막으로 분산의 과소추정 문제를 해결하는 몇 가지 수정된 분산추정 방법을 소개하고 토의하였다.

  • PDF

Efficient Score Estimation and Adaptive Rank and M-estimators from Left-Truncated and Right-Censored Data

  • Chul-Ki Kim
    • Communications for Statistical Applications and Methods
    • /
    • 제3권3호
    • /
    • pp.113-123
    • /
    • 1996
  • Data-dependent (adaptive) choice of asymptotically efficient score functions for rank estimators and M-estimators of regression parameters in a linear regression model with left-truncated and right-censored data are developed herein. The locally adaptive smoothing techniques of Muller and Wang (1990) and Uzunogullari and Wang (1992) provide good estimates of the hazard function h and its derivative h' from left-truncated and right-censored data. However, since we need to estimate h'/h for the asymptotically optimal choice of score functions, the naive estimator, which is just a ratio of estimated h' and h, turns out to have a few drawbacks. An altermative method to overcome these shortcomings and also to speed up the algorithms is developed. In particular, we use a subroutine of the PPR (Projection Pursuit Regression) method coded by Friedman and Stuetzle (1981) to find the nonparametric derivative of log(h) for the problem of estimating h'/h.

  • PDF