• 제목/요약/키워드: 표본영향함수

검색결과 52건 처리시간 0.02초

경험적 영향함수와 표본영향함수 간 차이 보정의 t통계량으로의 확장 (Extending the calibration between empirical influence function and sample influence function to t-statistic)

  • 강현석;김홍기
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.889-904
    • /
    • 2021
  • 본 연구는 Kang과 Kim (2020)의 후속 연구이다. 본 연구에서는 기존 연구에서 직접 유도하지 않았던 통계량의 표본영향함수를 유도한다. 그리고 이 결과를 바탕으로 경험적 영향함수와 표본영향함수는 어떠한 관계를 가지고 있는지 이론적으로 살펴보고, 경험적 영향함수를 통해 표본영향함수를 근사시켜 추정하는 방안에 대해 생각해 본다. 또한, 임의추출한 300개의 데이터를 바탕으로 모의실험을 통해 유도한 함수와 그 관계에 대한 그 타당성도 검증한다. 모의실험 결과 t통계량으로부터 유도한 표본영향함수와 경험적 영향함수와의 관계 및 경험적 영향함수를 통한 표본영향함수의 근사 방안에 대한 타당성도 검증해 냈다. 본 연구는 경험적 영향함수를 이용한 표본영향함수의 근사에서 오차를 줄이기 위한 방안을 제안하고 그 타당성을 검증하였으며, 이를 통해 기존의 연구에서 경험적 영향함수로 표본영향함수를 바로 근사시켰던 연구 방법에 효과적인 근사 방안을 제안한 점에서 의의를 갖는다.

경험적 영향함수와 표본영향함수의 차이 및 보정에 관한 연구 (A study on the difference and calibration of empirical influence function and sample influence function)

  • 강현석;김홍기
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.527-540
    • /
    • 2020
  • 이상치에 대한 적절한 선별과 배제없이 모든 데이터를 종합적으로 분석하게 되는 경우 데이터 분석을 통해 얻은 결과의 신뢰성과 해석의 일반성에 치명적인 위협을 받을 수 있다. 따라서 데이터의 분석 과정에서 이러한 이상치를 판별하고, 이상치가 통계량, 통계적 모형에 어떠한 영향을 주는 지에 대한 분석은 매우 중요한 일이라 할 수 있다. Hampel이 영향함수를 활용하여 이상치를 판별할 수 있는 방법을 소개한 이후, 이상치를 판별하기 위한 방법론으로 영향함수가 폭넓게 활용되어 왔다. 영향함수에는 경험적 영향함수와 표본영향함수가 있으며, 경험적 영향함수를 활용해 표본영향함수를 근사 추론하여 하나의 관측값이 제거되었을 때 통계량에 미치는 영향을 예측하는 방법론이 주로 활용되었다. 본 연구에서는 표본평균, 표본분산, 표본표준편차의 표본영향함수 유도를 통해 경험적 영향함수와 표본영향함수의 차이를 살펴 본다. 또한 경험적 영향함수로 표본영향함수를 근사하는 과정에서 발생하는 오차를 줄이기 위해 경험적 영향함수의 보정으로 표본영향함수를 근사 추론하는 방법을 제안하고, 모의실험을 통해 제안한 추론 방법의 타당성을 확인한다.

변이계수에 대한 영향함수 (Influence Function on the Coefficient of Variation)

  • 이윤희;김홍기
    • Communications for Statistical Applications and Methods
    • /
    • 제15권4호
    • /
    • pp.509-516
    • /
    • 2008
  • 본 논문에서는 변이계수에 대한 영향함수를 유도한다. 경험적 영향함수와 표본영향함수를 이용하여 유도된 영향함수의 타당성을 입증하고 이를 위하여 정규분포 $N(20,1^2)$$N(20,5^2)$에서 각각 확률표본을 추출하여 시뮬레이션을 수행한다. 시뮬레이션 결과로부터, 유도된 변이계수에 대한 영향함수가 한 개의 관찰치가 제거되었을 때 변이계수의 변화량을 매우 정확히 추정하는 것을 확인하였다.

응답률이 선형인 표본조사에서 편향 보정 추정 (Bias adjusted estimation in a sample survey with linear response rate)

  • 정희영;신기일
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.631-642
    • /
    • 2019
  • 다수의 항목무응답이 발생한 표본조사에서는 추정의 정확성이 떨어진다. 이를 해결하기 위한 많은 방법이 개발되었으나 응답률이 관심변수에 의해 영향을 받는 경우임에도 이를 고려하지 않고 랜덤으로 무응답이 발생한다는 가정 하에서 사용하는 무응답 처리 방법을 사용하게 되면 편향이 발생하는 것으로 알려져 있다. Chung과 Shin (2017)과 Min과 Shin (2018)은 응답률이 관심변수의 함수인 경우에서 발생된 편향을 적절히 처리하여 추정의 정확성을 향상시키는 방법을 제안하였다. 본 연구에서는 응답률 함수가 선형(linear)이면서 초모집단 모형의 오차가 정규분포를 따르는 경우를 살펴보았으며 층별 모집단 수가 편향 보정에 영향을 주는지도 살펴보았다. 모의실험을 통하여 제안된 추정량의 성능을 살펴보았으며 실제 자료 분석을 통해 이를 확인하였다.

신경망기법을 이용한 기업부실예측에 관한 연구

  • 정기웅;홍관수
    • 재무관리연구
    • /
    • 제12권2호
    • /
    • pp.1-23
    • /
    • 1995
  • 본 연구의 목적은 특정 금융기관의 주거래기업들에 대한 부실예측을 위해 주거래기업들을 잠식, 도산, 그리고 건전기업과 같이 세집단으로 구분하여 예측하고자 하며, 기업부실 예측력에 영향을 미치는 세 가지 요인으로서 표본구성, 투입 변수, 분석 기법의 관점에서 다음을 살펴보는 것이다. 첫째, 기업부실예측에서 전통적인 delta learning rule과 sigmoid함수를 사용한 역전파학습(신경망 I)과 이들의 변형형태인 normalized cumulative delta learning rule과 hyperbolic tangent함수를 사용한 역전파 학습(신경망 II)과의 예측력의 차이를 살펴보고 또한 이러한 두가지 신경망기법의 예측력을 MDA(다변량판별분석) 결과와 비교하여 신경망기법에 대한 예측력의 유용성을 살펴보고자 한다. 둘째, 세집단분류문제에서는 잠식, 도산, 건전기업의 구성비율이 위의 세가지 예측기법의 결과에 어떠한 영향을 미치는지를 살펴보고자 한다. 세째, 투입 변수선정은 기존연구 또는 이론을 바탕으로 연구자의 판단에 의해 선택하는 방법과 다수의 변수를 가지고 통계적기법에 의해 좋은 판별변수의 집합을 찾는 것이다. 본 연구에서는 이러한 방법들에 의해 선정된 투입변수들이 세가지 예측기법의 결과에 어떠한 영향을 미치는지를 살펴보고자 한다. 이러한 관점에서 본 연구의 실증분석 결과를 요약하면 다음과 같다. 1) 신경망기법이 두집단에서와 같이 세집단 분류문제에서도 MDA보다는 더 높은 예측력을 보였다. 2) 잠식과 도산기업의 수는 비슷하게 그리고 건전기업의 수는 잠식과 도산기업을 합한 수와 비슷하게 표본을 구성하는 것이 예측력을 향상하는데 도움이 된다고 할 수 있다. 3) 속성별로 고르게 투입변수로 선정한 경우가 그렇지 않은 경우보다 더 높은 예측력을 보였다. 4) 전통적인 delta learning rule과 sigmoid함수를 사용한 역전파학습 보다는 normalized cumulative delta learning rule과 hyperbolic tangent함수를 사용한 역전파 학습이 더 높은 예측력을 보였다. 이러한 현상은 두집단문제에서 보다 세집단문제에서 더 큰 차이를 나타내고 있다.

  • PDF

Shifted Window를 이용한 음성신호의 분석에 관한 연구 (On a Study of Analysis Using Shifted Window in the Speech Signal)

  • 강은영;민소연;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.131-134
    • /
    • 2000
  • 음성신호처리에서 스펙트럼 분석은 매우 중요하다. 하지만 스펙트럼 분석을 위해서 사용되는 윈도우에 의해 생기는 누설에러지 때문에 음성신호의 스펙트럼 정보가 왜곡된다. 본 논문에서는 스펙트럼 분석 시 발생되는 창함수 사용에 의해 생기는 누설에너지를 최소화하기 위한 새로운 창함수를 제안하고자 한다. 그 형태는 전체 창함수크기의 반을 방형창으로 나머지 반을 해밍창으로 하고 창의 처음 부분은 $\pm$20표본에서 영점을 찾아주는 것이다. 이 창함수의 특징은 신호분석에 있어서 왜곡은 크지만 그 형태에 있어서 가장 이상적인 방형창함수의 장점과 side lobe가 작아 비교적 왜곡이 적은 해밍창함수의 장점을 취한 것이라 하겠다. 실제 음성 신호에의 적용에 있어서 방형창과 해밍창의 적용비는 신호의 종류 및 용도에 따라 달리할 수 있다. 제안한 창함수는 해밍창함수 보다는 좁은 main lobe 특성으로 음성신호의 단구간 스펙트럼 분석시 음성의 빠른 변화특성을 적절히 보여줄 수 있고 방형창보다는 side lobe의 영향을 줄일 수 있다.

  • PDF

응답률이 관심변수의 지수함수를 따를 경우 정보적 표본설계 기법을 이용한 모수추정 (Estimation using informative sampling technique when response rate follows exponential function of variable of interest)

  • 정희영;신기일
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.993-1004
    • /
    • 2017
  • 표본조사에서는 추정의 정확성 및 정밀성 향상을 위해 흔히 층화추출법을 사용하며 층 내에서는 동일한 표본 가중치를 이용하여 표본을 추출한다. 그러나 실제 응답률은 관심변수 값에 영향을 받을 수 있기 때문에 주어진 동일한 가중치는 응답률을 반영하여 보정되어야 한다. 또한 관심변수가 연속형 보조변수와 선형 관계가 있고 보조변수를 기준으로 층이 나누어진 경우에는 층 내에서 동일한 가중치를 사용하는 것 보다 층을 세분화한 후 얻어진 가중치를 사용하는 것이 효과적일 수 있다. 본 연구에서는 응답률이 관심변수 자료 값의 지수함수이고, 관심변수가 보조변수와 선형 관계가 있을 때 정보적 표본설계 기법을 이용하여 추정의 정확성과 정밀성을 높이는 방법을 제안하였다. 또한 모의실험을 통하여 제안된 방법의 우수성을 확인하였다.

선형 응답률 모형에서 초모집단 모형의 비모수적 함수 추정을 이용한 무응답 편향 보정 추정 (Bias corrected non-response estimation using nonparametric function estimation of super population model)

  • 심주용;신기일
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.923-936
    • /
    • 2021
  • 표본조사에서는 다수의 무응답이 발생하며 이를 적절히 처리하는 다양한 방법이 개발되었다. 특히 무응답이 관심변수에 영향을 받고 이로 인해 발생한 편향은 추정의 정확성을 크게 떨어뜨리며 무응답 처리를 어렵게 한다. 최근 Chung과 Shin (2017, 2020)은 알려진 모수적 초모집단 모형과 응답률 모형을 이용하여 추정의 정확성을 향상한 추정량을 제안하였다. 본 연구에서는 초모집단 모형의 형태를 일반화하여 비모수적 함수 형태를 설정한 후 이를 기반으로 얻어진 편향을 적절히 처리한 편향 보정 평균추정량을 제안하였다. 모의실험을 통해 본 연구에서 제안한 방법의 우수성을 확인하였다.

모의실험을 기반으로 지수형 응답률 보정을 위한 세부 층 결정에 관한 연구 (A study on the determination of substrata using the information of exponential response rate by simulation studies)

  • 민주원;신기일
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.621-636
    • /
    • 2018
  • 정보적 표본설계 기법을 적용하여 무응답의 영향을 줄이기 위한 연구가 진행되고 있다. 특히 초모집단모형(super population model)에 포함된 오차의 분포가 정규분포를 따르고 응답률이 지수함수를 따를 때 지수형 응답률 정보를 모수추정에 사용함으로써 추정의 정확성이 향상되는 것으로 알려져 있다. 최근 Chung과 Shin (2017)은 정보적 표본설계의 가중치를 구하기 위해 세부 층을 등간격으로 나누는 방법을 고려하였으며 세부 층의 개수가 추정의 정확성에 영향을 주는 것을 확인하였다. 이에 본 연구에서는 주어진 표본 규모에 따른 최적의 세부 층 개수와 최적의 층 경계를 구하기 위해 등간격, 분위수, LH 알고리즘을 이용하여 층을 나누는 방법을 살펴보았으며 모의실험을 통하여 각 방법의 결과를 비교하였다. 또한 다양한 형태의 보조변수 분포를 이용하여 실무에서 사용할 수 있는 세부 층 경계와 세부 층 개수를 정하는 기준을 제안하였다.

산지성호우의 환상스팩트럼 추정 (Estimation of Radial Spectrum for Orographic Storm)

  • 이재형;선우중홍;김민환;심명필
    • 대한토목학회논문집
    • /
    • 제10권4호
    • /
    • pp.53-66
    • /
    • 1990
  • 산악의 영향을 받는 지역에서 비정상성 평균을 사용하는 G.C.모델에 의하여 총강우량의 우량곡면을 구성하였다. 구성된 우량곡면에 2차원 프리에 해석을 실시하여 강우의 주기성분을 분리하였다. 강우의 지엽성분, 즉 강우잔차는 우량곡면에서 주기성분을 제거하여 얻은 강우잔차를 균일한 무작위장의 표본함수라고 가정해서 이 무작위장의 특성을 자기상관함수로 나타냈다. 자기상관함수를 변환하여 스팩트럼 밀도를 구했고, 이 결과를 토대로 한강, 금강유역의 환상스팩트럼 분포함수의 모델을 제안했다.

  • PDF