• 제목/요약/키워드: 표본 오차

검색결과 348건 처리시간 0.019초

조사연구를 위한 표본크기 결정

  • 박진우;정미숙
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2007년도 춘계학술대회 발표논문집
    • /
    • pp.139-149
    • /
    • 2007
  • 사회조사를 위한 표본설계를 할 때 표본의 크기를 얼마로 할 것인지를 결정하는 문제는 조사연구자에게 고민거리가 된다. 사회조사 중에서 4점 또는 5점 척도로 된 여러 개의 개별 문항들로 구성된 설문지를 사용하는 경우가 많다. 이런 경우 개개의 문항 자체를 직접적으로 하나의 변수로 사용하지 않고 여러 개 문항들을 결합하여 새로운 척도를 만들어 사용하는 것이 일반적이다. 본 연구의 목적은 리커트 척도가 관심변수인 조사연구에서 표본크기를 결정하는 방법을 제공하는 것이다. 리커트 척도를 만들고자 할 때 4점 혹은 5점 척도로 구성된 여러 문항변수들은 일반적으로 서로 양의 상관관계를 가지게 된다. 본 연구에서는 개별 문항변수들은 각각 동일한 분포를 가지며, 각각의 변수들은 서로 동일한 크기의 상관관계를 갖는다는 가정을 한다. 주어진 가정 하에서 새로운 척도의 표본분포를 유도한 후 이를 이용하여 다양한 상황에서의 표본의 크기를 계산한 결과를 표로 제시하게 되는데 표본이론을 잘 모르는 조사연구자들은 이 표를 이용하여 원하는 표본크기를 결정 할 수 있을 것이다.

  • PDF

표본 선택 모형을 이용한 국내 여성 임금 데이터 분석 (Korean women wage analysis using selection models)

  • 정미량;김미정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1077-1085
    • /
    • 2017
  • 본 연구에서는 한국노동연구원의 "2015년 한국노동패널조사 (KLIPS)" 자료를 활용하여 국내 여성의 임금 결정요인을 분석하기 한다. 일반적으로 임금 자료는 랜덤 추출이 불가능하기 때문에 분석하기가 쉽지 않다. 표본 선택 편의 (sampling bias)가 있는 자료를 분석하는 방법으로 Heckman 표본 선택 모형이 가장 널리 알려져 있다. Heckman은 크게 두 가지 모형을 제안했는데, 그 중 하나는 최대 우도 방법을 이용하는 것이고, 다른 하나는 2단계 표본 선택 모형이다. 이 중 Heckman 2단계 표본 선택 모형은 주된 결과 모형 (outcome model)과 경제 활동 여부를 결정짓는 선택 모형 (selection model)을 포함한 모형으로써, 이 모형이 최대 우도 방법을 이용한 모형에 비해 이변수 오차의 정규분포 가정에 덜 민감하다고 알려져 있다. 그럼에도 불구하고 이변수 오차에 대한 정규 분포 가정은 꽤 강한 가정이라고 볼 수 있는데, 최근에 이 모형의 단점을 보완하는 모형으로 Marchenko와 Genton (2012)의Heckman 표본 선택 t 모형이 제시되었다. Heckman 2단계 모형과 Heckman 표본 선택 t 모형을 이용하여 국내 여성의 임금 결정 요인을 분석하고 비교하도록 한다.

이중 추출 자료를 이용한 측정오차분산의 추정 (Measurement Error Variance Estimation Based on Subsample Re-measurements)

  • 허순영
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2003년도 춘계학술발표대회
    • /
    • pp.34-41
    • /
    • 2003
  • 많은 경우, 측정오차분산은 알려지지 않은 참값 또는 참값과 연관된 공변수들의 함수로 표현될 수 있다 이 논문은 단위 당 반복측정에 기초한 단위 내 표본분산을 이용한 선형측정오차분산의 추정에 관한 연구이다 이 논문은 다음의 내용을 포함한다: (1) 측정오차의 크기를 나타내는 상수 $\delta$의 추정; (2) 유한모집단으로부터의 복합표본, 작은 측정오차라는 조건하에 선형측정오차분산의 추정; (3) 부표본에 포함될 확률을 설명하기 위한 성향틴헝 추정 미국의 제3차 건강영양조사자료를 사용하여 이상의 결과들을 이용한 경험적 분석을 실행하였다.

  • PDF

로버스트 역전파 알고리즘을 위한 오차함수 (Robust Error Measure for Back Propagation Algorithm)

  • 김현철;이철원
    • 응용통계연구
    • /
    • 제12권2호
    • /
    • pp.505-515
    • /
    • 1999
  • 인공신경망 모형을 적합시키는데 사용하는 역전파 알고리즘을 로버스트하게 만드는 새로운 오차함수를 제안했으며, 새 방법의 성능을 확인하기 위해 Liano가 제안한 방법에 따라 모의실험을 수행했다. 실험결과 새 방법은 LMS방법만큼 안정적이었으며, Liano의 LMLS방법보다 더 로버스트했다. 또 실제 사례를 분석함으로써 이 방법이 의미있는 방법임을 보였다. 새 방법은 특히 오차가 없거나 작은 오차를 갖는 표본에 대해서도 좋은 성질을 가짐으로서 대형오차의 유무에 관계없이 항상 사용할 수 있는 방법으로 판명되었다.

  • PDF

다중 시계열 패턴 분석에 의한 소프트웨어 계측 (Software Measurement by Analyzing Multiple Time-Series Patterns)

  • 김계영
    • 인터넷정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.105-114
    • /
    • 2005
  • 본 논문에서는 다중 시계열 패턴을 분석하여 계측 값을 예측하는 방법에 관하여 기술한다. 본 논문의 목적은 표본패턴들 중에서 입력패턴과 가장 유사한 패턴을 찾은 다음 그 표본패턴이 가지는 실측값과의 오차율을 산출하는 것이다. 따라서 인식이 아니라 계측이며 하드웨어가 아닌 소프트웨어 기술을 제안하다. 본 논문에서 제안하는 방법은 초기화, 인식 및 계측 등의 단계로 구성된다. 초기화 단계에서는 중요도를 사용하여 인자들 각각의 가중치를 산출한다. 학습 단계에서는 수집된 표본패턴을 먼저 DTW와 LBG 알고리즘을 사용하여 각 인자별 독립적으로 군집화를 수행한 다음, 모든 표본패턴에 대하여 군집의 번호들로 구성된 코드열을 생성한다. 계측 단계에서는 입력패턴에 대한 코드열을 생성한 다음 해슁으로 표본패턴들 중에서 같은 코드열을 가지는 표본들을 찾고, 이 표본들 중에서 입력패턴에 가장 잘 정합되는 하나의 표본을 선택하다. 최종적으로 이 패턴이 가지고 있는 실측값과 오차율을 출력한다. 성능평가는 반도체생산장치 중에서 하나인 식각장치로부터 얻어진 자료에 적용하여 수행한다.

  • PDF

표본조사에서 항목 무응답 대체 방법

  • 김영원;조선경
    • Communications for Statistical Applications and Methods
    • /
    • 제3권3호
    • /
    • pp.145-159
    • /
    • 1996
  • 항목 무응답은 표본조사에서 비표본오차를 발생시키는 중요한 요인으로 지적되고 있다. 본 논문에서는 현재까지 통계조사의 분석과정에서 직관적으로 제시된 다양한 항목 무응답 대체방법들을 정리하고, 이런 방법들 간의 장.단점과 무응답의 발생 형태에 다른 대체 효과를 실제 사회조사 자료를 이용한 모의 실험을 통하여 비교, 분석하였다.

  • PDF

절사표본에서 최적 절사점에 관한 연구 (A Study on the Optimal Cut-off Point in the Cut-off Sampling Method)

  • 이상은;조민지;신기일
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.501-512
    • /
    • 2014
  • 상당수의 사업체 조사는 절사표본설계법을 사용하고 있다. 이는 절사표본설계법에서 얻은 전수층이 많은 정보를 포함하고 있어 전체 표본크기를 최소화 할 수 있는 장점이 있기 때문이다. 그러나 최근 전수층에 포함된 사업체들의 무응답률이 높아감에 따라 전수층이 가지고 있는 장점에 한계가 나타나고 있다. 이에 Lee (2011), Shin과 Lee (2013)는 표본설계 단계에서부터 주어진 허용오차를 만족하면서 전수층 규모를 최소화하는 연구를 실시하였다. 본 연구에서는 주어진 허용오차를 만족하고 Hidiroglou (1986)가 제안한 방법으로 산출 된 표본크기를 고정한 상태에서 표본층 분산에 알려진 함수를 적합하여 전수층 크기를 최소화하는 새로운 최적 절사점을 제안하였다. 또한 Hidiroglou (1986)와 Shin과 Lee (2013)가 제안한 절단분포를 이용한 방법과 본 연구에서 제안한 방법을 모의실험과 사례연구를 통해 비교하였다.

주거 실태 및 수요조사 표본설계 (Sample Design in Korea Housing Survey)

  • 변종석;최재혁
    • 한국조사연구학회지:조사연구
    • /
    • 제11권1호
    • /
    • pp.123-144
    • /
    • 2010
  • 지역별 계층별 주거실태 파악을 위한 주거 실태 및 수요조사의 새로운 표본설계는 전국 16개 시도별로 조사결과의 독립추계가 가능하도록 설계하는 것을 원칙으로 하여 총 45개의 층으로 층화한다. 조사의 표본오차 관리 대상 변수로 주택사용면적, 가구소득, 가구주 소득, 가구 생활비 등을 고려하여 표본규모를 결정한다. 각 지역의 표본크기는 기존조사의 결과 중 상대표준오차를 이용하여 결정하고 세부 층에 대한 표본배정은 가구 수의 제곱근비례 배정방법을 적용한다. 표본조사구의 추출은 조사구의 크기에 비례한 확률비례계통추출법으로 추출하고 계통추출에 있어서는 추출단위를 분류지표에 따라 정렬한 후 추출한다. 주택의 재건축, 재개발 등의 변화를 반영하기 위해 신규 아파트 단지를 고려하되 주택은 멸실에 대한 자료를 얻기 어렵기 때문에 신규 주택은 고려하지 않는다. 가중값은 설계가중값, 무응답 조정, 사후층화 조정의 과정을 통해 추정량과 분산 추정량에 이용한다. 추정의 효율을 살펴보기 위해 분산추정량의 설계효과를 계산한다.

  • PDF

인터넷 조사에서 무응답 오차에 관한 연구 (A Study on Nonresponse Errors in the Internet Survey)

  • 남궁평;김민정
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2002년도 춘계학술대회 발표논문집
    • /
    • pp.137-156
    • /
    • 2002
  • 인터넷 조사는 전통적인 조사방법에 비해 신속하고 저렴하며 멀티미디어를 이용한 고도화된 설문을 사용할 수 있다는 장점이 있는 반면 표본을 확률 추출하는 것이 어렵고, 대표성, 무응답 등의 비표본 오차가 심각하다. 본 연구에서는 비표본 오차 중 무응답 오차를 사례와 함께 정리하고, 인터넷 조사가 새로운 조사 방법으로서 활용될 수 있는 대안을 제시한다.

  • PDF