• 제목/요약/키워드: 포함확률비례추출

검색결과 6건 처리시간 0.019초

포함확률비례추출에서 회귀계수 최소제곱추정량의 근사분산 (Approximate Variance of Least Square Estimators for Regression Coefficient under Inclusion Probability Proportional to Size Sampling)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.23-32
    • /
    • 2012
  • 본 논문은 유한모집단에서 회귀계수추정량의 근사편향과 근사분산을 다루고 있다. 유한모집단에서 고정크기 포함확률비례표본을 추출하고 이 표본에서 조사된 데이터에 기초하여 회귀계수를 일반최소제곱추정량과 가중최소제곱추정량으로 추정할 때 두 추정량의 편향, 분산 그리고 평균제곱오차의 근사식을 유도하였다. 그리고 두 추정량의 효율을 비교하기 위하여 두 추정량의 분산을 비교하는 필요충분조건을 제시하였다. 또한 수치적인 비교를 위하여 간단한 예제를 소개하였다.

변수변환에 의한 수정 HORVITZ-THOMPSON 추정량 (A Modified Horvitz-Thompson Estimator by Transformation of Variables)

  • 류제복
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.27-34
    • /
    • 2004
  • Horvitz-Thompson(H-T)추정량이 확률비례추정량에 비해 효율이 떨어지는 경우가 있다 이를 극복하기 위해서 2단계 변수변환을 한다. 1단계로는 Midzuno-Sen추출을 적용하기 위해서 보조변수를 변환하고, 이로부터 얻은 포함확률을 H-T추정량에 사용할 때 분산을 줄이기 위해서 2단계로 연구변수를 변환하였다. 이러한 변환을 통해 얻은 추정량과 기존의 PPS 추정량들을 비교하였다.

국가표준식품성분 데이터베이스 대표시료 선정을 위한 표본설계 (A study on collecting representative food samples for the 10th Korean standard foods composition table)

  • 김진흠;황해원;조유정;박진우
    • 응용통계연구
    • /
    • 제33권2호
    • /
    • pp.215-228
    • /
    • 2020
  • 농촌진흥청에서는 식품산업진흥법 제19조 제1항에 의거하여 국가표준식품성분표를 5년 주기로 발표하고 있다. 본 논문에서는 2021년 국가표준식품성분표 제10개정판 발간을 앞두고 우리나라 국민들이 많이 소비하고 있는 식품으로 선정된 182개 식품의 대표시료를 합리적이고 과학적으로 추출하기 위한 방안을 제안하였다. 농수산물을 포함한 식품을 판매하는 식료품점을 유통형태에 따라 대형마트와 전통시장으로 구분한 후 NFNAP에서 제안한 층화다단추출법을 각각 적용하여 8개 표본을 추출하였다. NFNAP는 미국인들이 소비하고 있는 식료품의 성분표에 대한 신뢰성 있는 추정을 담보하기 위해 미국 농무성과 국립보건원이 1977년에 협약을 맺고 공동 연구로 개발한 국가식품 영양분석 프로그램이다. 대형마트에 기초한 표본추출에서는 이마트 가양점, 홈플러스 시흥점, 롯데마트 동두천점, 이마트 수원점, 롯데마트 둔산점, 롯데마트 여수점, 이마트 울산점, 하나로클럽 울산점이 표본으로 추출되었고, 전통시장에 기초한 표본추출에서는 서울시 금천구 독산동우시장과 송파구 풍납시장, 고양시 일산서구 일산시장, 광주광역시 북구 운암시장, 대전광역시 대덕구 법동시장, 부산광역시 영도구 봉래시장과 해운대구 좌동재래시장, 창원시 진해구 중앙시장이 표본으로 추출되었다.

층화 및 층화 이표본 조건부 무관질문모형 (A Stratified and Two Sample Stratified Conditional Unrelated Question Model)

  • 이기성
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2883-2893
    • /
    • 2018
  • 본 논문에서는 모집단이 층으로 구성되어 있고 얻고자 하는 속성이 민감할 때, 덜 민감한 속성 B와 강요응답으로 구성되어 있는 확률장치를 통해 "예"라고 응답한 사람들에게만 민감한 속성 A 와 무관한 속성 Y를 포함하고 있는 Greenberg et al.(1969)의 무관질문모형을 사용하도록 하여 모집단이 층화된 경우 층화추정을 위한 층화 조건부 무관질문모형을 제안하였다. 그리고 제안한 층화 조건부 무관질문모형에서 각 층에 표본을 배분할 때 비례배분과 최적배분 문제를 다루었다. 또한 층화 조건부 무관질문모형을 무관한 속성이 미지인 경우 두 개의 독립표본을 이용하는 층화 이표본 조건부 무관질문모형으로 확장하였으며, 제안한 층화 이표본 조건부 무관질문모형의 두 번째 단계에서 사용되는 h층의 표본의 크기에 대한 최적값을 도출하여 최소분산을 구하였다. 마지막으로 층화 조건부 무관질문모형이 층화 무관질문모형과 층화 Carr et al.(1982)의 모형보다 효율적이 되는 조건을 제시하여 일정한 조건하에서 제안한 모형이 기존 모형들보다 효율적임을 보였으며, 제안한 층화 조건부 무관질문모형이 ${\pi}_{h2}$ 값이 작고 ${\pi}_{hy}$ 값이 작을수록 층화 Carr et al.(1982)의 모형보다 효율적임을 수치적으로 보였다.

기업연구개발활동통계 개선방안에 관한 연구

  • 조성표;박선영;한기인;노민선;배한수;김현아
    • 기술경영경제학회:학술대회논문집
    • /
    • 기술경영경제학회 2009년도 동계학술발표회
    • /
    • pp.313-332
    • /
    • 2009
  • 본 연구에서는 국가의 연구개발활동조사에서 기업연구개발활동 통계에 대한 효과적인 산출방법을 제시하고자 하였다. 이를 위하여 국내 외 연구개발 통계방법을 조사한 후 이를 토대로 우리나라에서 기업연구개발활동에 대한 자료의 수집 및 분석에 대한 개선방안을 제시하였다. 대부분의 국가에서는 대기업은 전수조사, 소규모 기업은 표본조사를 수행하고 있으나, 우리나라에서는 연구소 등록법인에 대하여 전수조사를 행하고 있다. 전수조사는 비용이 많이 들고 비 표본오차로 인하여 모집단에 대한 체계적인 추정이 불가능하다는 문제점이 있다. 현재 산업기술진흥협회에 등록된 연구기관의 수가 20,000개를 넘어서고 있어 전수조사는 한계에 다다른 것으로 생각되어 표본조사 도입에 대한 타당성과 방법론을 중점적으로 검토하였다. 먼저, 표본조사의 타당성을 평가하기 위하여 현재 전수조사를 통해 수집된 자료를 이용하여 표본조사를 수행한 결과를 비교 분석하였다. 산업별(24개), 그룹별(8개)로 구분하여 216개 셀별로 모집단수/표본수를 곱하여 산정 (셀별추정법)한 결과, 전수 통계치와 거의 동일하게 나타났다. 따라서, 산업별, 그룹별로 세분하여 모집단수/표본수를 곱하여 추정하는 셀별추정법이 타당한 것으로 평가할 수 있다. 이상의 분석결과를 토대로 새로운 조사설계방안을 제시하면 다음과 같다. 직전연도 조사기업은 직전연도 연구개발비 수준과 기업종류(대기업, 벤처기업, 중소기업), 그리고 산업에 따라 셀을 분할한다. 대기업, 연구개발비 수준이 높은 기업 등 주요한 셀에 대하여는 전수조사를 실시한다. 나머지 셀에 대하여는 각 셀별 연구개발지출의 분포가 동질적이기 때문에 표본 추출방법은 단순임의추출법(SRS)을 사용한다. 다만 전년도 미계상된(또는 미포함된) 기업에 대하여는 신규 대형 연구소 진입 등을 고려하여 규모비례확률추출법(PPS)을 고려하는 것이 바람직할 것으로 판단된다. 일부 기업들이 특정 항목에 대한 자료를 제공하지 않는 항목무응답의 경우, 누락된 자료에 대하여는 대체기법(Imputation Algorithm)에 따라 이를 추정한다. 이러한 표본조사방법은 전수조사에서 발생하는 비 표본오차를 해소하고, 자료수집비용 및 소규모기업의 행정적 부담을 경감할 수 있다는 장점이 있다. 향후 연구에서는 좀 더 구체적인 조사방법론을 강구할 필요가 있으며, 이와 함께, 연구개발에 대한 다양한 측면의 정보를 수집하기 위해 새로운 설문지를 개발할 필요성이 있다.

  • PDF

표본조사에 의한 기업 연구개발활동 통계 작성방안 (Development of Sample Survey Design for the Industrial Research and Development Statistics)

  • 조성표;박선영;한기인;노민선
    • 기술혁신연구
    • /
    • 제17권2호
    • /
    • pp.1-23
    • /
    • 2009
  • 본 연구에서는 국가의 연구개발활동조사에서 기업연구개발활동 통계에 대한 효과적인 산출방법을 제시하고자 하였다. 이를 위하여 국내 외 연구개발 통계 방법을 조사한 후 이를 토대로 우리나라에서 기업연구개발활동에 대한 자료의 수집 및 분석에 대한 개선 방안을 제시 하였다. 대부분의 국가에서 대기업은 전수조사, 소규모 기업은 표본조사를 수행하고 있으나, 우리나라에서는 연구소 등록법인에 대하여 전수조사를 행하고 있다. 전수조사는 비용이 많이 들고 비표본오차로 인하여 모집단에 대한 체계적인 추정이 불가능하다는 문제점이 있다. 현재 산업기술진흥협회에 등록된 연구기관의 수가 20,000개를 넘어서고 있어 전수조사는 한계에 다다른 것으로 생각되어 표본조사 도입에 대한 타당성과 방법론을 중점적으로 검토하였다. 먼저, 표본조사의 타당성을 평가하기 위하여 현재 전수조사를 통해 수집된 자료를 이용하여 표본조사를 수행한 결과를 비교 분석하였다. 산업별(24개), 그룹별(8개)로 구분하여 216개 셀별로 모집단수/표본수를 곱하여 산정(셀별추정법)한 결과, 전수 통계치와 거의 동일하게 나타났다. 따라서, 산업별, 그룹별로 세분하여 모집단수/표본수를 곱하여 추정하는 셀별추정법이 타당한 것으로 평가할 수 있다. 이상의 분석결과를 토대로 조사설계 방안을 제시하면 다음과 같다. 직전연도 조사기업은 직전연도 연구개발비 수준과 기업종류(대기업, 벤처기업, 중소기업), 그리고 산업에 따라 셀을 분할한다. 대기업, 연구개발비 수준이 높은 기업 등 주요한 셀에 대하며는 전수조사를 실시한다. 나머지 셀에 대하여는 각 셀별 연구개발지출의 분포가 동질적이기 때문에 표본 추출 방법은 단순임의추출법(SRS)을 사용한다. 다만 전년도 미계상된(또는 미포함된) 기업에 대하여는 신규 대형 연구소 진입 등을 고려하여 규모비례확률추출법(PPS)을 고려하는 것이 바람직할 것으로 판단된다. 일부 기업들이 특정 항목에 대한 자료를 제공하지 않는 항목무응답의 경우, 누락된 자료에 대하여는 대체기법(Imputation Algorithm)에 따라 이를 추정한다. 이러한 표본조사방법은 전수조사에서 발생하는 비표본오차를 해소하고, 자료 수집비용 및 소규모기업의 행정적 부담을 경감할 수 있다는 장점이 있다. 향후 연구에서는 좀 더 구체적인 조사방법론을 강구할 필요가 있으며, 이와 함께, 연구개발에 대한 다양한 측면의 정보를 수집하기 위해 새로운 설문지를 개발할 필요성이 있다.

  • PDF