• 제목/요약/키워드: 근사분산

검색결과 161건 처리시간 0.022초

패널회귀모형에서 회귀계수 추정량의 설계기반 성질 (Design-based Properties of Least Square Estimators in Panel Regression Model)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제12권3호
    • /
    • pp.49-62
    • /
    • 2011
  • 본 논문에서는 패널회귀모형에서 회귀계수 추정량으로 일반최소제곱추정량과 가중최소 제곱추정량의 설계기반 성질을 고찰한다. 회귀계수의 최소제곱추정량을 선형화하여 일반최소제곱추정량의 근사편향, 근사분산, 그리고 근사평균제곱오차의 수식과, 가중최소제곱추정량의 근사분산 수식을 유도한 후, 모의실험을 통하여 두 추정량의 근사분산 및 근사평균 제곱오차의 크기를 수치적으로 비교한다. 모의실험에서는 한국복지패널 3개년 데이터를 모집단으로 간주하고, 가구소득 변수를 관심변수로 하며 가구와 가구주 관련 7개 변수를 설명변수로 하는 유한모집단 회귀계수를 고려한다. 두 추정량의 설계기반 성질을 비교하기 위하여 표본수를 50에서 1,000까지 50 간격으로 설정하여 일반최소제곱추정량의 근사편향, 근사분산 그리고 가중최소제곱추정량의 근사분산을 계산한다. 모의실험을 통하여 다음과 같은 경향을 확인하였다. 첫째, 표본의 크기가 커지면 일반최소제곱추정량의 평균제곱오차가 가중최소제곱추정량의 분산보다 커진다. 둘째, 일반최소제곱추정량의 평균제곱오차를 가중최소제곱추정량의 분산으로 나눈비(ratio)는 설명변수에 따라 크기가 다르게 나타나고, 일반최소제곱추정량의 편향이 클수록 큰 값을 보인다. 셋째, 분산만 비교하면 일반최소제곱추정량의 분산이 가중최소제곱추정량의 분산보다 대부분의 경우에 더 작게 나타난다.

  • PDF

포함확률비례추출에서 회귀계수 최소제곱추정량의 근사분산 (Approximate Variance of Least Square Estimators for Regression Coefficient under Inclusion Probability Proportional to Size Sampling)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.23-32
    • /
    • 2012
  • 본 논문은 유한모집단에서 회귀계수추정량의 근사편향과 근사분산을 다루고 있다. 유한모집단에서 고정크기 포함확률비례표본을 추출하고 이 표본에서 조사된 데이터에 기초하여 회귀계수를 일반최소제곱추정량과 가중최소제곱추정량으로 추정할 때 두 추정량의 편향, 분산 그리고 평균제곱오차의 근사식을 유도하였다. 그리고 두 추정량의 효율을 비교하기 위하여 두 추정량의 분산을 비교하는 필요충분조건을 제시하였다. 또한 수치적인 비교를 위하여 간단한 예제를 소개하였다.

독립적인 벡터 근사에 의한 분산 벡터 근사 트리의 성능 강화 (Performance Enhancement of a DVA-tree by the Independent Vector Approximation)

  • 최현화;이규철
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.151-160
    • /
    • 2012
  • 지금까지 제안된 분산 고차원 색인의 대부분은 균일한 분포를 가지는 데이터 집합에서 좋은 검색 성능을 나타내나, 편향되거나 클러스터를 이루는 데이터의 집합에서는 그 성능이 크게 감소된다. 본 논문은 강하게 클러스터를 이루거나 편향된 분포를 가지는 데이터 집합에 대한 분산 벡터 근사 트리의 k-최근접 검색 성능을 향상시키는 방법을 제안한다. 기본 아이디어는 전체 데이터를 클러스터링하는 상위 트리의 말단 노드가 담당하는 데이터 공간의 크기를 계산하고, 그 공간 상의 특징 벡터를 근사하는 데 사용되는 비트의 수를 달리하여 벡터 근사의 식별 능력을 보장하는 것이다. 즉, 고밀도 클러스터에는 더 많은 수의 비트를 할당하는 것이다. 우리는 합성 데이터와 실세계 데이터를 가지고 분산 hybrid spill-tree와 기존 분산 벡터 근사 트리와의 성능 비교 실험을 수행하였다. 실험 결과는 확장된 분산 벡터 근사 트리의 검색 성능이 균일하지 않은 분포의 데이터 집합에서 크게 향상되었음을 보인다.

일반화된 감마 신호원의 분산 불일치된 양치화 (Variance Mismatched Quantization of a Generalized Gamma Source)

  • 구기일
    • 한국통신학회논문지
    • /
    • 제25권10A호
    • /
    • pp.1566-1575
    • /
    • 2000
  • 이 논문은 일반화된 감마 신호원에 최소 평균제곱오차 왜곡을 갖도록 설계된 양자기가 다른 신호원에 사용될때 발생하는 양자기 불일치에 대한 연구로서, 양자기의 여러 불일치 가운데, 설계 신호원과 사용 신호원의 분산이 불일치된, 분산 불일치 문제를 다루었다. 주 내용은 베넷 적분식을 기반으로 하여 유도한 양자기 왜곡의 두 근사수식으로, 첫째 근사식은 양자기의 맨 바깥 경계값의 함수로 표시된 제1차 왜곡 근사식이며, 둘째 근사식은 이 맨바깥 경계값의 근사식을 사용한 제2차 왜곡 근사식이다. 일반화된 감마 신호원의 일종인 라플라스 신호원의 경우에 다양한 분산 불일치에 대해, 양자기의 실제 왜곡을 수치로 구하였으며, 이 실제 왜곡과 두 근사식을 비교하였다. 제1차 및 2차 근사식은 모두, 설계 신호원의 분산에 대한 사용 신호원의 분산 비율이 클수록, 더 작은 양자점수에서도 실제 왜곡에 근접하였으며, 또 양자점의 개수가 64 이상일 때 실제 왜곡의 2~4% 이내의 오차를 보여, 높은 정확도를 갖는 것이 관찰되었다. 이를 종합할 때, 이 논문에서 제시하는 근사식들은, 수식이라는 측면과 정확도라는 측면에서, 가치있는 것으로 평가된다.

  • PDF

윈저화를 이용한 로버스트 분산분석 (On a robust analysis of variance based on winsorization)

  • 성내경
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.119-131
    • /
    • 1995
  • 윈저화 자료에 기초한 분산분석법 개발의 일차시도로 고정효과 일원 분산분석 모형에 대한 윈저화 분산분석을 제시한다. 몬테 칼로 모의실험 기법을 사용하여 각 요인 수준마다 g-g 대칭 윈저화를 적용시켰을 때 윈저화 자료에 기초한 제곱합들의 비의 경험적 분포가 통상의 F 분포로 근사됨을 보인다. 이 근사 F 분포의 자유도는 윈저화 카이제곱 통계량의 경험적 분포가 자유도 (n-3g-1)의 통상적인 카이제곱 분포에 만족할만하게 근사되어진다는 성내경(1994)의 연구 성과를 토대로 결정된다. 여기서 n은 표본 크기, g는 한쪽 꼬리 부분에서 윈저화가 적용되는 양이다. 산출된 분산비의 경험적 분위수의 일부를 수록하였다. 이 연구는 non-adaptive 로버스트 분산분석법을 제안하는 것으로 이상점이 존재하는 분산분석 자료에 적용하면 자료 해석이 단순화되는 실용성을 위주로 한다.

  • PDF

최적으로 색분산 보상된 광통신 시스템에서 신호 왜곡에 관한 근사적 수학식 연구 (Analytic Expression of the Signal Distortion in Dispersion-Managed Optical Transmission)

  • 김성만
    • 한국전자통신학회논문지
    • /
    • 제8권8호
    • /
    • pp.1235-1240
    • /
    • 2013
  • 본 논문에서는 색분산이 최적으로 보상된 광통신 시스템에서 자기위상변조와 색분산으로 인해 열화되는 신호의 아이페널티에 대해 근사적인 수학식을 유도하였다. 이러한 분석 연구를 통해 최적으로 색분산 보상된 광통신 시스템에서 신호의 왜곡에 대한 근사식을 얻을 수 있다. 우리는 이 근사식의 효용성을 보이기 위해서 이전 연구의 시뮬레이션 결과와 근사식의 결과를 비교하는 결과를 보인다. 본 논문의 결과를 이용하면 복잡한 비선형 시뮬레이션을 통해 얻을 수 있는 광신호의 왜곡에 대해 손쉽게 그 결과를 예측할 수 있으며, 각종 시스템 파라미터가 시스템에 미치는 영향도 쉽게 파악할 수 있다.

평균 벡터의 평활함수모형에 대한 안부점근사 -스튜던트화 분산을 중심으로- (Saddlepoint Approximation to the Smooth Functions of Means Model)

  • 나종화;김주성
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.333-344
    • /
    • 2001
  • 통계적 추론에 사용되는 많은 통계량들은 평균벡터의 평활함수의 형태로 표현이 가능하다. 본 연구에서는 이들 통계량들의 분포함수에 대한 안부점근사법을 제시하였다. 이 방법은 Na(1998)에서 제시된 일반적 통계량의 분포함수에 대한 안부점근사법이 평균벡터의 평활함수모형에 특히 유용하게 사용될 수 있음을 보인 것이다. 이 근사법은 정규근사에 비해 근사의 정도가 뛰어나며, 특히 통계량의 꼬리부분의 확률에 대해서도 정확도가 그대로 유지되는 장점이 있어 정밀한 추론이 요구되는 많은 문제에 효과적으로 사용될 수 있다. 모의 실험에 사용할 평균벡터의 평활함수 모형으로는 스튜던트화 분산을 고려하였다.

  • PDF

대용량 데이터의 내용 기반 검색을 위한 분산 고차원 색인 구조 (A Distributed High Dimensional Indexing Structure for Content-based Retrieval of Large Scale Data)

  • 최현화;이미영;김영창;장재우;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권5호
    • /
    • pp.228-237
    • /
    • 2010
  • 고차원 데이터에 대한 다양한 색인 구조가 제안되어 왔음에도 불구하고, 인터넷 서비스로서 이미지 및 동영상의 내용 기반 검색을 지원하기 위해서는 고확장성 지원 및 k-최근접점 검색 성능 향상을 지원하는 새로운 고차원 데이터의 색인 구조가 절실히 요구된다. 이에 우리는 다중 컴퓨팅 노드를 바탕으로 구축되는 분산 색인 구조로 분산 벡터 근사 트리(Distributed Vector Approximation-tree)를 제안한다. 분산 벡터 근사 트리는 대용량의 고차원 데이터로부터 추출한 샘플 데이터를 바탕으로 hybrid spill-tree를 구축하고, hybrid spill-tree외 말단 노드 각각에 분산 컴퓨팅 노드를 매핑하여 VA-file용 구축하는 두 레벨의 분산 색인 구조이다. 우리는 다중 컴퓨팅 노드들 상에 구축된 분산 벡터 근사 트리를 바탕으로 병렬 k-최근접점 검색을 수행함으로써 검씩 성능을 향상시킨다. 본 논문에서는 서로 다른 분포의 데이터 집합을 바탕으로 한 성능 시험 결과를 통하여, 분산 벡터 근사 트리가 기존의 고확장성을 지원하는 색인 구조와 비교하여 검색 정확도에 대한 손실 없이 더 빠른 k-최근접점 검색을 수행함을 보인다.

Generalized Logistic 분포형의 최우도법을 이용한 확률홍수량의 근사적 분산 (Asymptotic Variance of Flood Quantiles from the Generalized Logistic Distribution using the Method of Maximum Likelihood)

  • 신홍준;허준행;김영일
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1522-1526
    • /
    • 2007
  • 최근 영국의 Institute of Hydrology에서는 Generalized logistic (GL) 분포형을 홍수빈도해석시 GEV 분포형을 대체하는 분포형으로 추천한 바 있으며, 그로 인해 GL 분포형의 사용이 증가하고 있는 추세이다. 하지만 아직 그 사용빈도에 반하여 분포형 자체의 특성, 그 중에서도 확률홍수량의 근사적 분산에 관한 연구는 거의 이루어지지 않았다. 따라서 본 연구에서는 최우도법을 이용하여 GL 분포형의 확률홍수량에 대한 근사적 분산에 관한 연구를 수행하였으며, 이를 표본 크기, 재현기간, 매개변수들의 함수로 나타내었다. 또한 확률홍수량의 근사적 분산의 적용성을 검토하기 위해 Monte Carlo 모의실험을 수행하였으며, 모의실험은 형상 매개변수$(\beta)$$\pm0.5$이면 gamma function으로 인하여 표본 크기에 관계없이 분산값이 무한대에 가까워지므로 형상매개변수의 범위는 $-0.5{\leq}{\beta}{\leq}+0.5$로 제한하였다. 모의결과 최우도법에 의해 계산된 분산식은 형상매개변수 $-0.25{\leq}{\beta}{\leq}+0.5$의 범위에서 비교적 잘 맞는 것을 확인할 수 있었으며, 기존에 알려진 대로 표본크기가 크면 클수록 정확해지는 것을 알 수 있다. 또한 표본크기가 작은 경우 형상매개변수 전 범위에서 정확도가 떨어지는 것을 확인할 수 있으며, 최우도법의 경우 표본크기가 작은 경우를 제외하고 $-0.25{\leq}{\beta}{\leq}+0.5$ 범위에서 quantile 산정시 quantile이 약간 과다추정되는 경향이 있는 것을 알 수 있으며, 이는 분산이 과다 추정되는 결과를 초래하며 이로 인해 해석해보다 약간씩 큰 값을 나타내는 것으로 판단되었다..이 극단적인 선정적인 폭력성에 탐닉하게 되는 경향이 있다. 현실은 결코 아름답지 못하고, 행복하게 살 수 없다는 것에 대한 깨달음에서 기인한다. 욕구불만의 강도가 심해질수록 폭력성은 더욱 강하게 나타나는데 개인에게서 뿐만 아니라 가족, 동료, 사회 단체나 종교, 국가간에도 집단적으로도 발생하게 된다. 사회적으로 볼 때 폭력은 용인되는 것이 아니므로 도덕적으로 절제를 하거나 상대방과 적절한 타협과 조정을 필요로 한다. 그러나 절제의 한계를 넘어선다고 생각되거나, 조정의 노력이 불가능하거나, 실패했을 때 폭력적인 행동으로 나타나게 된다. 리차즈(I.A Richards)는 분노와 공포는 일단 겉잡을 수 없는 경향이 있다고 하면서 오늘날 폭력에 대한 요구가 일상의 정서 생활에 있어, 억압을 통한, 빈곤함을 반영하고 있지 않은지 생각해봐야 할 것이라고 충고한다. 조성 가이드라인(안)을 제시하였다.EX>$\ulcorner$세종실록$\lrcorner$(世宗實錄) $\ulcorner$지리지$\lrcorner$(地理志)와의 비교를 해보면 상 중 하품의 통합 9개소가 삭제되어 있고, $\ulcorner$동국여지승람$\lrcorner$(東國與地勝覽) 에서는 자기소와 도기소의 위치가 완전히 삭제되어 있다. 이러한 현상은 첫째, 15세기 중엽 경제적 태평과 함께 백자의 수요 생산이 증가하자 군신의 변별(辨別)과 사치를 이유로 강력하게 규제하여 백자의 확대와 발전에 걸림돌이 되었다. 둘째, 동기(銅器)의 대체품으로 자기를 만들어 충당해야할 강제성 당위성 상실로 인한 자기수요 감소를 초래하였을 것으로 사료된다. 셋째, 경기도 광주에서 백자관요가 운영되었으므로 지방인 상주지역에도 더 이상 백자를 조달받을 필요가 없이, 일반 지방관아와 서민들의

  • PDF

일반적 통계량의 분포함수에 대한 안부점 근사 (Saddlepoint Approximation to the Distribution of General Statistic)

  • 나종화
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.287-302
    • /
    • 1998
  • 표본평균(sample mean)의 밀도함수(density function)와 분포함수(distribution function)에 대한 안부점 근사(saddlepoin\ulcorner approximation)는 Daniels(1954, 1987), Lugannani와 Rice(1980)등에 의하여 유도되었으며, 이 근사식들의 정확도는 대표본(large sample)의 경우는 물론 소표본(small sample)의 경우에도 매우 뛰어난 것으로 알려져 있다. 최근 Easton과 Ronchetti(1986)는 일반적 통계량(general statistics)의 밀도함수에 대한 안부점 근사법을 제안하였고, 분포함수에 대한 근사로는 밀도함수에 대한 안부점 근사식을 직접 수치적으로 적분하는 방법을 제안하였다. 본 논문에서는 일반적 통계량의 분포함수에 대한 안부점 근사법을 제안하고, 이를 표본분산(sample variance)과 스튜던트화 평균(studentizd mean)의 분포함수에 대한 근사에 적용하였다.

  • PDF