• 제목/요약/키워드: Variance and Mean Squared Error

검색결과 49건 처리시간 0.018초

패널표본조사에서 층간변동을 고려한 추정방법 (An Estimation Procedure Using Updated Stratification Sample in Panel Survery)

  • 김영원;오명신
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.461-475
    • /
    • 1998
  • 우리나라 주요기관의 표본조사에서 폭넓게 활용되고 있는 패널조사에서는 시간의 경과에 따른 모집단의 변동을 추정과정에 적절히 반영하는 것이 필요하다. 본 연구에서는 층화추출에 의한 패널조사에서 모집단에 층간변동이 발생하는 경우 이를 추정과정에 반영하지 않으면 심각한 편의가 발생한다는 사실을 밝히고, 층별 가중값을 조정하여 이런 편의를 제거할 수 있는 보정된 불편추정량들을 제시하였다. 또한 제시된 추정량에 대한 분산의 식을 유도하고 이에 대한 추정방법을 제안하였다. 아울러 모의실험을 통하여 제시한 추정량과 이에 따른 분산 추정방법이 매우 효율적이라는 사실을 보였다.

  • PDF

공공 기상데이터와 기계학습 모델을 이용한 토양수분 예측 (Prediction of Soil Moisture with Open Source Weather Data and Machine Learning Algorithms)

  • 장영빈;장익훈;최영찬
    • 한국농림기상학회지
    • /
    • 제22권1호
    • /
    • pp.1-12
    • /
    • 2020
  • 토양수분은 농업에서 필수적인 자원으로 이의 변화와 부족을 예측함으로써 관리되어왔다. 최근 현장에서의 적용 용이성과 다양한 지역에 대한 일반화 가능성이 뛰어난 통계 및 기계학습 알고리즘을 활용한 토양수분 예측 연구가 활발히 진행되고 있다. 하지만 국내에서 생성되는 데이터를 이용한 연구들은 부족한 실정이다. 이에 본 연구는 1) 국내 공공기상 데이터만으로 충분한 성능을 내는 토양수분 예측 모델을 만들 수 있는지, 2) 어떠한 기계학습 모델이 국내에서 생산되는 데이터와 토양환경에서 가장 높은 예측 성능을 보이는지, 3) 단일 기계학습 모델을 이용해 다양한 지역에 적용 가능한지를 확인해보려 한다. 본 연구에서 Support Vector Machines (SVM), Random Forest (RF), Extremely Randomized Trees (ET), Gradient Boosting Machines (GBM), and Deep Feedforward Network (DFN) 알고리즘과 종관기상관측 자료, 농업기상관측자료를 활용하여 안동, 보성, 철원, 순천 지역의 토양 수분을 예측하는 모델을 만들었다. 그 결과, GBM을 이용한 모델이 R2 : 0.96, Root Mean Squared Error(RMSE) : 1.8로 가장 낮은 예측 오차를 보였다. 또한 GBM을 사용한 모델이 가장 낮은 지역간 예측 오차 분산을 보여 가장 일반화하기에 적절한 모델로 확인되었다.

심근조영심초음파에서 심장의 움직임을 보정한 비침습적 심근관류모델의 정량적 평가

  • 이재훈;김희중;정남식;임세중;김기황
    • 한국의학물리학회:학술대회논문집
    • /
    • 한국의학물리학회 2003년도 제27회 추계학술대회
    • /
    • pp.49-49
    • /
    • 2003
  • 목적 : 심초음파는 비침습적이므로 반복적으로 정확히 심질환의 경과를 관찰하여 치료효과 및 수술시기를 정할 수 있는 검사로서 임상적으로 매우 유용하다. 실시간 심근조영심초음파에 의한 time intensity 평가는 부위별로 수행됨으로 연속적으로 위치하는 관심영역이 intensity에 있어 심장의 움직임 변화에 영향을 받는다. Time intensity 곡선의 최적의 곡선맞춤을 위해 주기적인 심장 운동 매개변수를 조합해 기존의 모델을 보정한 안정적인 측정방법을 제시한다. 방법 : 심장의 운동에 의한 특징적인 정보를 설명하기 위해 기존의 문헌에 제시된 지수 함수에 주어진 심박수로 만들어진 시간에 관한 일반적인 정형파 함수를 추가한다. C(t) = A[1 - exp($\beta$t)] + Dsine(2$\pi$ft + $\theta$) C(t): videointensity A: plateau videointensity (blood volume) $\beta$: capillary blood velocity (rate constant of rise in videointensity) t: pulsing interval (ms) D: displacement from the periodic variance of the curve (estimated motion field from the ejection point for the ratio between systole and diastole) f: heart rate $\theta$: transit time issue A $\times$ $\beta$ : myocardial blood flow 관상동맥의 관류 데이터에 대한 실험이 펄스간격에 대한 비디오 세기로 수행되었다. 그리고 이러한 결과들이 the sum of squares due to error, R square, root mean squared error로 평가되었다. 결과 : 실험결과, 주기적인 심장의 움직임과 심박출 시점으로부터의 변위를 잘 기술하고 곡선에서의 측정 점들이 예측된 심장 움직임에 따라 성공적으로 표시되었다. 뿐만 아니라 보정된 모델이 현저한 적합도의 향상을 보여주었다. 결론 : 제시된 접근방법은 각각의 측정에서 심장 운동 영역의 변화에 독립적이며 측정 시점에 의해 영향받지 않고 심근 관류의 안정적인 측정이 가능하다. 심장의 움직임에 관한 매개변수를 조합한 모델로 곡선접합을 수행함으로써 관류의 정량적 정보를 좀더 정확하게 얻을 수 있으며 임상적 이용을 가능하게 할 것으로 기대된다.

  • PDF

Development of Diameter Growth Models by Thinning Intensity of Planted Quercus glauca Thunb. Stands

  • Jung, Su Young;Lee, Kwang Soo;Kim, Hyun Soo
    • 인간식물환경학회지
    • /
    • 제24권6호
    • /
    • pp.629-638
    • /
    • 2021
  • Background and objective: This study was conducted to develop diameter growth models for thinned Quercus glauca Thunb. (QGT) stands to inform production goals for treatment and provide the information necessary for the systematic management of this stands. Methods: This study was conducted on QGT stands, of which initial thinning was completed in 2013 to develop a treatment system. To analyze the tree growth and trait response for each thinning treatment, forestry surveys were conducted in 2014 and 2021, and a one-way analysis of variance (ANOVA) was executed. In addition, non-linear least squares regression of the PROC NLIN procedure was used to develop an optimal diameter growth model. Results: Based on growth and trait analyses, the height and height-to-diameter (H/D) ratio were not different according to treatment plot (p > .05). For the diameter of basal height (DBH), the heavy thinning (HT) treatment plot was significantly larger than the control plot (p < .05). As a result of the development of diameter growth models by treatment plot, the mean squared error (MSE) of the Gompertz polymorphic equation (control: 2.2381, light thinning: 0.8478, and heavy thinning: 0.8679) was the lowest in all treatment plots, and the Shapiro-Wilk statistic was found to follow a normal distribution (p > .95), so it was selected as an equation fit for the diameter growth model. Conclusion: The findings of this study provide basic data for the systematic management of Quercus glauca Thunb. stands. It is necessary to construct permanent sample plots (PSP) that consider stand status, location conditions, and climatic environments.

영상 벡터양자화를 위한 편차분산을 이용한 거리계산법 (New Distance Measure for Vector Quantization of Image)

  • 이경환;최정현;이법기;정원식;김경규;김덕규
    • 전자공학회논문지S
    • /
    • 제36S권11호
    • /
    • pp.89-94
    • /
    • 1999
  • 벡터양자화에서 거리계산법으로 주로 평균자승오차가 사용된다. 그러나 이를 이용하면 벡터들의 평균값 사이의 거리가 전체거리를 크게 좌우한다. 영상벡터일 경우 인간시각체계로 볼 때 에지패턴의 일치가 매우 중요하다. 본 논문에서는 벡터간의 에지패턴의 일치를 가늠하는 양으로 편차분산을 이용하고, 이것을 적용한 영상벡터에 맞는 거리계산법을 제안하였다. 이를 벡터양자화 부호화에 적용한 결과 복원영상의 에지부분 열화를 줄일 수 있었으며, 코드북 설계에 적용한 결과 중복된 평탄성분의 코드벡터 생성을 줄이고 다양한 에지성분의 코드벡터들을 가진 효율적인 코드북을 얻으므로써 부호화 성능이 향상됨을 볼 수 있었다.

  • PDF

복합패널 데이터에 기초한 최소제곱 패널회귀추정량의 설계기반 성질 (Design-Based Properties of Least Square Estimators of Panel Regression Coefficients Based on Complex Panel Data)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제17권4호
    • /
    • pp.515-525
    • /
    • 2010
  • 본 논문에서는 패널회귀모형에서 회귀계수의 일반최소제곱추정량과 가중최소제곱추정량의 설계기반 성질을 살펴보았다. 복합표본이 주어진 경우에 두 추정량의 설계편향을 구하여 가중최소제곱추정량의 설계편향의 크기가 더 작음을 보였다. 또한 한국복지패널 데이터를 대상으로 모의실험을 실시하여 다음의 결과를 얻었다. 첫째, 일반최소제곱추정치의 상대편향이 가중최소제곱추정치의 상대편향보다 약 2배 정도 크게 나타났고 일반최소제곱추정치의 편향비가 더 크게 나타났다. 그리고 표본수가 증가하면 일반최소제곱 추정치의 상대편향은 완만하게 줄어든 반면 가중최소제곱추정치의 상대편향은 급속도로 줄어들었다. 둘째, 표본수가 증가하면 일반초소제곱추정치와 가중최소제곱추정치의 분산과 평균제곱오차는 모두 줄어들였다. 그러나 평균제곱오차에서 차지하는 편향제곱의 비율은 표본수가 증가할 때 일반최소제곱추정치에서는 증가하는 반면 가중최소제곱추정치에서는 감소하는 경향이 나타났다. 마지막으로 거의 모든 경우에 일반최소제곱추정치의 분산이 가중최소제곱추정치의 분산보다 작게 나타났다. 그리고 많은 경우에 일반최소제곱추정치의 평균제곱오차가 가중최소제곱추정치의 평균제곱오차보다 작게 나타났다. 그러나 표본수가 증가할수록 일반최소제곱추정치의 평균제곱오차가 가중최소제곱추정치의 평균제곱오차보다 커지는 경우가 늘어났다.

임상에서 발생할 수 있는 문제 상황에서의 성향 점수 가중치 방법에 대한 비교 모의실험 연구 (A simulation study for various propensity score weighting methods in clinical problematic situations)

  • 정시성;민은정
    • 응용통계연구
    • /
    • 제36권5호
    • /
    • pp.381-397
    • /
    • 2023
  • 대부분의 임상시험에서 가장 대표적으로 사용되는 실험설계는 무작위화로, 치료 효과를 정확하게 추정하기 위해 이용된다. 그러나 무작위화가 이루어지지 않은 관찰연구의 경우 치료군과 대조군의 비교로 얻는 치료효과에는 환자 간의 특성 등 여러 조정되지 않은 차이로 인해 편향이 발생한다. 성향 점수 가중치는 이러한 문제점을 해결하기 위해 널리쓰이는 방법으로 치료 효과를 추정하는데에 있어 교란요인을 조정하여 편향을 최소화하도록 하는 방법이다. 성향 점수를 이용한 가중치 방법 중 가장 널리 알려진 역확률 가중치는 관찰된 공변량이 주어졌을 때 특정 치료에 할당될 조건부 확률의 역에 비례하는 가중치를 할당한다. 그러나 이 방법은 극단적인 성향 점수에 의해 종종 방해 받아 편향된 추정치와 과도한 분산을 초래한다는 점이 알려져있어 이러한 문제를 완화하기 위해 절사 역확률 가중치, 중복 가중치, 일치 가중치를 포함한 여러 가지 대안 방법이 제안되었다. 본 논문에서는 제한된 중복, 잘못 지정된 성향 점수 모델 및 예측과 반대되는 치료 등 다양한 문제상황에서 여러 성향 점수 가중치 방법의 성능을 비교하는 시뮬레이션 비교연구를 수행하였다. 비교연구의 결과 중복 가중치와 일치 가중치는 편향, 제곱근평균제곱오차 및 포함 확률 측면에서 역확률 가중치와 절사역확률 가중치에 비에 우월한 성능을 보임을 확인하였다.

주성분분석을 이용한 토끼 망막 신경절세포의 활동전위 파형 분류 (PCA­based Waveform Classification of Rabbit Retinal Ganglion Cell Activity)

  • 진계환;조현숙;이태수;구용숙
    • 한국의학물리학회지:의학물리
    • /
    • 제14권4호
    • /
    • pp.211-217
    • /
    • 2003
  • 주성분분석은 잘 알려진 데이터 분석 방법으로써 높은 차원의 데이터를 낮은 차원의 데이터로 표현하는데 효과적이어서 얼굴인식, 데이터 압축 등에 이용되고 있다. 주성분분석을 하게 되면 원 데이터의 공분산 행렬로부터 정규직교한 고유벡터와 해당하는 고유치를 얻게 되고 그 중 큰 값을 가지는 고유벡터 들을 선택하여 선형 변환함으로써 데이터의 차원을 줄일 수 있게 된다. 망막에 빛 자극이 인가되면 시세포 층에서 전기신호로 변환된 후 복잡한 신경회로를 거쳐 최종적으로 신경절세포 층에서 활동전위의 형태로 출력되게 된다. 본 연구에서는 다채널전극을 사용하여 여러 개 망막 신경절세포로부터 유래되는 활동전위를 기록한 후 개개의 신호를 구분하는 과정을 거치고, 이어서 그 신호를 만들어 내는 각 뉴론들끼리의 시간적, 공간적 흥분발사 패턴을 이해함으로써 궁극적으로 시각정보 인코딩 기전을 밝히려는 연구 목표하에 그 첫 단계로서 망막 신경절세포의 활동전위를 기록한 후 분류하는 과정을 성공적으로 수행하였기에 그 내용을 서술하고자 한다. 망막에서 기록되는 신경절세포 활동전위는 불규칙하고 확률적이기 때문에 주성분분석을 통하여 그 유형을 분류할 수 있었다. 토끼 눈으로부터 망막을 박리하여 망막조각을 얻은 후 신경절세포 층이 전극표면을 향하도록 전극에 부착하였다. 8${\times}$8의 microelectrode array (MEA)를 전극으로 사용하였고, 증폭기는 MEA 60 system을 사용하여 신경절세포 활동전위를 기록하였다. 활동전위 기록 후 파형 분류를 하였다. 잡음이 섞여있는 기록으로부터 신호를 검출하기 위하여, 잡음역치($\pm$3$\sigma$)를 설정하였다. 역치를 넘는 파형 만을 획득한 후 주성분분석을 통해 각 파형의 첫 번째 주성분, 두 번째 주성분을 계산하여 2차원 평면에 투사함으로써 몇 개의 의미있는 클러스터를 얻었다. 이 클러스터는 곧 각 신경절세포에서 유래되는 파형을 반영하므로 주성분분석을 통하여 망막 신경절세포의 활동전위를 각 세포별로 분류할 수 있음을 확인하였다.

  • PDF

산악기상자료와 목재평형함수율에 기반한 산림연료습도 추정식 개발 (Modeling and mapping fuel moisture content using equilibrium moisture content computed from weather data of the automatic mountain meteorology observation system (AMOS))

  • 이훈택;원명수;윤석희;장근창
    • 한국지리정보학회지
    • /
    • 제22권3호
    • /
    • pp.21-36
    • /
    • 2019
  • 본 연구는 산불 위험 예측의 주요 인자인 10시간 사연료습도(10-h FMC)를 산악기상관측망 기상자료로 추정하는 방법을 마련하기 위해 수행되었다. 안성(도심지)과 홍릉 두 지점(숲 속, 숲 밖)의 자동기상관측소에서 기상인자와 10-h FMC를 측정하고 이를 이용해 10-h FMC 추정식을 도출했다. 도출한 추정식을 이용해 지난 6년간(2013~2018년) 산불발생 다발일의 10-h FMC를 분석하고 전국 10-h FMC 지도를 제작했다. 기상인자(기온, 풍속, 목재평형함수율, 강우량)와 10-h FMC의 회귀분석 결과 목재평형함수율이 가장 효율적으로 10-h FMC를 설명했음을 확인했다. 목재평형함수율을 이용해 도출한 10-h FMC 추정식은 모형 적합과 검증과정 모두에서 높은 적합도를 보였다. 각 연구지의 추정식을 서로 다른 연구지에 적용하면 모형의 적합도가 같은 연구지에서 만든 식을 적용했을 때보다 줄어들었지만 여전히 만족할 만한 결과를 보였다. 본 연구의 회귀식은 10-h FMC와 목재평형함수율 사이 강우 후 건조반응 차이와 식생 유무가 10-h FMC에 미치는 영향을 반영하지 못해 적합도가 줄어든 것으로 나타났다. 마지막으로 도출한 추정식을 사용한 공간분석을 통해 지난 6년간 산불발생 다발일의 산불 중 70% 이상이 10.5% 이하의 10-h FMC 조건에서 발생했음을 확인했다. 본 연구 결과는 산악기상관측망과 연계하여 전국 산지의 10-h FMC를 추정하는 데 사용할 수 있다. 10-h FMC는 산불 위험 예측 기초 연구 자료로 활용되어 재해 관련 국가 정책 결정에 기여할 것으로 판단된다.