• 제목/요약/키워드: 제곱근 평균 오차

검색결과 357건 처리시간 0.024초

시군구 실업자 총계 추정을 위한 설계기반 간접추정법 (Design-Based Small Area Estimation for the Korean Economically Active Population Survey)

  • 정연수;이계오;이우일
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.1-14
    • /
    • 2003
  • 본 연구에서는 현행 경제활동인구조사 체계에 근거하여 대영역 내의 시군구 단위 행정자치구역들에 대한 실업통계들을 생산할 수 있는 소지역 추정법이 제안된다. 고려된 소지역 추정량들은 합성 추정량, 복합추정량과 같은 설계기반 간접 추정량들이며 이러한 추정량들에 대한 평균제곱오차 추정식이 경제활동인구조사 체계 하에서 산정되어 시군구 단위 소지역 추정값들에 대한 정확도의 측도로써 활용된다. 2000년 12월 충북지역의 경제활동인구조사 자료로부터 이 지역 내의 10개 시군구 단위 행정자치구역들에 대한 실업자 총계 및 잭나이프 평균제곱오차가 본 연구에서 제시된 추정절차에 의해 추정된다. 시군구 단위 실업자 총계 추정값들의 신뢰성은 이들 추정값들의 상대편향(Relative Bias)과 상대오차제곱근(Relative Root Mean Square Error)에 의해 평가된다. 현행 한국 경제활동인구조사체계 하에서 복합추정량이 다른 추정량들에 비해 매우 안정적임을 밝힌다.

제주 감귤 과수원에서의 이슬지속시간 예측 모델 평가 (Evaluating the prediction models of leaf wetness duration for citrus orchards in Jeju, South Korea)

  • 박준상;서윤암;김규랑;하종철
    • 한국농림기상학회지
    • /
    • 제20권3호
    • /
    • pp.262-276
    • /
    • 2018
  • 2016년부터 2017년까지 제주 감귤과수원 11개 지점에서 관측한 기상 및 이슬 자료를 이용하여 이슬지속시간 예측 모델을 평가하였다. 이슬지속시간 모델의 민감도와 예측 정확도 평가에는 4 가지 모델(Number of Hours of Relative Humidity, Classification And Regression Tree/Stepwise Linear Discriminant, Penman-Monteith, Deep-learning Neural Network)이 사용되었다. 모델의 민감도는 강우와 계절 변화에 따라 평가하였다. 전체 자료에서 강우일 자료를 제외하면 이슬지속시간 모델들은 평균 오차(평균제곱근오차 약 1.5 hours)가 적게 나타났다. 기계학습 모델은 겨울을 제외한 계절별 오차가 비슷한 크기(평균제곱근오차 약 3 hours)로 나타났다. 나머지 모델들은 여름에 오차(평균제곱근오차 약 9.6 hours)가 가장 크고 겨울에 가장 작은 것(평균제곱근오차 약 3.3 hours)으로 나타났다. 모델 예측 정확도 평가 방법은 통계적 오차 분석 방법과 평균 제곱 편차 회귀 분석 방법을 사용하였다. 통계오차를 통한 모델 성능은 DNN 모델이 가장 우수한 반면에 CART/SLD 모델은 예측 정확도가 가장 낮게 나타났다. 평균제곱 편차(MSD)는 모델의 선형성을 세 가지(제곱 바이어스(SB), 비균일성 기울기(NU), 상관관계 부족(LC)) 구성요소로 구분하여 분석하는 방법이다. 모델 성능이 우수할수록 SB와 LC는 감소하였고 NU는 증가하는 경향이 나타났다. MSD 분석 결과 DNN 모델이 가장 우수하였으며 다음으로 PM, NHRH, CART/SLD 순으로 나타났다. 본 연구에서 활용된 기계학습 모델은 기상 정보를 이용한 다른 농업정보 생산의 정확도 개선에 크게 기여할 것으로 판단된다.

능동 소나 위치 추정 성능 비교 및 최적 수신망 배치 (Comparison of Active Sonar Target Positioning Performance and Optimal Sensor Arrangement)

  • 박치현;홍우영;고한석;김인익
    • 한국음향학회지
    • /
    • 제22권3호
    • /
    • pp.224-232
    • /
    • 2003
  • 본 논문에서는 능동 소나의 구성 방법 및 관측 오차에 따른 위치 추정 성능에 대해서 다룬다. 능동 소나는 구성 방법에 따라서 크게 단상태 (Monostatic) 소나, 양상태 (Bistatic) 소나, 다중상태 (Multistatic) 소나로 분류될 수 있으며, 각각의 오차에 대한 특성이 서로 다르다 각 수신기가 거리 정보와 방위 정보를 얻을 수 있다는 가정하에 단상태, 양상태 소나와 다중상태 소나의 위치 추정 성능에 대해 비교해 보고 기존의 정보 융합 방법인 최소 자승법 (LS: Least square)에 가중치를 주는 가중치 최소 지승법 (WLS: Weighted least square)을 제안하였다. 또한, 제안된 방법을 이용하여 수신기의 수, 송수신기간 거리와 위치 추정 성능과의 연관성에 대하여 알아보고 효과적인 다중상태 소나 배치에 대한 연구를 수행하였다. 모의 실험결과 다중상태 소나의 위치 추정 제곱근 오차평균이 단상태 소나에 비해 약 35.98%, 양상태 소나에 비해 약 37.45% 우수한 것을 볼 수 있었으며 WLS가 LS에 비해 평균 7.4% 우수한 성능을 나타내었고 각 센서에 입력되는 정보의 분산 차가 클수록 성능 향상율이 증가하는 경향을 보였다.

한국프로야구에서 승률 추정방법들의 비교 (A comparison of formulas to predict a team's winning percentage in Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1585-1592
    • /
    • 2016
  • 한국프로야구에서 팀의 승률을 예측하는 것은 야구팬들에게중요한 관심사이다. 팀들의 승률을 1982년부터 2015년까지의 모든 한국프로야구 기록을 이용하여 야구의 피타고라스 모형과 선형회귀모형을 사용하여 추정하고 평균제곱오차의 제곱근 (root mean squared error; RMSE)을 이용하여 상대적 효율성을 비교하였다. 결론적으로 승률이 높거나 낮은 경우에는 피타고라스 모형, 승률이 50% 근방에서는 선형회귀모형이 각각 효율성이 뛰어났다. 또한 전체데이터를 사용하는 경우에는 피타고라스모형이 상대적 효율성이 좋았으며, 효율성이 비슷하면 선형회귀모형이 사용과 이해도의 측면에서 좀 더 바람직하다고 할 수 있다.

개선된 GEV 분포를 이용한 강우량 빈도분석 (Frequency Analysis of Rainfall Data Using Advanced GEV Distribution)

  • 이길성;강원구;박경신;성진영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1321-1326
    • /
    • 2009
  • 강우는 수자원 확보 측면에서 근원이 되는 요소이다. 그러므로 정확한 확률강우량 산정은 미래의 가용 수자원량을 예측하는데 있어 중요한 사항중 하나이며 무엇보다 신중한 결정이 요구된다. 또한 하천의 범람에 의한 침수를 예방하는 수공구조물 등의 설계에 있어서는 신뢰할 수 있는 확률강우량 산정이 선행되어야 한다. 본 연구에서는 최근 우리나라 극치강우확률분포로서 많은 연구가 이루어지고 있는 GEV 분포(GEV-O)를 기반으로 위치 매개변수에 시간의 함수를 고려한 개선된 GEV 분포(GEV-A)를 이용하여 서울지점에 적용함으로서 GEV-O 분포에 의한 확률강우량과 GEV-A 분포로 산정된 확률강우량을 비교 검토하였다. 먼저 임의의 난수 발생을 통해 최우도추정법과 확률가중모멘트법으로 매개변수를 추정한 GEV-O 분포와 최우도추정법으로 매개변수를 추정한 GEV-A 분포의 상대평균제곱근오차 (R-RMSE)를 계산하여 비교함으로서 GEV-A 분포의 효율성을 판단하였다. 사례연구는 1961년부터 2008년까지 서울강우관측소에서 측정된 연최대 1일 강우량으로 하였으며 $X^2$-검정, PPCC-검정으로 적합도 검정을 실시하였다. 강우빈도분석 결과 GEV-A 분포가 GEV-O 분포로 산정된 결과 보다 대체로 재현기간 200년 이상일 경우, 과다 산정되는 경향을 보였다. 추후 개선된 GEV 분포를 서울 인근 지점에 적용함으로서 지역빈도해석(Regional Frequency Analysis)을 실행하기 위한 연구가 진행되어야 할 것이다. 또한 확률홍수량 산정 등에도 개선된 GEV 분포를 이용함으로서 보다 정확하고 신뢰성 있는 확률수문량을 예측하여야 할 것이다.

  • PDF

한국프로야구에서 피타고라스 지수의 추정 (Estimation of exponent value for Pythagorean method in Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.493-499
    • /
    • 2014
  • 야구의 승률은 총득점의 제곱을 총득점의 제곱과 총실점의 제곱의 합으로 나눈 것으로 추정된다는 야구의 피타고라스 정리에 대하여 많은 연구들이 활발하게 진행되고 있다. 본 연구에서는 피타고라스 정리에 사용되는 지수에 대한 새로운 추정방법을 제안하며 평균제곱오차의 제곱근 (root mean squared error; RMSE)을 이용하여 널리 알려진 추정방법들과 상대적 효율성을 비교하였다. 사용된 데이터는 1982년부터 2013년 사이의 모든 한국프로야구 기록이며, 그 결과 제안된 방법은 기존의 방법보다 RMSE 관점에서 바람직하다고 간주된다.

빈도해석과 지역 스케일 모델을 이용한 확률강우량 추정에 대한 연구 (A Study on Estimation of Quantile using Regional Scaling Model and Frequency Analysis)

  • 정영훈;김성훈;김한빈;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.301-301
    • /
    • 2016
  • 국내의 경우 수공구조물을 설계하기 위해서는 빈도해석을 통해 설계수문량을 산정한다. 일반적으로 실무에서는 지점빈도해석을 수행하게 되는데 설계빈도보다 대부분 짧은 기간의 자료를 이용하여 산정한다. 지역빈도해석은 이러한 자료기간이 가지는 문제점을 극복하기 위하여 확률수문량의 정확도와 신뢰도를 향상시키는 기법이다. 스케일 모델은 지속기간별로 관측된 강우자료를 이용하여 재현기간에 대한 지속기간의 함수로 표현이 가능하며, 이를 통해 강우의 IDF곡선을 제시할 수 있는 수학적 모델이다. 대상지역의 강우관측소에서 관측된 강우자료가 일단위이면, 기준지속기간이 24시간이 되며, 기준지속기간에 대한 확률강우량으로부터 임의의 지속기간에 대한 확률강우량을 스케일 모델을 이용하여 추정할 수 있다. 따라서 짧은 자료를 보유한 지역이거나 미계측 지역에 대한 확률강우량을 추정을 위해 지역빈도해석과 지역 스케일 모델을 이용하여 확률강우량을 추정하여 지점빈도해석과 비교하고자 한다. 본 연구를 위해 한강유역의 강우 관측소를 이용하였으며, 군집분석 중 k-means방법을 적용하여 수문학적 동질성을 확보한 후 지역을 구분하였다. 구분된 지역은 지점 및 지역빈도해석을 수행한 후 상대평균제곱근오차(relative root mean square error, RRMSE)를 비교하여 정확도를 판단하였고, 정확도가 높은 빈도해석에 지역 스케일 모델을 적용하여 미계측 지점에 대한 임의의 시간에 대한 확률강우량을 추정하고자 한다.

  • PDF

시계열모형에 의한 전력판매량 예측 (Prediction of Electricity Sales by Time Series Modelling)

  • 손영숙
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.419-430
    • /
    • 2014
  • 전력수급의 정확한 예측은 국민들의 일상적 생활 유지, 산업활동, 그리고 국가경영을 위하여 매우 중요하다. 본 연구에서는 시계열모형화에 의해 전력판매량을 예측한다. 실제 자료분석을 통하여 입력시계열로서 냉난방도일과 개입변수로 펄스함수를 사용한 전이함수모형이 다른 시계열모형에 비해서 제곱근평균제곱오차 및 평균절대오차의 의미에서 더 우수하였다.

상태벡터 모형에 의한 서울지역의 강우예측 (Rainfall Prediction of Seoul Area by the State-Vector Model)

  • 주철
    • 물과 미래
    • /
    • 제28권5호
    • /
    • pp.219-233
    • /
    • 1995
  • 강우의 평균과 분산이 시 공간적으로 변하는 비정상 다변량 모형을 강우모형으로 선정하였다. 그리고 강우모형의 상태 및 매개변수의 추정을 위해 비정상 대변량 모형의 잔차항에 Kalman Filter 순환추정 알고리즘을 적용하여 강우예측모형 시스템을 구성하였다. 그후 반응시간이 짧은 도시지역에 설치된 T/M 강우관측소에 입력되는 매 시간(10분간격) 강우자료를 사용하여 호우개수방법에 의한 비정상(Non-stationary) 평균과 분산의 추정 그리고 호우속도 추정을 통한 정규잔차 공분산을 추정하여 다수의 지점들 및 선행시간들의 실시간 다변량 단기 강우예측 (On-line, Real-time, Multivariate Short-term, Rainfall Prediction)을 하였다. 강우예측시스템 모형에 의한 결과와 비정상 변량 모형에 의한 강우모의 결과가 잘 일치하였다. 그리고 예측정도를 측정하는 방법인 제곱 평균 제곱근 오차(RMSE)와 모형 효율성 계수(ME)를 분석한 결과, 강우 예측시간 즉 선행시간이 갈수록 제곱 평균 제곱근 오차가 커지고 모형 효율성 계수가 1로부터 점차 작아지는 것으로 보아 강우예측 정도가 떨어지는 것을 알 수 있었다. 또한 호우개수방법으로 구한 평균이 호우구조의 많은 부분을 차지하고 있음을 알 수 있었다.

  • PDF

상가권리금 현황조사를 위한 표본설계 연구 (A sample design for the survey on goodwill in retail properties)

  • 김달호;우남교;조준우
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1443-1452
    • /
    • 2016
  • 본 연구는 소상공인과 임차상인 보호정책을 지원하고, 권리금 분쟁소송 등에 참고자료로 활용할 뿐만 아니라 상가권리금 현황 파악을 위한 최초 조사를 실시하기 위한 표본설계 연구이다. 개별 임차 사업체 단위로 발생하는 권리금의 특성상 통계청의 전국사업체조사를 모집단으로 활용 하였으며, 우선적인 정보 제공이 필요한 7개 도시지역을 반영하였다. 전체 표본수는 8,000개로 하였으며, 7개 도시지역을 부차모집단으로 하고 지역별 상권별 표본수는 비례배분 하였으며, 상권내 업종은 제곱근비례배분 하였다. 목표오차를 활용하여 최종 표본수를 조정 하였으며, 표본설계가중치를 이용한 권리금 평균 추정량과 추정오차, 구간추정 공식을 유도하였으며, 이를 통해 도시별 상권별 및 업종별 통계 추정과 추정의 정도에 대한 평가를 가능하게 하였다.