• Title/Summary/Keyword: 평균포함확률

Search Result 140, Processing Time 0.034 seconds

이상치를 감안한 확률강우분포의 매개변수 추정방법의 적용성 검토

  • Kwon, You Jeong;Seo, Yongwon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.319-319
    • /
    • 2018
  • 최근 전 세계적으로 극한수문사상의 증가로 인한 피해의 규모와 빈도가 잦아지고 있다. 기후변화에 관한 정부 간 협의체(IPCC)5차 보고서에 따르면 우리나라는 모든 시나리오 하에서 평균 강수량이 증가하는 지역으로 분류되었다. 특히 강우와 태풍피해가 잦은 7월에서 9월의 강우량이 급격히 증가하는 것으로 나타나며 이는 현재보다 극한수문사상이 더욱 빈번하게 일어날 것이라 예상할 수 있다. 하지만 기존의 매개변수 추정방법은 이상치 산정기준을 넘어서는 극치를 제외하고 확률강우량을 산정하고 있는 실정이다. 따라서 본 연구에서는 이러한 기존의 매개변수 추정방법 보다 극한값에 강건한 MDPDE(minimum density power divergence estimator)를 이용한 매개변수 추정을 사용하여 우리나라 60개 강우관측소의 과거 강우관측자료에 대한 최적조율모수에 대한 빈도별 확률강우량을 추정하여 기존의 방법으로 산정한 확률강우량과 비교하였다. 이상치로 분류할 수 있는 극한수문사상이 발생한 우리나라 31개소에 대하여 MDPDE의 적용성을 검토한 결과 기존의 매개변수 추정방법에 비해 이상치를 포함한 100년 빈도 확률강우량이 약13.3% 감소하는 것으로 나타났다.

  • PDF

Analysis for Flood Quantile Estimates at Ungauged Sites in Arid and Semi-arid Regions Based on Regional Frequency Analysis (지역빈도해석을 통한 건조지역의 미계측 지점 확률홍수량 추정을 위한 연구)

  • Jung, Kichul;Kang, Boosik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.51-51
    • /
    • 2017
  • 지역빈도해석은 짧은 기간의 자료를 보유하고 있는 계측 지점이나 자료가 없는 미계측 지점에서의 확률수문량을 산정하기 위하여 많이 쓰여 진다. 지역빈도해석을 실시하기 위한 조건으로는 우선 수집된 하천유역들을 대상으로 수문학적 동질 지역을 구분하는 것이 중요하다. 그리고 구분되어진 지역에 포함되는 모든 지점들의 자료를 빈도해석 함으로써 관심 지점의 신뢰할 만한 확률수문량을 산정하는 것이다. 그동안의 지역빈도해석은 주로 비건조지역을 중심으로 홍수와 같은 재난재해 대비 그리고 수자원 관리를 위한 연구들을 실시해왔다. 본 연구의 주 목적은 건조지역의 수자원 관리를 위해 건조지역 하천유역을 중심으로 지역빈도해석을 실시하여 신뢰할만한 확률수문량을 산정하는 것이다. 확률수문량 산정값의 정확도를 향상시키기 위해 지역빈도해석 모델에 쓰여 지는 새로운 지형학적 변수들을 제공하였고 수문학적 동질 지역을 구분 위해 수집된 각 하천유역의 형상들을 확인하여 동질 지역을 정의하였다. 예를 들면, 수지형 유역, 부채형 유역, 격자형 유역과 같은 다른 형상들을 구분하여 각 유역 형상 종류별로 동질 지역을 만들었다. 건조지역의 지역빈도해석을 위해 미국 건조지역의 105개 하천유역 유량자료들을 수집 및 이용하였다. 확률수문량 산정을 위하여 앙상블 인경신경망 (Ensemble Artificial Neural Network)과 정준 상관 계수(Canonical Correlation Analysis)를 이용한 지역빈도해석 모델을 만들었다. 제안된 모델의 수행평가와 정확성 평가를 위해 리샘플링 기법인 10-겹 교차 검증 (10-fold cross-validation), 잭나이프 (Jackknife) 기법들을 이용하였고 모델로부터 산정된 확률수문량값을 편향 (Bias), 상대 편향(rBias), 평균 제곱근 오차 (RMSE), 상대 평균 제곱근 오차 (rRMSE)를 통하여 산정 값과 실제 관측 값의 차이를 분석하였다. 그 결과 건조지역의 지역빈도해석을 위해 새롭게 제시된 지형학적 변수들을 사용하였을 때 모델의 수행능력이 향상되었음을 확인하였다. 또한 하천유역 형상에 따라 동질 지역을 구분하였을 때 향상된 확률수문량이 산정되었다. 향상된 지역빈도해석 모델을 통해 건조지역의 신뢰할만한 확률수문량을 산정함으로써 건조지역의 효과적인 수자원 관리를 위한 수공시설물 설계에 중요한 정보들을 제공할 것이다.

  • PDF

주가시계열에 대한 확률미분방정식(確率微分方程式)의 모수(母數) 추정(推定)과 자본시장의 운동법칙(運動法則)

  • Lee, Il-Gyun
    • The Korean Journal of Financial Management
    • /
    • v.15 no.2
    • /
    • pp.279-337
    • /
    • 1998
  • 이 논문에서는 주가가 확률과정, 즉 확률미분방정식에 의하여 생성되는가를 검정하고 주가의 운동법칙을 규명한다. 일별종합주가지수가 양수의 완전시계열상관을 갖고 있으며, 더욱이 3년 정도의 시차까지 의미있는 시계열상관을 갖고 있음이 발견되었다. 수익률과 가격변화의 시계열상관도 존재하고 시계열은 정상성(定常性)을 갖고 있다. 마팅게일에 의하여 주가가 생성되고있지 않음이 밝혀졌다. 한국증권거래소에서 계산하고 있는 일별 종합주가지수를 포함한 41개 산업별 지수를 사용하여 자본시장의 운동법칙을 규명하기 위하여 가장 많이 이용하고 있는 세개의 확률미분방정식을 검정하였다. 각 주가지수들이 온스타인 울렌벡 브라운 운동과정과 평균회귀과정을 따르지 않고 있다는 것이 발견되었다. 그러나 주가가 편류를 갖는 일반 기하 브라운 운동과정에 의하여 생성되고 있음이 검정을 통하여 확인되었다. 평균회귀과정에 의하여 주가가 생성되지 않는다는 발견은 의외라 할 수 있다. 주가가 온스타인 울렌벡 과정을 따르지 않는다는 것은 주가가 제 1계 정상적 자기회귀과정이 아니라는 것을 의미한다. 일별종합주가지수는 제 4계 자기회귀과정에 의하여 생성된다. 가격변화와 수익률의 생성함수는 제 4계 자기회귀과정이다. 종합주가지수의 제 1계 시계열상관계수는 1이다. 상당히 큰 시차를 갖을 때까지 시계열상관이 대략적으로 1을 유지하고 있다. 따라서 지수가 마팅게일을 따르고 있지 않다. 이 점은 가격변화와 수익률에 있어서도 유사하다. 가격변화, 수익률, 대수수익률의 제 1계 시계열상관이 0.1로 유의적이다. 따라서 수익도 마팅게일 과정을 따르고 있지 않다. 증권가격은 세 번에 걸쳐 구조의 번화가 발생하였다. 구조의 변화가 발생할 때마다 평균가격이 상승하였다. 이와 같은 현상은 장기적 기대가격이 미지일 가능성이 배제되지 않는다. 단기적 기대 주가가 알려진 반면 장기적 기대 주가가 미지라면 평균회귀과정은 장기적 기대주가로 회귀하고 있는 과정이므로 장기기대 주가의 미지성이 평균회귀 과정의 기각을 유도하게 된다. 우리나라의 투자자들은 무위험자산과 위험을 동시에 고려하여 투자활동을 전개하고 있음이 발견되었다. 선형의 효용함수를 갖는 위험중립적 태도의 투자자가 아니다. 위험기피형 효용함수 아래에서 투자활동을 수행하고 있는 합리적 투자자들이라 할 수 있다. 뿐 만 아니라 자신의 평생에 걸친 소비를 소비가 이루어지는 각 기마다 가급적 일정하게 하는 소비행동을 목표로 삼고 소비와 투자에 대한 의사결정을 내리고 있음이 실증분석을 통하여 밝혀졌다. 투자자들은 무위험 자산과 위험성 자산을 동시에 고려하여 포트폴리오를 구성하는 투자활동을 행동에 옮기고 있다.

  • PDF

Prediction of spring precipitation in the Geum River basin using global climate indices and artificial neural network model (글로벌 기후지수와 인공신경망모형을 이용한 금강권역의 봄철 강수량 예측)

  • Chul-Gyum Kim;Jeongwoo Lee;Hyeonjun Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.292-292
    • /
    • 2023
  • 본 연구에서는 인공신경망을 이용한 통계적 모형을 구성하여 금강권역의 봄철(3~5월) 강수량 예측을 수행하였다. 통계적 모형의 예측인자로서는 NOAA 등에서 제공하는 AAO, AMM, AO 등 36종의 기후지수와 대상권역인 금강권역의 강수량, 기온 등의 기상인자 8종 등 총 44종의 기후지수를 활용하였다. 예측대상기간을 기준으로 선행기간(1~18개월)에 따른 상관성을 분석하여 상관도가 높은 10개의 기후지수를 예측인자로 선정하였다. 예측모형 형태는 10개의 입력층과 1개의 은닉층으로 되어 있는 인공신경망모형을 구성하였다. 모형 구성과정에서의 불확실성을 최소화하고 예측모형의 적합도를 높이기 위해 예측대상기간을 기준으로 과거 40년간의 자료에 대해 임의로 20년간 자료를 선별하여 모형을 구성하고, 너머지 기간에 대해 검증하는 무작위 교차검증을 반복하여, 예측대상기간 및 예측시점에 따라 각각 적합도가 높은 1000개의 예측모형을 선별하였다. 과거기간(1991~2022년)을 대상으로 예측시점에 따라 각 연도별 1000개의 예측결과를 도출하여, 실제 해당년도의 관측값과의 비교를 통해 예측성을 분석하였다. 예측성은 크게 예측치의 최대값과 최소값 범위 및 예측치의 25%~75% 범위 안에 관측치가 포함될 확률, 그리고 과거 관측값의 3분위 구간을 기준으로 한 예측확률 등을 평가하였다. 관측치가 예측치의 범위 안에 포함될 확률은 평균 87.5%, 예측치의 25~75% 범위 안에 포함될 확률은 30.2%로 나타났으며, 3분위 예측확률은 35.6%로 분석되었다. 관측값과의 일대일 비교는 정확도가 떨어지지만 3분위 예측확률이 33.3% 이상인 점으로 볼 때 예측성은 확보된다고 볼 수 있다. 다만, 우리나라 강수량의 불규칙성과 통계적 모형 특성상 과거 관측되지 않은 패턴에 대해서는 예측이 어려운 문제가 있어, 특정년도의 예측결과가 관측치를 크게 벗어나는 경우도 종종 나타나고 있다.

  • PDF

Approximate Variance of Least Square Estimators for Regression Coefficient under Inclusion Probability Proportional to Size Sampling (포함확률비례추출에서 회귀계수 최소제곱추정량의 근사분산)

  • Kim, Kyu-Seong
    • Communications for Statistical Applications and Methods
    • /
    • v.19 no.1
    • /
    • pp.23-32
    • /
    • 2012
  • This paper deals with the bias and variance of regression coefficient estimators in a finite population. We derive approximate formulas for the bias, variance and mean square error of two estimators when we select a fixed-size inclusion probability proportional to the size sample and then estimate regression coefficients by the ordinary least square estimator as well as the weighted least square estimator based on the selected sample data. Necessary and sufficient conditions for the comparison of the two estimators in terms of variance and mean square error are suggested. In addition, a simple example is introduced to numerically compare the variance and mean square error of the two estimators.

Korean Noun Phrase Identification using Maximum Entropy Method (최대 엔트로피 모델을 이용한 한국어 명사구 추출)

  • Kang, In-Ho;Jeon, Su-Young;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.127-132
    • /
    • 2000
  • 본 논문에서는 격조사의 구문적인 특성을 이용하여, 수식어까지 포함한 명사구 추출 방법을 연구한다. 명사구 판정을 위해 연속적인 형태소열을 문맥정보로 사용하던 기존의 방법과 달리, 명사구의 처음과 끝 그리고 명사구 주변의 형태소를 이용하여 명사구의 수식 부분과 중심 명사를 문맥정보로 사용한다. 다양한 형태의 문맥정보들은 최대 엔트로피 원리(Maximum Entropy Principle)에 의해 하나의 확률 분포로 결합된다. 본 논문에서 제안하는 명사구 추출 방법은 먼저 구문 트리 태깅된 코퍼스에서 품사열로 표현되는 명사구 문법 규칙을 얻어낸다. 이렇게 얻어낸 명사구 규칙을 이용하여 격조사와 인접한 명사구 후보들을 추출한다. 추출된 각 명사구 후보는 학습 코퍼스에서 얻어낸 확률 분포에 기반하여 명사구로 해서될 확률값을 부여받는다. 이 중 제일 확률값이 높은 것을 선택하는 형태로 각 격조사와 관계있는 명사구를 추출한다. 본 연구에서 제시하는 모델로 실험을 한 결과 평균 4.5개의 구를 포함하는 명사구를 추출할 수 있었다.

  • PDF

Measuring Reliability of POS Tagging Systems (품사 태깅 시스템의 신뢰도 측정)

  • Kim, Jae-Hun
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.365-372
    • /
    • 2001
  • 본 논문에서는 품사 태깅 시스템에서 신뢰도 측정 방법에 대해서 기술한다. 품사 태깅 시스템의 신뢰도는 품사 태깅 결과에 오류가 포함되지 않을 확률이다. 일반적으로 신뢰도 측정은 오류확률에 기반한다. 정확한 오류확률을 추정하기 위해서는 일반적으로 품사 태깅 시스템에서 사용되는 말뭉치보다 훨씬 더 많은 양의 말뭉치가 필요하다. 이 문제를 다소 완화시키기 위해서, 본 논문에서는 좀더 정확한 오류확률 추정하기 위해 교차확인 방법을 이용한다. 본 논문에서 사용된 품사 태깅 시스템은 시험말뭉치에 대해서 61%의 신뢰도를 보였다. 이는 한국어 문장의 형태소 수가 평균 20개이고, 품사 태깅 시스템의 정확률이 97.5%일 때의 신뢰도에 해당한다. 본 논문에서 사용된 품사 태깅 시스템이 미등록어가 없을 경우에 97.68%의 정확률을 보이므로 제안된 신뢰도 측정 방법이 어느 정도 타당함을 알 수 있었다. 제안된 신뢰도 측정 방법은 구문분석, 정보검색 등 여러 분야에 응용이 가능할 것이며, 본 논문에서는 품사태깅의 오류검출에 적용해보았다.

  • PDF

The Weighted Polya Posterior Confidence Interval For the Difference Between Two Independent Proportions (독립표본에서 두 모비율의 차이에 대한 가중 POLYA 사후분포 신뢰구간)

  • Lee Seung-Chun
    • The Korean Journal of Applied Statistics
    • /
    • v.19 no.1
    • /
    • pp.171-181
    • /
    • 2006
  • The Wald confidence interval has been considered as a standard method for the difference of proportions. However, the erratic behavior of the coverage probability of the Wald confidence interval is recognized in various literatures. Various alternatives have been proposed. Among them, Agresti-Caffo confidence interval has gained the reputation because of its simplicity and fairly good performance in terms of coverage probability. It is known however, that the Agresti-Caffo confidence interval is conservative. In this note, a confidence interval is developed using the weighted Polya posterior which was employed to obtain a confidence interval for the binomial proportion in Lee(2005). The resulting confidence interval is simple and effective in various respects such as the closeness of the average coverage probability to the nominal confidence level, the average expected length and the mean absolute error of the coverage probability. Practically it can be used for the interval estimation of the difference of proportions for any sample sizes and parameter values.

Content Adaptive Signature Generation Method for Acceptable Image Manipulation (허용 가능한 이미지 조작에 대한 내용 적응 시그너쳐 생성 기법)

  • 안세정;정성환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.255-258
    • /
    • 2003
  • 본 논문에서는 JPEG 압축 이외의 블러링(blumng) 및 샤프닝(sharpening) 등의 허용 가능한 이미지 조작에도 정보가 유지될 수 있는 내용 적응(content adaptive) 서명(signature) 기법을 제안하였다. 제안한 방법은 블록의 이미지 내용의 특성을 사용하여, 기존의 이미지 블록 사이의 DCT 계수 차이가 유지되는 DCT를 기반으로 한 Chang의 서명 방법의 단점을 개선하였다. 즉, 허용 가능한 이미지 조작에 대하여 에러 발생 확률이 높은 블록을 피하여 서명을 생성하였다 Lenna를 포함한 여러 표준 영상을 사용하여 실험한 결과, 제안한 랑법은 Chang의 방법에서 발생하는 서명의 비트 스트림 에러보다 에러 발생 빈도가 블러링 이미지에서는 평균 약 55%, 사프닝 이미지에서는 평균 약 51% 더 낮았다.

  • PDF

A Study on Methods of Speacker Adaptation for Speech Recognition (음성인식을 위한 화자적응화 기법에 관한 연구)

  • 이종연
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.309.2-314
    • /
    • 1998
  • 본 연구에서는 음성인식을 위한 화자적응화 기법에 대해 연구하였다. 첫째로 적응화에 포함되지 않은 카테고리 음절에 대해 적응화 효과를 줄 수 있는 보간적응화 방법에 대해 연구하였다. 표준모델과 소량의 음성 데이터만으로 적응화가 가능한 MAPE(최대사후확률추정)으로 적응화한 모델의 평균벡터 변화정도를 적응화 발화에 포함되지 않은 모델에 보간적응하는 방법이다. 둘째로 음절단위 모델을 구축한 후 적응화 하고자 하는 화자의 데이터를 연결학습법과 Viterbi 알고리즘으로 음절단위의 추출을 자동화 한 후 MAPE으로 적응화하는 방법에 대해 각각 실험을 하였다.

  • PDF