• 제목/요약/키워드: 확률 추정

검색결과 1,937건 처리시간 0.031초

대용량 학습 데이터를 갖는 태양광 발전 시스템의 확률론적 모델링 (Probabilistic Modeling of Photovoltaic Power Systems with Big Learning Data Sets)

  • 조현철;정영진
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.412-417
    • /
    • 2013
  • 태양광 발전 시스템의 해석적 모델링은 시스템의 동특성을 예측하거나 고장검출 및 진단 등과 같은 고급 공학 기술에 중요하게 적용할 수 있어 최근 많은 각광을 받고 있다. 본 논문은 대용량 학습 데이터를 갖는 태양광 발전 시스템에 대한 확률론적 모델링을 제시한다. 우선 태양광 일사량과 온도 입력 변수에 대한 태양광 시스템의 출력 전력과의 입출력 함수관계를 정의한다. 이 함수관계를 바탕으로 세 확률변수(일사량, 온도, 전력)에 대하여 조건부 확률 식으로 표현한다. 조건부 확률 분포 추정은 대용량 데이터 시스템에 적합한, 전체 표본 데이터 수 대비 관련 변수의 경우의 수에 대한 비율로 나타내었다. 추정한 확률분포를 통해 평균값 이론을 적용하여 시스템의 출력을 추정하게 된다. 본 논문에서 제안한 모델링 기법은 두 태양광 발전 단지의 사례 연구를 통해 성능을 검증하였다.

가뭄빈도해석 프로그램 개발 (Development of drought frequency analysis program)

  • 이정주;강신욱;전근일;김현식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.14-14
    • /
    • 2020
  • 일반적으로 수문빈도해석은 치수계획 수립에 이용되는 설계강수량, 계획홍수량 등을 산정하기 위해 연최대치계열 또는 연초과치계열 자료를 이용한 극치빈도해석을 수행하고, 확률분포의 우측꼬리(right tail) 부분을 이용하여 확장된 재현기간에 해당하는 확률수문량을 추정한다. 하지만 가뭄 관련 분석에서는 확률분포의 좌측꼬리(left tail) 부분은 이용해 확장된 재현기간별 확률수문량을 추정해야할 경우가 발생한다. 또한 물관리 실무에서 장 단기 운영계획 수립을 위해 이용하는 갈수빈도 유입량 산정 등에서도 평년보다 작은 수문량에 대한 빈도해석이 필요한 경우가 있다. 국가 가뭄정보분석센터에서는 기존에 K-water연구원에서 개발한 빈도해석 프로그램인 K-FAT의 분석모듈을 이용해 극소치계열 또는 갈수빈도 유입량 분석에 특화된 가뭄빈도해석 프로그램을 개발하였다. 본 프로그램은 GEV, Gumbel, Weibull 등 14개의 확률분포형을 포함하며, 모멘트법, 최우도법 및 L-모멘트법을 사용하여 매개변수를 추정한다. 적합도 검정의 경우 χ2, K-S, CVM, PPCC 및 수정 Anderson-Darling test를 이용하여 다각적인 검정을 할 수 있도록 하였다. 분석을 위한 입력 자료의 경우 사용자가 전처리를 통해 준비한 연최소치계열 등 연도별 시계열자료를 이용할 수 있으며, 일단위 및 월단위의 강수량 또는 댐 유입량 자료를 이용해 사용자가 원하는 기간의 누적강수량, 평균 유입량으로 변환할 수 있는 자료변환 기능을 추가하여 실무 활용성을 높였다. 또한 최적 확률분포 선정을 위해 참고할 수 있도록 AIC(Akaike information criteria)와 BIC(Bayesian information criteria) 분석이 포함되어 있으며, Bootstrap 기법 등을 이용한 불확실성 산정을 통해 추정 값의 신뢰구간을 표시하도록 하였다. 개발된 프로그램은 베타버전 시험배포를 거쳐 가뭄정보포털을 통해 배포할 예정이다.

  • PDF

용어간 종속성을 이용한 문서 순위 매기기에 의한 확률적 정보 검색 (A probabilistic information retrieval model by document ranking using term dependencies)

  • 유현조;이정진
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.763-782
    • /
    • 2019
  • 텍스트 문서 집합에 대한 정보검색에서는 주어진 질의에 부합하는 각 문서의 적합도 확률을 계산하고 이 확률이 높은 것부터 낮은 순으로 문서 순위를 정하여 사용자에게 제공한다, 각 문서의 적합도 확률 계산에 많이 사용되는 모형은 단어들이 확률적으로 독립이라는 가정 하에 확률을 추정한다. 이 모형은 단어들의 결합 확률을 계산하는 것이 현실적으로 어렵다는 점에서 많이 이용되고 있지만 질의에 사용되는 단어들이 대개 서로 관련성을 가지고 있다는 사실을 고려하고 있지 않다. 본 논문에서는 단어 자질들의 의존 구조를 고려하여 문서의 적합도 확률을 계산하기 위하여 단어들의 결합 패턴의 확률을 다항분포 모형으로 가정하고, 최대 엔트로피 방법으로 확률을 추정하여 문서 순위를 매기는 정보검색 모형을 제안한다. 여러 가지 다항분포 상황에서 시뮬레이션 실험을 한 결과 변수들의 독립을 가정한 모형보다 더 우수한 추정 결과를 보여 준다. 실제 LETOR OHSUMED 데이터 이용한 문서 순위 매기기 실험의 결과도 더 나은 검색 결과를 보여 준다.

시스템의 확률 값 시험을 위한 신뢰구간 비교 분석 (Comparison of confidence intervals for testing probabilities of a system)

  • 황익순
    • 한국전자통신학회논문지
    • /
    • 제5권5호
    • /
    • pp.435-443
    • /
    • 2010
  • 확률적 특성을 가지는 시스템의 시험을 위해서는 시험 입력을 일정 횟수만큼 반복하여 제공하고 관찰된 데이터를 기반으로 판정이 내려져야 한다. 구간 추정 기법을 이용하여 관찰된 데이터로부터 확률 값이 올바른지 여부를 판단할 수 있으며, 이 때 적절한 신뢰구간의 선택은 시험의 품질을 결정하는 중요한 요인이 된다. 본 논문에서는 다양한 크기의 표본에 대해 대표적인 구간 추정 기법인 Wald 신뢰구간과 Agresti-Coull 신뢰구간을 비교 분석한다. 각 신뢰구간이 확률 값 시험에 사용되었을 경우 올바른 구현 제품이 시험을 통과할 확률과 잘못된 구현제품이 시험을 통과하지 못할 확률을 기반으로 비교 분석을 수행하며, 확률 값이 올바른지를 판단하기 위한 양측검정뿐만 아니라 확률 값이 기준 확률 이상인지 여부를 판단하기 위한 단측검정을 사용하는 경우에 대해서도 비교 분석을 수행한다. 비교 분석 결과 양측검정의 경우 Agresti-Coull 신뢰구간을 사용할 것을 추천하며, 단측검정의 경우 큰 크기의 표본에 대해서는 Agresti-Coull 신뢰구간을, 적은 크기의 표본에 대해서는 Wald 신뢰구간 또는 Agresti-Coull 신뢰구간을 선택적으로 사용할 것을 추천한다.

강우자료의 확률분포함수를 이용한 강우강도식의 이론적 유도 (Theoretical Derivation of IDF curve Using Probability Distribution Function of Rainfall Data)

  • 김규태;김수영;김태순;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1503-1506
    • /
    • 2007
  • 수공구조물의 설계를 위해서 주로 사용되는 강우강도식은 연최대치 강우자료를 이용하여 빈도별 혹은 지속기간별 확률강우량을 구한 후 이 값들을 선형 혹은 비선형식의 형태로 회귀분석하여 구하게 된다. 그러나, 이와 같이 회귀분석을 이용하여 추정된 강우강도식은 원래의 강우자료가 가지고 있는 확률적인 특성을 재현한다고 하기는 어렵기 때문에, 본 연구에서는 연최대치 강우자료에 대한 적정 확률분포형으로부터 직접 강우 강도식을 유도하는 방법을 적용하여 대상지역 강우강도식의 매개변수를 산정하였다. 선정된 적정 확률분포형을 이용하여 강우강도식의 매개변수를 추정하는데 있어서, 평균제곱오차의 제곱근을 최소화하는 형태의 목적함수를 구성한 후 유전자알고리즘을 이용하여 적절한 매개변수를 산정하였다. 산정된 매개변수를 사용한 강우강도식으로 구한 결과값과 기존의 강우강도식에 의한 결과값 그리고 지점빈도해석에 의한 결과값을 비교하여 본 연구에서 산정된 강우강도식의 적용성을 평가해 보았다.

  • PDF

원자력 발전소 인간 신뢰도 분석 시스템 개발 (The Development of a HRA calculator of nuclear power plants)

  • 김승환;강대일;정원대
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.112-114
    • /
    • 2006
  • 원자력발전소의 정량적 위험성 평가를 위해서 확률론적 안정성 평가 기법이 이용되고 있는데, 이를 위해서는 여러 가지 분야의 다양한 신뢰도 데이터가 필요하다. 이러한 신뢰도 자료 중에 인간의 지각 행위 및 수행 행위로부터 발생하는 인적 오류 확률은 그 특성상 실질적이 오류 확률을 얻기가 매우 어렵다. 그래서 인적 오류 확률을 구하기 위해서는 인간 신뢰도 분석 분야의 전문가들이 제안한 인간 신뢰도 분석 방법을 이용하여 인적 오류 확률을 추정한다. 한국 원자력 연구소에서는 이를 위해 인간의 지각 및 수행 행위에서 야기되는 인간 오류 사건을 관리하고 인적 오류 확률을 추정하기 위한 인간 신뢰도 분석 시스템을 개발하고 있다. 본 연구에서는 인간 신뢰도 분석 시스템의 개발 과정에 관하여 기술하였다.

  • PDF

변수변환에 의한 수정 HORVITZ-THOMPSON 추정량 (A Modified Horvitz-Thompson Estimator by Transformation of Variables)

  • 류제복
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.27-34
    • /
    • 2004
  • Horvitz-Thompson(H-T)추정량이 확률비례추정량에 비해 효율이 떨어지는 경우가 있다 이를 극복하기 위해서 2단계 변수변환을 한다. 1단계로는 Midzuno-Sen추출을 적용하기 위해서 보조변수를 변환하고, 이로부터 얻은 포함확률을 H-T추정량에 사용할 때 분산을 줄이기 위해서 2단계로 연구변수를 변환하였다. 이러한 변환을 통해 얻은 추정량과 기존의 PPS 추정량들을 비교하였다.

확률화응답에 대한 대수선형모형

  • 최경호
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.725-734
    • /
    • 1997
  • 많은 사회과학 조사에서 분할표 형태로 얻어진 범주형 자료에는 오분류(misclassification)로 인한 오차가 내재되는 경우가 종종 있다. 질적속성 추정을 위한 확률화응답은 이러한 오분류 문제의 한 특수한 경우로 여겨지기도 한다. 그래서 확률화응답을 통한 범주형자료는 혼합된 분할표(mixed-up contingency table)로 여길 수 있는 바, 본 논문에서는 이에 대해 대수선형모형(log-linear model)을 설정하고 Chen과 Fienberg(1976)의 Iterative scaling procedure(ISP)에 의하여 얻어진 최우추정량의 극한을 이용하였다. 이 결과 Warner(1965) 형태의 대칭기법에 대해서는 Singh(1976)에 의하여 제안된 최우추정량과 같아지게 됨을 보임으로써 Warner에 의해서 제시된 추정량이 최우추정량으로 적절하지 않음을 확인해 보고, 무관질문기법에 대해서는 Greenberg, et al.(1969)에 의해서 제안된 추정량이 추정의 관점에서 최우추정량으로 적절하지 않음을 알아 보았다.

  • PDF

은닉 변수 모델을 이용한 문서 추천 (Learning Model for Recommendation of Humor Documents)

  • 이종우;장병탁
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.514-519
    • /
    • 2002
  • 우리는 유머문서의 추천을 위해서 문서 정보, 사용자 정보, 공통 등급매김 정보 등을 모두 이용하는 4 개의 관찰 변수와 이들간 관계의 학습을 위한 은닉변수를 사용한 확률모델을 구축하였다. 이 모델은 학습된 은닉 변수와 가시 변수 간의 관계를 통해 누락 관찰 데이터에 대해서도 추정값을 유도해 낼 수 있으므로 등급매김 정보가 부족하거나 새로운 사용자와 문서의 도입시에 안정적인 추천 성능을 보여 줄 수가 있다. 또한 확률 모델의 학습을 위해서 EMl 알고리즘을 이용하였는데 저평가된 데이터의 이용도를 높이기 위해서 추천을 반대하는 확률 모델을 따로 두고 이들간에 분류모델(classification model)을 두어서 추정값을 분류해내는 방식을 취한다.

  • PDF

단어 공기 확률 추정을 위한 차원 축소 모델 (Dimension-Reduced Model for Word Co-occurrence Probability Estimation)

  • 김길연;최기선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.137-142
    • /
    • 2000
  • 본 논문에서는 확률적 자연언어 처리에서 중요한 문제인 자료 희귀(data sparseness)의 어려움을 해결하는 새로운 방법으로 차원 축소 모델을 제시한다. 세 가지의 세부 방법이 제안되었으며 Katz의 back-off 방법의 성능을 최저로 했을 때에 비해 약 60%정도의 성능이 향상되었다. 현재까지 최고의 성능을 보이고 있는 유사도 기반의 방법에 비해서도 약 5∼20%의 성능이 향상되었다. 따라서 차원 축소 모델은 확률 추정의 새로운 방법으로 쓰일 수 있다.

  • PDF