• 제목/요약/키워드: 결합확률분포

검색결과 148건 처리시간 0.024초

경험적 확률분포와 만족도에 기반한 정량적 신뢰 모델 (A Quantitative Trust Model based on Empirical Outcome Distributions and Satisfaction Degree)

  • 김학준;손봉기;이승주
    • 정보처리학회논문지B
    • /
    • 제13B권7호
    • /
    • pp.633-642
    • /
    • 2006
  • 현재 인터넷 환경에서 사용자는 서로 잘 모르는 사람이나 시스템과 상호거래를 하게 되는데 이 경우 서로 다른 개체에 대한 신뢰 정보가 부족하기 때문에 상호 거래의 위험을 감수할 수밖에 없다. 따라서 이러한 불확실성과 위험을 감소시킬 수 있는 방안으로 상대 개체와 직접 경험한 신뢰정보와 추천자에 의한 명성정보를 계산하여 이를 활용하는 방법들이 대두되고 있다. 이 논문에서는 개체에 대한 신뢰를 계산하기 위해 상호거래 결과를 누적한 경험적 확률분포와 여러 가지의 평가 기준에 의한 만족도를 계산하고, 이를 다른 개체들로부터의 추천정보와 결합하여 계산하는 신뢰 모델을 제안한다. 제안한 모델에서는 개체의 신뢰도를 개체가 주어진 상황에서 만족스러운 결과를 낼 기대값으로 정의하고, 다른 개체와 상호작용이 일어날 때마다 각 평가 기준에 따른 평가결과가 얻어진다고 전제한다. 신뢰 정보가 요구될 때 우선 경험적 확률분포와 개체의 평가결과에 대한 선호도를 고려하여 각 평가 기준에 대한 만족도를 계산하고, 계산된 만족도 값들은 각 평가기준의 중요도를 반영하여 하나의 신뢰값으로 결합되며, 이때 추천 정보도 신뢰값에 함께 결합되는 모델이다. 이 논문에서는 제안한 모델을 이용해 전자상거래에 적용한 실험 결과를 보여 주고 있다.

유/무성음 구분 및 이종적 특징 파라미터 결합을 이용한 화자인식 성능 개선 (Speaker Recognition Performance Improvement by Voiced/Unvoiced Classification and Heterogeneous Feature Combination)

  • 강지훈;정상배
    • 한국정보통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1294-1301
    • /
    • 2014
  • 본 논문에서는 화자 인식의 성능을 개선하기 위해서 유성음 및 무성음에 대한 별도의 확률분포 모델링을 사용하였다. 또한, 종래의 멜-주파수 캡스트럼 계수 이외에 유성음 구간에서 추가적으로 왜도, 첨도, 하모닉 대 잡음비 등을 추출하여 활용하였다. 화자 인식을 위한 스코어는 유성음 및 무성음 확률분포 모델에서 각각 구해지는데 전수 조사방식에 의해서 최적의 스코어 결합 가중치가 결정되었다. 제안된 방식의 화자인식기의 성능은 종래의 멜-주파수 캡스트럼 계수 및 화자당 하나의 혼합 가우시안 기반 확률분포 모델링을 사용한 방식과 비교되었으며 실험 결과 제안된 방식이 가우시안 혼합의 수가 낮아질수록 더 큰 성능 향상을 얻음을 알 수 있었다.

언어 자원과 토픽 모델의 순차 매칭을 이용한 유사 문장 계산 기반의 위키피디아 한국어-영어 병렬 말뭉치 구축 (Building a Korean-English Parallel Corpus by Measuring Sentence Similarities Using Sequential Matching of Language Resources and Topic Modeling)

  • 천주룡;고영중
    • 정보과학회 논문지
    • /
    • 제42권7호
    • /
    • pp.901-909
    • /
    • 2015
  • 본 논문은 위키피디아로부터 한국어-영어 간 병렬 말뭉치를 구축하기 위한 연구이다. 이를 위해, 언어 자원과 토픽모델의 순차 매칭 기반의 유사 문장 계산 방법을 제안한다. 먼저, 언어자원의 매칭은 위키피디아 제목으로 구성된 위키 사전, 숫자, 다음 온라인 사전을 단어 매칭에 순차적으로 적용하였다. 또한, 위키피디아의 특성을 활용하기 위해 위키 사전에서 추정한 번역 확률을 단어 매칭에 추가 적용하였다. 그리고 토픽모델로부터 추출한 단어 분포를 유사도 계산에 적용함으로써 정확도를 향상시켰다. 실험에서, 선행연구의 언어자원만을 선형 결합한 유사 문장 계산은 F1-score 48.4%, 언어자원과 모든 단어 분포를 고려한 토픽모델의 결합은 51.6%의 성능을 보였으나, 본 논문에서 제안한 언어자원에 번역 확률을 추가하여 순차 매칭을 적용한 방법은 58.3%로 9.9%의 성능 향상을 얻었고, 여기에 중요한 단어 분포를 고려한 토픽모델을 적용한 방법이 59.1%로 7.5%의 성능 향상을 얻었다.

확률적 자율 학습을 위한 베이지안 모델 (Bayesian Model for Probabilistic Unsupervised Learning)

  • 최준혁;김중배;김대수;임기욱
    • 한국지능시스템학회논문지
    • /
    • 제11권9호
    • /
    • pp.849-854
    • /
    • 2001
  • Bishop이 제안한 Generative Topographic Mapping(GTM)은 Kohonen이 제안한 자율 학습 신경망인 Self Organizing Maps(SOM)의 확률 버전이다. GTM은 데이터가 생성되는 확률 분포를 잠재 변수, 혹은 은닉 변수를 사용하여 모형화한다. 이것은 SOM에서는 구현될 수 없는 GTM만의 특징이며, 이러한 특징으로 인하여 SOM의 한계들을 극복할 수 있게 된다. 본 논문에서는 이러한 GTM 모형에 베이지안 학습(Bayesian learning)을 결합하여 작은 오분류율을 가지는 분류 알고리즘인 베이지안 GTM(Bayesian GTM)을 제안한다. 이 알고리즘은 기존의 GTM의 빠른 계산 처리 능력과 데이터에 대한 확률 분포, 그리고 베이지안 추론의 정확성을 이용하여 기존의 분류 알고리즘보다 우수한 결과를 얻게 된다. 본 논문에서는 기존의 분류 알고리즘에서 많이 실험하였다. 학습 데이터를 통하여 이를 확인하였다.

  • PDF

최대 엔트로피 모델을 이용한 한국어 명사구 추출 (Korean Noun Phrase Identification using Maximum Entropy Method)

  • 강인호;전수영;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.127-132
    • /
    • 2000
  • 본 논문에서는 격조사의 구문적인 특성을 이용하여, 수식어까지 포함한 명사구 추출 방법을 연구한다. 명사구 판정을 위해 연속적인 형태소열을 문맥정보로 사용하던 기존의 방법과 달리, 명사구의 처음과 끝 그리고 명사구 주변의 형태소를 이용하여 명사구의 수식 부분과 중심 명사를 문맥정보로 사용한다. 다양한 형태의 문맥정보들은 최대 엔트로피 원리(Maximum Entropy Principle)에 의해 하나의 확률 분포로 결합된다. 본 논문에서 제안하는 명사구 추출 방법은 먼저 구문 트리 태깅된 코퍼스에서 품사열로 표현되는 명사구 문법 규칙을 얻어낸다. 이렇게 얻어낸 명사구 규칙을 이용하여 격조사와 인접한 명사구 후보들을 추출한다. 추출된 각 명사구 후보는 학습 코퍼스에서 얻어낸 확률 분포에 기반하여 명사구로 해서될 확률값을 부여받는다. 이 중 제일 확률값이 높은 것을 선택하는 형태로 각 격조사와 관계있는 명사구를 추출한다. 본 연구에서 제시하는 모델로 실험을 한 결과 평균 4.5개의 구를 포함하는 명사구를 추출할 수 있었다.

  • PDF

표준강수지수 시계열의 가뭄특성치를 이용한 가뭄 재현기간 산정 (Return Period Estimation of Droughts Using Drought Variables from Standardized Precipitation Index)

  • 곽재원;이성대;김연수;김형수
    • 한국수자원학회논문집
    • /
    • 제46권8호
    • /
    • pp.795-805
    • /
    • 2013
  • 가뭄은 중요한 자연재해의 하나로서 수자원 관리 부분에서 매우 중요한 인자이다. 본 연구에서는 대한민국의 55개 기상청 관측소를 대상으로 SPI 지수에 따른 가뭄기간과 가뭄심도를 정의하고, 코풀라 이론을 이용하여 두 가뭄변수의 결합 확률 분포를 유도하였다. 또한 이를 이용하여 가뭄의 발생양상을 고찰하고 가뭄의 재현기간으로 제시하였으며, 대한민국을 대상으로 가뭄의 공간적 분포를 분석하였다. 연구에서 도출된 가뭄의 재현기간별 SPI 지수로부터 대한민국의 충청도의 공주 및 충주 인근, 강원도의 원주, 인제, 정선, 태백 등의 지역이 상대적으로 가뭄에 취약한 것으로 도출되었다.

주전해역의 파랑의 통계적 변동 특성 (Characteristics on the Variation of Ocean Wave Statistics in the Chujeon Sea)

  • 손병규;류청로
    • 한국해양공학회지
    • /
    • 제15권3호
    • /
    • pp.20-27
    • /
    • 2001
  • After using the filtering method, wave parameters are calculated by the spectral analysis and wave by wave analysis. Extreme environments and higher wave characteristics int he Chujeon Sea are analyzed using the observed wave data. Higher wave has been intensely emphasized as an important environmental force parameter in several recent research works. The aims of this study are to summarize the distribution of extreme environment for wind waves, and to find occurrence probability of higher wave in Chujeon Sea. Ocean wave statistics varying with sea state are found to respond linearly to the spectral peakedness parameter Qp, mean run-length and Ursell number. Although the spreading of the field results is large, it may be concluded that the tendency of wave group formation depends on the spectral peakedness parameter Qp. Extreme wave is estimated to apply various model distribution functions by using the monthly maximum significant wave parameters which can be used to the design and analysis of coastal structures.

  • PDF

다중프랙탈 확률과정과 주가형성 (Multifractal Stochastic Processes and Stock Prices)

  • 이일균
    • 재무관리연구
    • /
    • 제20권2호
    • /
    • pp.95-126
    • /
    • 2003
  • 주가가 정규분포보다 꼬리가 두꺼운 확률변수인 점, 주가의 변동이 군집화를 이루고 있는 현상, 주가가 장기기억과정에 의하여 생성되고 있다는 점이 실증분석을 통하여 밝혀지고 있다. 주가를 형성시키는 이 세 요소가 하나의 모형내에 통합되지 못하고 있는 실정인데. 이 세 요소가 통합되는 확률과정이 다중프랙탈과정이다. 다중프랙탈과정은 표준브라운 운동과정과 랜덤시간 변형과정의 결합을 통하여 얻게되는 확률과정이다. 이 과정은 Ito형의 확률과정에 포함되지 않는 연속과정인 것이다. 본 논문에서는 주가시계열의 Pareto-Levy 분포성, 분포의 두꺼운 꼬리성질, 시계열상관이 쌍곡선율로 완만하고 무척 더디게 감소하여 장기에 걸쳐서 평균에 회귀하는 장기기억성, 군집화 현상, 거래시간의 통합성을 포괄하는 다중프랙탈과정의 성질을 살펴보고 이 과정이 주가를 생성시키는 과정인지 아닌지를 검정하는데 그 목적을 둔다. 다중프랙탈과정은 표준브라운 운동과 시간변형과정의 통합을 통하여 형성된 확률과정이다. 시간변형과정은 주가의 군집화 현상을 포착하는 과정이다. 표준브라운 운동은 이 운동과 시간 변형과정의 통합화 속에서 분수브라운운동의 성질이 용해되어 장기기억과정을 포착해준다. 다중프랙탈성은 관찰치들의 시간척축이 변함에 따라 발생하는 확률과정의 적률에 가해진 일련의 제약조건이라 할 수 있다. 이 모형은 마팅게일 성질을 만족하는 모형으로 변형시킬 수도 있으며 자기회귀 조건부 이분산 모형을 대체할 수 있는 모형이다. 이 모형에서는 자기상관을 가지고 있지 않은 수익률에도 적용가능하며, 따라서 시장효율성을 점검하는데에도 이용할 수 있다. 이 모형은 축척일치성이라는 성질이 존재하므로 데이터의 총량화가 무리 없이 이루어질 수 있다. 다중프랙탈은 국소축척구성성질을 가지고 있으며, 시간의 흐름에 따라 변할 수 있는 국소축척구성요소를 내포하고 있다. 자본자산의 다중프랙탈 과정을 한국종합주가지수에 적용하였는 바, 이 과정이 한국종합주가 지수의 행동 잘 설명하고 있다. 따라서 한국종합주가지수는 분포의 꼬리의 두꺼움, 자산가격의 군집화현상, 특이한 값, 장기기억을 내포하고 있다.

  • PDF

코퓰라를 이용한 강수의 패턴 분석과 강수 보험의 가격 결정 (Analyzing rainfall patterns and pricing rainfall insurance using copula)

  • 최창희;이항석;주효찬
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권3호
    • /
    • pp.603-623
    • /
    • 2013
  • 최근 들어 예측하기 힘든 기후의 변동성이 심해지고 한국의 산업이 고도화됨에 따라 날씨의 변화에 능동적으로 대처하기 위해 날씨보험이나 날씨 파생상품을 활용할 수 있으나 현재 실제로 이러한 금융상품을 이용하여 날씨위험을 관리하는 데에는 많은 어려움과 한계가 있다. 본 논문에서는 다양한 강수보험의 활성화에 필요한 강수횟수와 강수량의 확률적 모델링을 통하여 여러 가지 강수 보험을 제안하고 추정된 결합분포를 통하여 보험료를 산출하려 한다. 이를 위하여 최근 30년 동안 한국 9개 지역의 7월-9월의 월 강수량과 월 강수 횟수를 확률분포에 적합하고 두 확률변수의 상관성을 코퓰라를 이용하여 분석한다. 그리고 개별분포와 추정된 코퓰라를 이용하여 시뮬레이션을 통하여 여러 가지 강수 보험의 가격을 결정하는 방법을 제안한다.

한반도 지역에서 이동형 위성단말의 오류확률 분석 (Analysis of Error Probability of Mobile Satellite Communication System In Korea Peninsula Area)

  • 이희규
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.67-71
    • /
    • 2019
  • 본 논문은 이동형 위성단말이 운용되는 환경에서 기준이 되는 오류확률 성능을 도출한다. 위성단말이 이동을 하면 주변 장애물에 의해 shadwoingd 발생하고, BER성능을 저하시킨다. 분석을 위해 이동형 위성단말이 운용되는 환경을 모의한 Lutz모델을 활용한다. Lutz모델은 Rician분포와 Suzuki모델을 결합한 형태이다. 오류확률은 두 분포함수를 수식적 분석을 이용하여 도출한다. 한반도 수풀지역에서 측정 결과로 시뮬레이션한 결과는 Lutz모델을 이용해 근서화한 BER결과와 유사했다. 직관적으로 측정결과와 근사화한 결과는 유사하고, 수치적으로 SNR이 30dB에서 BER오차는 약 3e-4이하이다.