• 제목/요약/키워드: 등확률

검색결과 2,373건 처리시간 0.032초

의견 문서의 단어 통계 분석을 통한 의견 검색 특성에 관한 연구 (A Study on the Characteristics of Opinion Retrieval Using Term Statistical Analysis in Opinion Documents)

  • 한경수
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.21-29
    • /
    • 2010
  • 문서에 표출된 사용자의 의견을 검색하는 의견 검색의 성능이 일반 사실을 검색하는 기존 주제 검색의 성능을 크게 향상시키지 못하고 있다. 이에 본 연구는 블로그를 대상으로 의견 문서와 비의견 문서의 단어 통계를 비교 분석함으로써 의견 검색에 활용할 수 있는 통계적 특성을 파악하고자 한다. TREC의 블로그 트랙에서 사용했던 Blogs06 컬렉션과 150개의 TREC 토픽을 실험 데이터로 사용하였다. JS divergence를 이용하여 의견 문서에서의 단어 확률 분포 간의 상이성을 비교 분석하였으며, TREC 토픽의 유형 및 주제 영역별로 의견 문서를 구분하여 확률 분포의 차이점을 살펴보았고, 의견 단어별 확률을 비교 분석하였다. 실험을 통해 토픽별 특성을 고려한 의견 탐지 방법의 필요성, 토픽별 긍/부정 의견 단어 추출의 효과성, 유형과 주제 영역의 상호 보완적인 특징, 긍정 의견 단어 사용의 유의점 등을 알아내었다.

확률적 기법을 통한 직접부하제어의 제어지원금 산정 (Determination of Incentive Level of Direct Load Control using Probabilistic Technique with Variance Reduction Technique)

  • 정윤원;박종배;신중린
    • 에너지공학
    • /
    • 제14권1호
    • /
    • pp.46-53
    • /
    • 2005
  • 본 논문은 확률적 기법을 적용하여 직접부하제어의 적정한 지원금을 산정하는 새로운 방법론을 제안한다. 직접부하제어의 경제성 분석은 발전기의 고장정지 특성, 직접부하제어 자원의 차단용량 및 차단시간 등을 모두 고려해야 하기 때문에 현실적으로 불가능한 것으로 인식되었다. 따라서 기존의 연구에서는 시나리오 접근법을 사용하여 직접부하제어의 경제성 평가를 수행하였다. 본 논문에서는 몬테카를로 시뮬레이션을 적용하여 직접부하제어의 제어전력량을 확률적으로 추정하고 이를 기반으로 직접부하제어의 지원금을 산정하는 새로운 접근법을 개발하였다. 또한 시뮬레이션의 효율을 향상시키기 위하여 분산감소 기법을 적용하였다. 본 논문에서 제안한 방법론의 유용성을 보이기 위해 IEEE 24-모선 신뢰도 계통에 적용하여 사례연구를 수행하였다.

확률경로 기반의 교통류 분석 방법론 (A new approach on Traffic Flow model using Random Trajectory Theory)

  • PARK, Young Wook
    • 대한교통학회지
    • /
    • 제20권5호
    • /
    • pp.67-79
    • /
    • 2002
  • 교통량, 교통밀도, 교통류 속도 등, 교통류 변수에 대한 현재까지의 불확실한 정의와 연속적 파동방정식의 거시적 교통류 해석상의 문제점을 지적하고 이를 개선하기 위해 교통류 변수들에 대한 새로운 확률적 정의를 제시하고 이들의 성격을 규명하였다. 이러한 새로운 교통류 변수들에 대한 새로운 정의를 바탕으로 미시적 운전자 행동을 세밀하게 수용할 수 있고 많은 교통환경에서 연속적 파동 방정식을 대체하여 교통류 변수들과 통행시간을 예측할 수 있는 미분방정식 체계를 확률 미분방적식을 이용하여 도출하였다. 도출된 미분 방정식을 단일 차량의 시공 괘적에 적용해 보았다.

층화확률화 응답기법에 대한 동적 최적배분 (An Dynamic Optimal Allocation for the Stratified Randomized Response Technique)

  • 손창균;홍기학;이기성
    • Communications for Statistical Applications and Methods
    • /
    • 제16권4호
    • /
    • pp.595-603
    • /
    • 2009
  • 통상적으로 표준적인 최적배분은 층별 조사비용을 고려하여 표본을 배분한다. 만일 조사단위당 비용이 서로 다를 경우 보다 현실적인 배분방법을 고려할 필요가 있다. 즉, 개별 조사단위의 특성에 따라 이익비용비를 최대로 하는 단위를 먼저 표본으로 고려하는 동적배분을 고려하였다. 이러한 관점에서 층별 표본수를 배분하고, 배분된 표본규모에 따라 임의로 표본을 선정하는 방식인 표준적인 최적배분과는 차이가 있다. 이 논문은 약물오용, 낙태, 알콜중독 등과 같은 민감한 특성을 조사하는 층화확률화 응답기법에 대해 각 층별로 표본을 배분할 경우 최적 동적배분을 고려하여 보다 현실적인 문제를 해결하고자 하였으며, 수치적 예제를 통해 동적배분 방법의 효과성을 증명하였다.

무선 센서 네트워크 환경에서 센싱 반경 조절을 이용한 위치 측정 기법 (A Positioning Scheme Using Sensing Range Control in Wireless Sensor Networks)

  • 박혁;황동교;박준호;성동욱;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제13권2호
    • /
    • pp.52-61
    • /
    • 2013
  • 무선 센서 네트워크에서 재난, 환경 모니터링 등에 대한 응용으로써 센서 노드의 지리학적 위치 측정은 매우 중요하다. 이를 위해 무선 센서 네트워크 분야는 Range-free 위치 측정 기법에 대한 연구가 활발하게 진행 중이며, 비 균일 네트워크 환경에서 위치 정확도를 향상하기 위한 중심 극한 정리와 정규 분포에 근거한 위치 측정 기법인 밀집 확률 기법이 제안되었다. 밀집 확률 기법의 경우 노드 통신을 통해 거리를 추정 후 최종 위치를 측정하지만 거리 추정 시 주위 인근 모든 노드가 동일한 1-홉 추정 거리를 갖는 문제점이 발생한다. 따라서 본 논문에서는 이러한 오차를 최소화하기 위해 각 노드마다 거리 추정 후 센싱 반경을 조절하여 2차 지역 거리 평가를 통해 센서의 위치를 측정하는 기법을 제안한다. 성능평가 결과, 제안하는 기법은 밀집 확률 기법에 비해 9% 더 높은 정확도를 보였다. 또한 대표적인 Range-free 위치 측정 기법인 DV-HOP에 비해 48% 더 우수한 위치 정확도를 보였다.

본선 작업물량의 변동을 고려한 컨테이너 터미널의 장치공간 소요량 추정 (Estimating the storage space requirement of a container terminal considering the variance of a containership's load size)

  • 배종욱;박병인
    • 한국항해항만학회지
    • /
    • 제31권5호
    • /
    • pp.361-368
    • /
    • 2007
  • 장치공간 소요량은 컨테이너터미널의 장치능력을 결정짓는 매우 중요한 의사결정 변수이다. 일반적으로 장치공간 소요량은 모선의 배선간격, 장치허용기간, 본선작업시간 등 여러 요인들에 좌우된다. 그러나 지금까지는 이들 요인이 확정적이라는 가정 하에 다양한 방법들을 장치공간 소요량 산정에 적용해왔다. 본 연구는 본선작업 물량이 확률적인 것으로 가정하고 요구된 서비스수준을 만족시키는 장치공간 소요량의 산정 방법을 제시했다. 시뮬레이션을 이용한 수치실험은 제시된 방법이 다른 방법들에 비해 확률적 상황에서 더욱 정확한 장치공간 소요량을 산정할 수 있음을 보여주었다.

AWS 분(分) 단위 강우자료를 이용한 서울지역 특성에 따른 행정자치 구(區)별 목표강우량 산정에 관한 연구 (A Study on Estimation of Target Precipitation in Seoul using AWS minutely Rainfall Data)

  • 김민석;손홍민;문영일
    • 한국수자원학회논문집
    • /
    • 제49권1호
    • /
    • pp.11-18
    • /
    • 2016
  • 확률강우량은 수공구조물 설계와 도시방재를 위한 기준 등으로 활용되고 있어, 확률강우량의 산정은 매우 중요하다. 특히 소방방재청에서는 확률강우량으로 우리나라 시 군 단위로 지역방재성능목표를 설정하고 이에 대한 방재성능평가 및 방재성능목표 달성을 위한 개발계획 수립 시 활용하고 있다. 본 연구에서는 현재 시 군 단위로 설정되어 있는 목표 강우량을 구(區) 단위로 산정하고자 기상청의 지상기상관측지점(SSS, Surface Synoptic Stations)과 방재기상관측지점(AWS, Automatic Weather Stations)의 강우자료를 활용하여 지점빈도해석 및 지수홍수법을 이용한 지역빈도해석을 통해 지속시간 1시간, 2시간, 3시간 목표강우량을 산정하였다. 이는 서울지역의 지자체별 방재성능 평가 및 방재관련 업무에 참고자료로 활용할 수 있을 것으로 판단되며, 향후 방재성능목표 설정에 크게 기여할 것으로 판단된다.

확률강우량의 공간분포추정에 있어서 매개변수 추정기법의 비교분석 (Comparative Analysis of Parameter Estimation Methods in Estimation of Spatial Distribution of Probability Rainfall)

  • 서영민;여운기;지홍기
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.413-413
    • /
    • 2011
  • 강우의 공간분포에 대한 신뢰성 있는 추정은 수자원 해석 및 설계에 있어서 필수적인 요소이다. 강우장의 공간변동성에 대한 고해상도 추정은 홍수, 특히 돌발홍수의 원인이 되는 국지성 호우의 확인 및 분석에 있어서 중요하다. 또한 강우의 공간 변동성에 대한 고려는 면적평균강우량 추정의 정확도를 향상시키는데 있어서 중요하며, 강우-유출모델의 모의결과에 대한 신뢰도를 향상시키는데 큰 영향을 미친다. 최근 공간자료에 대한 공간분포예측에 있어서 공간상관성을 고려할 수 있는 공간통계학적 기법의 적용이 증가하고 있으며, 이러한 공간통계학적 기법의 적용에 있어서 신뢰성 있는 모델 매개변수의 추정 및 불확실성 평가는 공간분포 예측결과에 대한 신뢰성을 향상시키는데 중요한 역할을 한다. 외국의 경우 공간분포예측 및 모의, 매개변수의 불확실성 평가 등과 관련하여 활발한 연구가 이루어지고 있는 반면 국내 수자원 분야에서는 아직까지 활발한 연구가 이루어지고 있지 않은 실정이다. 따라서 본 연구에서는 계층구조로 구성된 가우시안 공간선형혼합모델을 적용하여 확률강우량의 공간분포를 추정함에 있어서 모델 매개변수에 대한 추정기법을 비교하였으며, 매개변수 추정기법으로서 경험베리오그램에 대한 곡선적합기법인 보통최소제곱법 및 가중최소제곱법, 우도함수를 기반으로 하는 최우도법 및 REML과 같은 기존의 매개변수 추정기법들과 최근 공간통계학 분야에서 적용이 증가하고 있는 Bayesian 기법을 비교하였다. 이로부터 매개변수 추정기법 간의 매개변수 추정치에 대한 정량적 비교결과를 제시하였으며, Bayesian 기법의 적용을 통해 매개변수에 대한 불확실성 추정결과를 제시하였다. 이러한 결과들은 확률강우량의 공간분포 추정에 있어서 공간예측모델의 매개변수 추정 및 예측에 대한 신뢰성을 향상시킬 수 있는 기초자료로 활용될 수 있을 것이다.

  • PDF

전라북도 강수량의 기상특성 분류 및 공간상관성 분석 (Classification of meteorological state and spatial correlation analysis of precipitation in Jeonbuk province)

  • 이정주;권현한;홍민;이종석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.404-404
    • /
    • 2011
  • 최근 기상변동성 증가와 극치수문사상의 발생빈도 증가로 인한 기상재해가 빈번하게 일어나고 있다. 이러한 기상현상으로 인한 재해의 예방을 위해서 사전에 위험을 인지하고 그 규모를 예측할 수 있는 여러 기법들이 기상레이더 또는 수치예보자료 등을 이용하여 개발 및 적용되고 있다. 이 과정에서 해결해야 할 여러 문제점들이 있는데, 우선 수치예보자료 또는 기상레이더자료를 종관기상관측소 및 자동기상관측지점의 지상관측 강수량과 연계하여 평가하는 과정이 필요하고, 현재시점에 형성되어 있는 강우장의 공간 이동 예측 기법이 확보되어야 할 것이다. 전북지역은 게릴라성 집중호우가 빈번한 산악형 강수와 산지유역의 급한 하천경사가 맞물려 인명 및 재산피해가 매년 발생하고 있으며, 과거 돌발홍수가 발생한 사례가 있어 이상기후 및 기후변화로 인한 홍수 위험도가 커질 것으로 전망되고 있다. 본 연구는 전라북도의 기상재해 예측모형 개발을 위한 사전 분석과정으로 전라북도지역에서 관측된 기존의 대규모 강수사상을 이용한 강수사상의 특성 분류 및 관측소간 공간상관성을 분석하는데 목적을 두고 있다. 강수사상의 특성분류를 통해 강수 발생형태에 따른 기상학적 영향인자, 강수의 발생량 및 이동특성 예측의 정도를 향상시킬 수 있으며, 분류 기법으로 SVM(support vector machine)을 이용한 자동분류를 적용한다. 또한 관측소간 공간상관성 분석을 위하여 각 관측소 강수량간의 조건부 확률을 이용한다. 예로써 부안관측소에 강수가 발 생했을 때, 부안관측소의 강수량 조건에 의한 전주관측소 강수량 확률을 다음과 같이 구성할 수 있다. �揚滑斂�수량�咀刮활�수량��. 공간상관성 분석과정에서 관측소간 강수 이동시간에 따른 강수 발생 시간의 차이 또한 고려하며, 과거 기상관측 자료의 분석을 통해 전라북도지역의 관측소간 강수발생의 공간적 상관성을 규명하고, 단기예측 모델 개발을 위한 기초자료로 활용할 수 있을 것이다. 또한, 기후변화시나리오에 의한 미래 강수량의 지역적 상세화 과정에도 본 연구를 통한 결과를 이용할 수 있을 것이라 판단된다.

  • PDF

위키피디아로부터 한국어-영어 병렬 문장 추출 (Extracting Korean-English Parallel Sentences from Wikipedia)

  • 김성현;양선;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.580-585
    • /
    • 2014
  • 본 연구는 '위키피디아 데이터를 이용한 병렬 문장 추출'이라는 주제에 대해서, 기존에 해외에서 사용되었던 다양한 방법을 한국어 위키피디아 데이터에 실제로 적용해보고 그 결과를 정리하여 보고한다. 실험 방식은 두 가지로 나눌 수 있는데, 첫 번째는 번역 확률을 이용하는 방법으로 세종 병렬 말뭉치 등의 기존 자원으로부터 번역 확률을 추출하여 사용한다. 두 번째는 사전을 이용하는 방법으로, 위키피디아 타이틀로 구성된 위키 사전(Wiki dictionary)을 기본으로 하여, MRD(machine readable dictionary) 정보와 숫자 사전을 추가로 사용한다. 실험 결과, 기존 자원만 이용한 경우보다 위키피디아 데이터를 결합하여 사용한 경우에 매우 큰 폭의 성능 향상을 얻어, 최종적으로 F1-score 57.6%의 우수한 성능을 산출하였다. 또한 토픽 모델(topic model)을 이용한 실험도 추가로 수행하였는데, F1-score 51.6%로 최종 성능 면에서는 낮았지만 비지도 학습 방법이라는 장점을 고려할 때 추가 연구에 대한 여지가 있다고 볼 수 있다.