• 제목/요약/키워드: 우도비 검정

검색결과 58건 처리시간 0.023초

집락자료의 분할표에서 독립성검정 (Testing Independence in Contingency Tables with Clustered Data)

  • 정광모;이현영
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.337-346
    • /
    • 2004
  • 랜덤표본에 관한 이원분할표의 독립성검정에는 통상 피어슨의 카이제곱적합도검정과 우도비검정을 사용한다. 그러나 랜덤표본이 아닌 집락자료에 관한 분할표의 경우에는 이들 검정법은 잘못된 결과를 나타낸다. 이러한 경우에는 공변량의 고정효과 외에 집락에 따른 변량효과를 함께 포함하는 일반화선형혼합모형을 고려함으로써 집락간의 이질성과 집락내의 종속성을 반영할 수 있다. 본 연구에서는 집락자료의 분할표에 대한 일반화선형혼합모형을 소개하고 실례를 통하여 이들 모형의 적합에 대해 논의한다.

2000년 미국대선 플로리다주의 투표결과 분석 (Statistical Outliers in Florida Counties at the Presidential Election 2000)

  • 김현철
    • 응용통계연구
    • /
    • 제15권1호
    • /
    • pp.21-32
    • /
    • 2002
  • We searched out in the votes data of the State of Florida at presidential election 2000. We used a multivariate regression analysis. We got there were several outliers including Palm Beach County. It means that we should analyze the number of disqualified ballots which were double-punched as well as the votes, to insist the " Butterfly Ballot" made Palm Beach outlier.

변형된 Support Vector Machine을 이용한 유비쿼터스 데이터 마이닝 (Ubiquitous Data Mining Using Hybrid Support Vector Machine)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제15권3호
    • /
    • pp.312-317
    • /
    • 2005
  • 유비쿼터스 컴퓨팅 환경은 정치, 경제, 사회, 문화, 교육 등 대부분의 분야에 많은 영향을 주고 있다. 인터넷에 비해 훨씬 거대한 유비쿼터스 네트워크 환경이 효과적으로 운영되기 위해서는 네트워크에 접속한 다양한 컴퓨터들이 스스로 지능을 가지고 주어진 상황에서 최적의 의사결정을 할 수 있어야 한다. 현재 많은 분야에서 데이터 마이닝은 지능형 시스템 구축을 위한 효과적인 분석도구로 사용되고 있다. 지능화된 유비쿼터스 컴퓨팅 환경의 구현을 위한 유비쿼터스 데이터 마이닝을 위하여 본 논문에서는 변형된 Support Vector Machine 기법을 제안하였다. 유비쿼터스 컴퓨팅 환경에서 상당 부분의 데이터가 센서를 통하여 수집된다. 센서 네트워크를 통하여 수집된 데이터는 상당부분 잡음을 포함한 데이터이다. 제안 기법은 특히 센서 네트워크를 통한 스트림 데이터의 잡음을 제거하는 데 목적을 두고 있다. 본 논문의 실험에서는 유비쿼터스 센서 네트워크를 나타내는 다양한 분포로부터 시뮬레이션 데이터를 생성하여 제안 방법의 성능 평가를 수행하였다.

네트워크 침입 탐지를 위한 변형된 통계적 학습 모형 (Hybrid Statistical Learning Model for Intrusion Detection of Networks)

  • 전성해
    • 정보처리학회논문지C
    • /
    • 제10C권6호
    • /
    • pp.705-710
    • /
    • 2003
  • 최근 대부분의 정보 교류가 네트워크 환경 기반에서 이루어지고 있다. 때문에 외부의 침입으로부터 시스템을 보호해 주는 네트워크 침입 탐지 기술에 대한 연구가 매우 중요한 문제로 대두되고 있다. 하지만 시스템에 대한 침입 기술은 날로 새로워지고 더욱 정교화 되고 있어 이에 대한 대비가 절실한 실정이다. 현재 대부분의 침입 탐지 시스템은 이미 알려진 외부의 침입으로부터의 경험 데이터를 이용하여 침입 유형에 효과적으로 대처하지 못하게 된다. 따라서, 본 논문에서는 통계적 학습 이론과 우도비검정 통계량을 이용하여 새로운 침입 유형까지 탐지해 낼 수 있는 변형된 통계적 학습 모형을 제안하였다. 즉, 기존의 정상적인 네트워크 사용에서 벗어나는 형태들에 대한 모형화를 통하여 시스템에 대한 침입 탐지를 수행하였다. KDD Cup-99 Task 데이터를 이용하여 정상적인 네트워크 사용을 벗어나는 새로운 침입을 제안 모형이 효과적으로 탐지함을 확인하였다.

신호 준공간 모델에 기반한 통계적 음성 검출기 (Statistical Voice Activity Defector Based on Signal Subspace Model)

  • 류광춘;김동국
    • 한국음향학회지
    • /
    • 제27권7호
    • /
    • pp.372-378
    • /
    • 2008
  • 음성 검출기 (VAD, Voice Activity Detector)는 이동 통신이나 음성신호처리 등에 매우 중요한 기법으로 사용된다. 일반적인 음성 검출방식은 이산 푸리에 변환 (DFT, Discrete Fourier Transform)영역에서 통계적인 모델을 기반으로 하여 우도비검정 (LRT, Likelihood Ratio Test)을 하게 된다. 그리고 이 값을 임계값과 비교하며 음성인지 아닌지 판단하게 된다. 본 논문에서는 신호 준공간 (Signal Subspace)에 기반한 새로운 통계적 음성 검출 기법을 제안하다. 확률적인 주성분 분석 (PPCA, Probabilistic Principal Component Analysis)은 신호 준공간 방법에서 잡음신호에 대한 확률적인 모델을 얻기 위해 사용된다. 제안된 기법은 신호 준공간 영역에서 우도비검정에 기반을 두는 결정규칙을 적용하였다. 음성 검출 실험 결과는 신호 준공간 모델에 근거한 음성 검출기 기법이 주파수 영역에 기반한 가우시안 (Gaussian) 음성 검출기 보다 향상된 검출 결과를 보여준다.

확률출력 SVM을 이용한 감정식별 및 감정검출 (Identification and Detection of Emotion Using Probabilistic Output SVM)

  • 조훈영;정규준
    • 한국음향학회지
    • /
    • 제25권8호
    • /
    • pp.375-382
    • /
    • 2006
  • 본 논문에서는 음성신호에 포함된 감정정보를 자동으로 식별하는 방법과 특정 감정을 검출하는 방법에 대해 다룬다. 자동 감정식별 및 검출을 위해 장구간 (long-term) 음향 특징을 사용하였고, F-score 기반의 특징선택 기법을 적용하여 최적의 특징 파라미터들을 선정하였다. 기존의 일반적인 SVM을 확률출력 SVM으로 변환하여 감정식별 및 감정검출 시스템을 구축하였으며, 가설검정에 기반한 감정검출을 위해 세 가지의 대수 우도비 (log-likelihood) 근사법을 제안하여 그 성능을 비교하였다. SUSAS 데이터베이스를 사용한 실험 결과, F-score를 이용한 특징선택 기법에 의해 감정식별 성능이 향상되었으며, 확률출력 SVM의 유효성을 검증할 수 있었다. 감정검출의 경우, 제안한 방법에 의해 91.3%의 정확도로 화난 감정을 검출할 수 있었다.

이변량 조건부자기회귀모형을이용한강력범죄자료분석 (Analysis of Violent Crime Count Data Based on Bivariate Conditional Auto-Regressive Model)

  • 최정순;박만식;원유복;김학열;허태영
    • Communications for Statistical Applications and Methods
    • /
    • 제17권3호
    • /
    • pp.413-421
    • /
    • 2010
  • 본 연구에서는 5대 범죄중 사람의 생명과 신체에 심각한 위해를 가하는 강력범죄인 살인과 강도 범죄의 이변량 가산자료에 대해 이변량조건부자기회귀모형을 사용하여 공간상관성을 반영한 강력범죄모형을 제안하였다. 범죄자료와 같은 가산자료에 대한 과대산포 검정을 위해 우도비 검정 실시하였으며, 그 결과 과대산포가 유의하지 않음에 따라 공간포아송모형을 이용하였다. 실증예제로 2007년 서울시에서 제공하는 25개 자치구별 강력범죄자료를 지리정보시스템을 이용하여 강력범죄 발생실태를 시각화하였으며 강력범죄에 영향을 주는 다양한 요인들에 대하여 분석을 실시하였다.

휴가철 여가통행시간 절감의 추가적 가치 산정방안 연구: 익산포항 및 동해고속도로를 중심으로 (Research on Additive Valuation of Leisure Travel Time Saving During the Summer Vacation: Focused on the Iksan-Pohang Expressway and Donghae Expressway)

  • 이경아;최소림;김준기;조남건
    • 대한교통학회지
    • /
    • 제30권6호
    • /
    • pp.3-12
    • /
    • 2012
  • 휴가철 여가통행시간 절감에 대한 합리적인 가치 산정을 위해 익산포항 및 동해고속도로 이용자들을 대상으로 여가통행시간 절감에 대한 추가적인 지불의사와 사회경제적 특성을 조사하였다. 여가통행시간 절감에 대해 평균 통행시간 2-3시간인 익산포항고속도로 이용자들은 여가통행시간 10분 절감에 723원, 평균 통행시간 3-4시간인 동해고속도로 이용자들은 854원의 지불의사가 있는 것으로 나타나 동해고속도로 이용Q 자들의 WTP가 높게 분석되었으며, 이는 통행시간이 길어짐에 따라 WTP도 증가하는 것으로 나타났다. 설문조사는 2010년 여름 성수기에 실시되었고, 각 노선당 유효 설문부수를 300부씩 확보하였으나, 콕스 검정 결과에 근거하여 각각의 개별모형으로 추정하였다.

평균이동모형을 이용한 성장곡선모형의 이상점 진단에 관한 연구 (Outlier Detection in Growth Curve Model Using Mean-Shift Model)

  • 심규박
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권2호
    • /
    • pp.369-385
    • /
    • 1999
  • 성장곡선모형에서 다중 이상값들이나 영향관측값들을 탐지하는 문제는 선형회귀모형에서의 문제에 비해 매우 복잡하여 거의 이루어지지 않고 있는 실정이다. 본 연구에서는 이상점을 포함하고 있는 성장곡선모형에서 이들을 탐지하는 방법으로 평균이동모형을 이용하는 방법을 소개하였다. 이 방법을 이용하여 찾아낸 자료가 이상점인지의 여부를 예측표본재이용 의사 베이즈 우도 기준법을 이용한 등분산성의 검정을 통해 알아보았다. 끝으로 Potthoff(1964)등이 사용한 자료를 이용한 예제를 통해 이상점 탐지와 등분 산성 검정을 실시한 결과를 제시하였다.

  • PDF

존 데이터 기반 수단분담모형에 관한 연구 (A Study on the Modal Split Model Using Zonal Data)

  • 류시균;노정현;김지은
    • 대한교통학회지
    • /
    • 제30권1호
    • /
    • pp.113-123
    • /
    • 2012
  • 본 연구에서는 수단별 비용변수를 주요 설명변수로 활용하고 있는 현행 수단분담모형의 문제점으로서 설명변수간 높은 상관관계로 인한 다중공선성 문제와 버스노선의 가변성으로 인한 설명변수의 장래치 추정불가능성 문제를 지적하고 이와 같은 문제점을 극복할 수 있는 방안으로서 존을 설명하는 사회경제적 변수, 토지이용변수, 교통체계변수들을 설명변수로 하는 '존 데이터 기반 수단분담모형'의 활용가능성을 검증하였다. 장래교통수요추정모형으로서 수단분담모형의 설명변수가 갖추어야 할 조건으로서 목표연도별 설명변수의 추정가능성을 설정하고 이러한 조건을 만족하는 존 데이터를 설명변수로 한 수단분담모형을 구축하였으며 수단별 비용변수를 주요 설명변수로 하는 수단분담모형과의 비교를 수행하였다. 추정된 계수에 대한 통계적 유의성 검정에서 비용변수간 높은 상관관계로 인한 다중공선성 문제를 확인할 수 있었으며 적합도 평가(우도비의 비교)를 통해서 존 데이터 기반 수단분담모형이 수단별 비용변수를 설명변수로 한 수단분담모형에 비해서 설명력이 더욱 높다는 사실이 확인되었다.