• 제목/요약/키워드: 비모수적 분류

검색결과 51건 처리시간 0.031초

베이즈 리스크를 이용한 커널형 분류에서 평활모수의 선택 (On Practical Choice of Smoothing Parameter in Nonparametric Classification)

  • 김래상;강기훈
    • Communications for Statistical Applications and Methods
    • /
    • 제15권2호
    • /
    • pp.283-292
    • /
    • 2008
  • 커널밀도함수의 추정을 이용한 분류 문제에서 평활모수(smoothing parameter, bandwidth)의 선택은 핵심적으로 중요한 역할을 한다. 본 논문에서는 분류에서 베이즈 리스크를 최적화하기 위한 평활모수의 선택이 각 개별 확률밀도함수를 추정하기 위한 최적의 평활모수와 어떤 관계가 있는지 살펴보았다. 실제 상황에서 사용할 수 있는 평활모수의 선택 방법으로 붓스트랩(bootstrap)과 교차확인법(cross-validation)을 이용하는 것을 비교한 결과, 붓스트랩 방법은 Hall과 Kang (2005)에서 밝혀진 이론적인 성질에 부합하는 반면 교차확인법은 그렇지 못함을 확인하였다. 또한, 각 방법으로 정한 평활모수를 사용하여 오분류율을 조사해 본 결과에서도 붓스트랩 방법이 우월함을 알 수 있었다.

비모수적 기법에 의한 확률론적 저수지 유입량 예측 (Probabilistic Reservoir Inflow Forecast Using Nonparametric Methods)

  • 이한구;김선기;조영현;정구열
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.184-188
    • /
    • 2008
  • 추계학적 시계열 분석은 크게 수문자료의 장기간 합성과 실시간 예측으로 구분해 볼 수 있다. 장기간 합성은 주로 수문자료의 추계적 특성을 반영한 수자원 시스템의 운영율 개발에 이용되어 왔다. 반면에 실시간 예측은 수자원 시스템의 순응적(adaptive) 관리에 적용되고 있다. 두 개념의 차이로 전자는 시계열 자료를 합성하여 발생 가능한 모든 수문조합을 얻고자 하는 것이라면 후자는 전 시간의 수문량을 조건으로 하는 다음 시간의 값을 순응적으로 예측하는 것이라 할 수 있다. 수문자료의 합성과 예측에는 크게 결정론적, 확률론적 방법의 두 가지 대별될 수 있다. 결정론적 모델링 방법에는 인공신경망이나 Fuzzy 기법 등을 이용할 수 있으며, 확률론적 방법에는 ARMAX 등의 모수적 기법과 k-NN(k-nearest neighbor bootstrap resampling), KDE(kernel density estimates), 추계학적 인공신경망 등의 비모수적 기법으로 분류할 수 있다. 본 연구에서는 대표적 비모수적 기법인 k-NN를 이용하여 충주댐을 대상으로 월 및 일 유입량 자료의 예측 정도를 살펴보았다. 전 시간 관측치를 조건으로 하는 다음 시간의 조건부 확률분포를 구하여 평균값을 계산한 후 관측치와 비교함으로써 모형의 정도를 살펴보았다. 그리고 실시간 저수지 운영에 이 기법의 활용성과 장단점도 살펴보았다. 모형개발 절차로 모형의 보정을 거쳐 검증을 실시하였다. 결론적으로 월 및 일 유입량 예측에 k-NN 기법이 실무적으로 적용될 수 있었으며, 장점으로는 k-NN 기법이 다른 기법보다 모델링 절차가 비교적 쉬워 저수지 운영 최적화 등 타 시스템과의 연계에 수월함이 인식되었다.

  • PDF

IPAA의 효과를 고찰하기 위한 분류분석방법들의 비교연구

  • 이승연;이은주;최호식
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.291-298
    • /
    • 2005
  • 지속성 외래 복막투석은 말기 신부전 환자들에게 널리 시행하는 신 대체 요법으로, 복막투석 환자에게서 주된 합병증으로 일어나는 단백질-열량 영양실조를 치료하기 위하여 아미노산을 복강 내로 주입하는 치료방법이다. 이현석 등(2004)의 연구에서는 아미노산 복막 투석액(IPAA)이 영양실조 환자들에게 실제로 영양상태에 미치는 영향을 평가하기 위하여 지속성 외래 복막투석 환자 43명을 12개월 동안 3개월 주기로 관측하여 얻어낸 반복측정자료를 바탕으로 IPAA의 효과 여부에 따라 반응군과 비반응군을 분류하였다. 본 논문에서는 이러한 두 그룹을 효과적으로 분류할 수 있는 분류기준변수들을 찾아내고 이 분류기준변수의 값을 바탕으로 새로운 환자에게 IPAA의 투여 여부를 진단할 수 있는 여러 분류방법들을 고찰하여 비교 연구하였다. 모수적인 방법으로 선형판별분석, 이차판별분석 및 로지스틱 판별분석을 소개하고 비모수적인 방법으로 support vector machine(SVM)을 소개하여 분류분석의 결과를 비교하여 두 그룹을 최소한의 오류로 분류하는 방법을 제안하였다.

  • PDF

음성을 이용한 사상체질 분류 보조 알고리즘 (Voice Classification Algorithm for Sasang Constitution)

  • 강재환;이혜정
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.1982_1983
    • /
    • 2009
  • 본 연구에서는 기존의 특정 음성 변수에 대한 모수적 통계 접근 방법을 탈피하고 새로운 음성을 이용한 사상체질 분류 알고리즘을 개발하고자 먼저 5개의 모음과 2개의 문장으로 이루어진 총 120명의 여성 음성 데이터 수집하였다. 이후 다양한 음성 신호 분석 방법과 툴을 이용하여 총 134개의 음성 변수를 추출하였다. 각 변수에서는 체질별 최대값들의 최소값, 최소값들의 최대값을 이용해 4개의 조건 변수를 새로 생성하고 이를 관리하기 위한 메모리와 체질 점수 개념을 도입하여 비모수적인 통계 방법을 기반으로 한 분류 알고리즘을 개발하였다. 알고리즘 성능 테스트를 위해 10-fold cross 검정테스트를 실시하였으며 본 알고리즘은 최종적으로 이진 분류에서 진단률 41.5%와 정확률 79.5%를 가지는 것으로 확인되었다.

  • PDF

집단관측치에 의한 비모수적 축차검정에 관한 연구 (A nonparametric sequential test based on observations in groups)

  • 박창순
    • 응용통계연구
    • /
    • 제1권2호
    • /
    • pp.66-81
    • /
    • 1987
  • 이 연구에서는 새로운 방법의 비모수적 축차검정방법이 제시되었다. 먼저 축차적으로 얻어지는 관측치를 일정수의 집단으로 분류하고 각집단으로부터 주어진 가설에 적절한 비모수 통계량을 구하여 이것을 축차확률비검정에서 사용되는 로그확률비통계량에 대체하여 Wald의 축차검정을 수행하는 방법이다. 이러한 검정의 특성은 Wiener과정에 의해 근사적으로 규명되었다.

생물/보건/의학 연구를 위한 비모수 베이지안 통계모형 (Nonparametric Bayesian Statistical Models in Biomedical Research)

  • 노희상;박진수;심규석;유재은;정연승
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.867-889
    • /
    • 2014
  • 비모수 베이지안 통계 모형은 그 유연성과 계산의 편리성으로 인해 최근 다양한 분야에서 응용되고 있는데, 본 논문에서는 생물/의학/보건 연구에서 사용되는 비모수 베이지안 통계 모형에 대해서 개괄하였다. 본 논문에서는 비모수 베이지안 통계 모델링에서 핵심적으로 사용되는 확률모형들을 소개하고, 다양한 예제들을 통하여 그 모형들이 어떻게 사용되는지 이해를 돕도록 하였다. 특별히, 논의된 예제들은 모수적 통계 모형으로 고찰하기에는 한계가 있는 연구가설들을 포함하고 있어 모수적 모형의 한계점을 지적하고 비모수적 베이지안 모형의 필요성을 강조하는 것들로 정하였다. 크게 확률밀도함수 추정, 군집분석, 임의효과 분포의 추정, 그리고 회귀분석의 4가지 주제로 분류하여 살펴보았다.

베이지안 모형 기반 한국어 의미역 유도 (Bayesian Model based Korean Semantic Role Induction)

  • 원유성;이우철;김형준;이연수
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.111-116
    • /
    • 2016
  • 의미역은 자연어 문장의 서술어와 관련된 논항의 역할을 설명하는 것으로, 주어진 서술어에 대한 논항인식(Argument Identification) 및 분류(Argument Labeling)의 과정을 거쳐 의미역 결정(Semantic Role Labeling)이 이루어진다. 이를 위해서는 격틀 사전을 이용한 방법이나 말뭉치를 이용한 지도 학습(Supervised Learning) 방법이 주를 이루고 있다. 이때, 격틀 사전 또는 의미역 주석 정보가 부착된 말뭉치를 구축하는 것은 필수적이지만, 이러한 노력을 최소화하기 위해 본 논문에서는 비모수적 베이지안 모델(Nonparametric Bayesian Model)을 기반으로 서술어에 가능한 의미역을 추론하는 비지도 학습(Unsupervised Learning)을 수행한다.

  • PDF

베이지안 모형 기반 한국어 의미역 유도 (Bayesian Model based Korean Semantic Role Induction)

  • 원유성;이우철;김형준;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-116
    • /
    • 2016
  • 의미역은 자연어 문장의 서술어와 관련된 논항의 역할을 설명하는 것으로, 주어진 서술어에 대한 논항 인식(Argument Identification) 및 분류(Argument Labeling)의 과정을 거쳐 의미역 결정(Semantic Role Labeling)이 이루어진다. 이를 위해서는 격틀 사전을 이용한 방법이나 말뭉치를 이용한 지도 학습(Supervised Learning) 방법이 주를 이루고 있다. 이때, 격틀 사전 또는 의미역 주석 정보가 부착된 말뭉치를 구축하는 것은 필수적이지만, 이러한 노력을 최소화하기 위해 본 논문에서는 비모수적 베이지안 모델(Nonparametric Bayesian Model)을 기반으로 서술어에 가능한 의미역을 추론하는 비지도 학습(Unsupervised Learning)을 수행한다.

  • PDF

관능특성 및 판별함수를 이용한 한우고기 맛 등급 분석 (Palatability Grading Analysis of Hanwoo Beef using Sensory Properties and Discriminant Analysis)

  • 조수현;서그러운달님;김동훈;김재희
    • 한국축산식품학회지
    • /
    • 제29권1호
    • /
    • pp.132-139
    • /
    • 2009
  • 본 연구에서는 1,300명의 소비자들이 직접 먹어보고 평가한 한우고기 데이터를 이용하여 쇠고기 맛 등급을 구분 해 내기 위한 판별분석 방법들을 비교하였다. 한우 관능평가의 주요 세 변수인 연도, 다즙성, 향미를 포함한 정준 판별분석과 대표적인 맛 변수로 여겨지는 전반적인 기호도 만을 이용하여 선형판별분석과 비모수 판별분석을 하였다. 전반적인 기호도와 같은 한 개의 변수만을 사용할 경우 두 가지 모두 비슷한 분류율을 나타내지만 선형판별 함수는 이해와 사용 측면에서 장점이 있었던 반면에 비모수적 방법은 커널함수와 띠폭에 대한 선택이 불편하지만 잘 선택하면 정확한 분류율을 높일 수 있는 장점이 있었다. 그러나 다른 정보를 가진 변수들이 있음에도 불구하고 한 개의 변수만을 이용한 판별 분석은 판별에 영향을 미치는 다른 중요한 변수들의 정보를 활용하지 못한다는 문제점이 있다. 한편, 정준판별분석의 경우 정준판별함수의 오분류율이 일변량 선형 판별함수와 비모수 판별함수의 오분류율에 비해 크게 떨어지지 않으면서 분포에 대한 특별한 가정이 필요하지 않아 통계적 가정이 까다롭지 않고 또한 맛에 중요한 요인인 연도, 다즙성, 향미의 세 개변수를 모두 사용하므로 맛 정보를 최대로 활용한다는 장점이 있었다. 따라서 본 연구결과 연도, 다즙성, 향미의 세가지 변수 정보를 모두 포함한 다변량 정준판별분석법을 이용하는 것이 맛 등급을 구분하는데 가장 적절할 것으로 판단되었다.

다분적 암반분류를 위한 정성적 자료의 지구통계학적 연구 1.이론 (A Geostatistical Study Using Qualitative Information for Multiple Rock Classification -1. Theory)

  • 유광호
    • 한국지반공학회지:지반
    • /
    • 제11권2호
    • /
    • pp.71-78
    • /
    • 1995
  • 본 논문에서는 RMR법이나 Q시스템 등의 암반분류법에서와 같이 암반을 여러 등급으로 분류하는 연구가 수행되었다. 특히, 정량적 자료가 제한된 상황에서의 정성적 자료의 체계적이고 합리적인 이용 방법이 모색되었다. 이를 위해서, 지구통계학(geostatistics)기법이 사용되었는데, 특히, 비모수적 방법 중의 하나인 지시크리깅(indicator kriging) 기법이 사용되었으며, 최적 분류를 위한 선택기준으로는 오차에 대응하는 비용(the cost of error)가 사용되었다. 결과적으로, 기존에 개발된 이분적 암반분류에서 다분적 암반분류로의 일반화가 가능하게 되었으며, 분류등 급의 총수에는 제한이 없다.

  • PDF