• 제목/요약/키워드: 통계적인 추론

검색결과 188건 처리시간 0.026초

퍼지집합이론과 사례기반추론을 활용한 채권등급예측모형의 구축 (A Hybrid Approach Using Case-Based Reasoning and Fuzzy Logic for Corporate Bond Rating)

  • 김현정;신경식
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.91-109
    • /
    • 2004
  • 최근 채권의 상환 및 이자의 확실성 정도를 측정하고 연관된 상대적인 위험의 정도를 나타내는 채권등급 평가의 중요성이 대두되고 있다. 초기의 대다수 선행 연구들에서는 기업의 채권 등급예측을 위하여 통계적 기법이 많이 사용되었으나, 많은 연구들에 의해 그 우수성이 보고되고 있는 사례기반 추론 등 인공지능 기법들이 통계모형의 대안으로 제시되어지고 있다. 사례기반 추론에서는 과거의 사례들이 지식으로 표현되고 해결 방법으로 사용된다. 유용한 사례기반 시스템을 구축하기 위해서 시스템의 지식베이스를 구축할 사례들을 인간의 정보처리 과정과 유사한 방법으로 표현하는 것이 중요하다. 본 논문은 실제 세계의 애매모호한 사례들을 다루는데 적절한 퍼지집합개념을 사례기반 추론과 결합하는 통합 방법론을 제시하고자 한다. 퍼지집합이론은 인간이 의사결정시 사용하는 유사한 자연스러운 언어를 수학적으로 변환할 수 있게 해주는 인공지능 기법이다.

  • PDF

잠재범주분석을 이용한 원인적 영향력 추론에 관한 연구 (Estimating Average Causal Effect in Latent Class Analysis)

  • 박가영;정환
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1077-1095
    • /
    • 2014
  • 관찰연구를 이용하여 인과관계를 추론할 경우 무작위 통제시험과는 달리 교란변수로 인한 편향을 제어하기 위한 통계적 전략이 필요하다. 최근에는 성향점수(propensity score) 를 이용한 짝짓기나 원인변수의 역확률을 가중치로 사용하는 주변구조모형이 제안되어 사용되고 있다. 이러한 인과관계 추론은 처치(treatment)가 명확히 주어진 경우에 교란변수를 통제하고 그 처치가 결과에 미치는 영향을 평가하는 방법에 초점이 맞추어져 있다. 하지만 기존의 방법의 경우 원인변수인 처치가 직접관측이 가능한 범주형 변수이고 결과변수 또한 직접관측이 가능한 변수인 경우에만 사용할 수 있는 한계를 갖고 있다. 본 연구에서는 원인변수인 처치와 결과변수의 결괏값의 직접적인 관측이 어려운 경우, 측정오차를 고려한 잠재범주모형(latent class analysis)의 변수로 모형화 함으로써 잠재범주 간의 원인적 영향력을 추정하는 방법을 제시하고자 한다. 그리고 미국의 The National Longitudinal Study of Adolescent Health 자료를 이용하여, 약물사용의 잠재범주에 대한 청소년기의 비행(delinquency)이라는 잠재범주의 원인적 영향력을 추정하였다.

컴퓨터 대수와 베이지언 추론망을 이용한 이공계 수학용 적응적 e-러닝 시스템 개발 (Development of an Adaptive e-Learning System for Engineering Mathematics using Computer Algebra and Bayesian Inference Network)

  • 박홍준;전영국
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.276-286
    • /
    • 2008
  • 본 논문에서는 컴퓨터 대수 시스템을 기반으로 하는 웹 저작 환경과 베이지언 추론망을 적용한 학습자 진단 환경이 포함된 이공계 수학용 적응적 이러닝 시스템 개발에 대하여 소개하였다. 본 시스템을 활용하면 교수자는 컴퓨터 대수 시스템을 수식처리 엔진으로 하며 웹을 인터페이스로 하는 이공계 수학용 웹 콘텐츠를 쉽게 생성할 수 있다. 구체적으로 선형대수, 미분방정식 및 이산수학의 영역에서 콘텐츠 개발의 예를 소개하였다. 또한 학습자의 지식 영역별 수준을 조건부 확률을 이용한 통계적 추론에 의해 진단하여 그 결과에 따라 피드백을 생성하는 적응적 이러닝 웹 콘텐츠를 만들 수 있다. 본 시스템을 사용하여 개발한 이공계 수학용 웹 콘텐츠를 평가하기 위하여 그 결과물을 대학 강의에 적용하였고, 설문지 조사를 통하여 콘텐츠 사용에 대한 학습자의 반응을 평가하였다.

Bayesian 추론기법을 활용한 레이더 반사도-강우강도 관계식 매개변수의 불확실성 정량적 평가 (Quantitative evaluation of radar reflectivity and rainfall intensity relationship parameters uncertainty using Bayesian inference technique)

  • 김태정;박문형;권현한
    • 한국수자원학회논문집
    • /
    • 제51권9호
    • /
    • pp.813-826
    • /
    • 2018
  • 최근 기후변동성으로 유발되는 불안정한 기상상태를 효과적으로 관측하고자 레이더가 도입되고 있다. 레이더는 경험식으로 산정된 Z-R 관계식을 통하여 레이더 강우량을 제시하게 된다. 이 과정에서 레이더 강우량은 필연적으로 지상에 도달하는 실제 강우량과는 정량적 오차가 발생하게 된다. 본 연구는 확률통계학적 방법론을 이용하여 Z-R 관계식 매개변수 산정과정에서 우리나라의 강우특성을 고려함과 동시에 Z-R 관계식 매개변수의 불확실성을 정량적으로 제시하고자 한다. 강우의 계절성을 고려하여 Z-R 관계식 매개변수를 추정하는 과정에서 Bayesian 추론기법을 도입하여 생산된 레이더 강우량은 기존의 Z-R 관계식에 비하여 개선된 통계적 효율기준을 제시하였다. 따라서 Bayesian 추론기법을 활용한 Z-R 관계식 매개변수 산정은 정량적으로 신뢰성 있는 고해상도 강우정보의 생산은 고도화된 수문해석 및 기상예보 지원을 가능케 할 것으로 판단된다.

비실험 자료로부터의 인과 추론: 핵심 개념과 최근 동향 (Causal inference from nonrandomized data: key concepts and recent trends)

  • 최영근;유동현
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.173-185
    • /
    • 2019
  • 과학적 연구에서 핵심적인 연구 주제 또는 가설은 대부분 인과적 질문(causal question)을 포함한다. 예를 들어, 전염병 예방을 위한 치료법의 효과 연구, 특정 정책의 시행으로 인한 효용(utility)의 평가에 대한 연구, 특정 사용자를 대상으로 노출된 광고의 종류에 따른 광고의 효과성에 대한 연구는 모두 인과 관계(causal relationship)의 추론이 요구된다. 이러한 인과 관계를 다루는 통계적 인과 추론(statistical causal inference)의 주요 관심사 중 하나는 모집단에 일종의 개입(정책 혹은 처치)을 적용한 후 개입의 효과를 정확하게 추정하는 것이다. 인과 추론은 임상실험과 정책결정에서 주로 이용되었으나, 이른바 빅데이터 시대의 도래로 가용한 관측자료가 폭발적으로 증가하였고 이로 인하여 인과 추론에 대한 잠재적 응용가치와 수요가 지속적으로 증가하고 있다. 하지만 가용한 대부분의 자료는 임의실험 기반의 자료와 달리 개입이 임의로 분배되지 않은 비실험 관측자료이다. 따라서, 본 논문은 비실험 관측자료로부터 개입의 효과를 추정하기 위한 인과 추론의 핵심 개념과 최근의 연구동향을 소개하고자 한다. 이를 위하여 본문에서는 먼저 개입의 효과를 Neyman-Rubin의 잠재 결과(potential outcome) 모형으로 나타내고, 개입의 효과를 추정하는 여러 접근법 중 특히 성향점수(propensity score) 기반 추정법과 회귀모형 기반 추정법을 중점적으로 소개한다. 최근 연구동향으로는 (1) 평균 효과 크기 추정을 넘어선 개인별 효과 크기의 추정, (2) 효과크기 추정에 있어서 자료 규모의 증대로 인한 차원의 저주가 야기하는 난제들과 이에 대한 해결방안들, (3) 복합적 인과관계를 반영하기 위한 Pearl의 구조적 인과 모형(structural causal model) 및 잠재 결과 모형과의 비교의 3가지 주제로 구분하여 소개한다.

대한방사선종양학회지 게재 논문의 통계적 오류 현황 (Statistical Errors in Papers Published in the Journal of the Korean Society for Therapeutic Radiology and Oncology)

  • 박희철;최두호;안성복;강진오;김은석;박원;안승도;양대식;윤형근;정은지;지의규;표홍렬;홍세미
    • Radiation Oncology Journal
    • /
    • 제26권4호
    • /
    • pp.289-294
    • /
    • 2008
  • 목 적: 본 연구는 대한방사선종양학회지 게재 논문의 통계 오류 현황을 파악하고 이에 근거한 문제 제기를 통해 학회지의 학술적 발전에 기여하고자 하였다. 대상 및 방법: $2006{\sim}2007$년 사이에 대한방사선종양학회지에 게재된 총 77편의 논문을 연구 대상으로 하였다. 각각의 논문에 적용된 통계 방법론의 적정성 평가는 통계점검표를 활용하였다. 통계점검표에는 연구의 종류, 통계 기법의 사용 범위, 각 논문에 적용된 통계 기법의 종류, 통계적 기법 적용의 타당성 항목이 포함되었다. 통계 오류는 '생략의 잘못'과 '시행의 잘못' 항목으로 나누었다. 한 논문에서 서로 다른 항목이 여러 가지 관찰된 경우 각각 횟수로 측정하였다. 같은 항목이 2회 이상 측정된 경우 1회로 횟수를 측정하였다. 통계 전문가가 개별 논문을 대상으로 통계점검표를 작성하였다. 일차 평가자가 방사선종양학 전문가가 아닌 것에서 올 수 있는 평가 오류가 있을 수 있으므로 개별 통계점검표는 간행위원회에서 한 차례 더 세부 점검을 하였다 작성된 통계점검표의 통계 분석은 SAS (version 9.0, SAS Institute, NC, USA) 소프트웨어를 이용하였고 빈도분석을 시행하여 각 항목의 빈도와 백분율을 산출하였다. 결 과: 총 77편 중 원문을 다운로드 할 수 없었던 4편을 제외한 73편의 게재 논문을 대상으로 평가하였다. 증례보고는 5편, 원저 논문은 58편이었다. 대상 논문 중 46편의 논문에서 통계적 추론을 사용하였고, 16편의 논문에서 단순한 기술통계를 사용했으며, 11편의 논문에서는 통계적 기법을 사용하지 않았다. 추론통계를 사용한 46편의 논문에서 사용된 추론통계의 횟수는 각각 분할표분석 17회(37.0%), 비교통계분석 23회(50.0%), 회귀분석 7회(15.2%), 상잔분석 5회(10.9%), 생존분석이 27회(58.7%)였다. 통계 기법을 활용하여 연구 결과를 분석할 때 통계적용의 오류가 없는 논문은 19%였다. '생략의 잘못'은 34편(50.0%)의 논문에서 총 50회 관찰되었다. '시행의 잘못'은 35편(51.5%)의 논문에서 총 47회 관찰되었다. '생략의 잘못'과 '시행의 잘못'이 모두 발견된 논문은 21편(30.9%)이었다. 결 론: 대한방사선종양학회지에 게재된 논문에서 통계 분석 과정의 다양한 영역에 걸쳐 크고 작은 통계적 오류가 있음을 확인하였다. 향후 대한방사선종양학회지 투고 논문의 심사과정에서 통계 오류에 관한 적절한 심사를 추가하는 것이 필요하다고 판단된다.

오차항이 SAR(1)을 따르는 공간선형회귀모형에서 일반화 최대엔트로피 추정량에 관한 연구 (Generalized Maximum Entropy Estimator for the Linear Regression Model with a Spatial Autoregressive Disturbance)

  • 전수영;임성섭
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.265-275
    • /
    • 2009
  • 지역적 공간의 특성을 고려한 공간선형회귀모형을 다루는 대부분의 연구들에서 사용되고 있는 자료는 완전한 상태임을 고려하고 있다. 하지만 공간선형회귀모형을 정확히 추론함에 있어서 완전한 자료가 사용 가능한 경우는 그다지 많지가 않은 것이 현실이다. 만약 이러한 상황을 고려하지 않고 통계적 추론을 할 경우 잘못된 결론이 도출될 수 있다. 본 연구에서는 오차항이 일차 공간자기상관을 따르는 공간선형회귀모형에서 자료가 불완전한 상태 일 경우 일반화 최대엔트로피 형식을 이용하여 미지의 모수를 추정하는 방법을 제안하였고 몬테카를로 모의실험을 통하여 여러 전통적인 추정량들과 효율성을 비교하였다. 그 결과, 자료가 불완전한 상태에서 일반화 최대엔트로피 추정량이 다른 추정방법들에 비해 효율적인 추정치를 제공하였다.

안장점근사를 이용한 자기회귀계수에 대한 소표본 점근추론 (Small Sample Asymptotic Inferences for Autoregressive Coefficients via Saddlepoint Approximation)

  • 나종화;김정숙
    • 응용통계연구
    • /
    • 제20권1호
    • /
    • pp.103-115
    • /
    • 2007
  • 본 논문에서는 1차 자기회귀모형에서 자기회귀계수에 대한 여러 가지 추정량들의 분포함수에 대한 근사 방법에 대해 연구하였다. 자기회귀계수의 여러 추정량들을 이차형식의 관점에서 이해하고, Na와 Kim(2005)에 의한 안장점근사의 결과를 이용한 새로운 근사법을 제시하였다. 이 방법은 정규근사를 비롯한 기존의 근사법과는 달리 추정량에 대한 근사분포의 유도과정이 불필요하며, 소표본은 물론 통계적 추론의 주요 관심영역에서의 근사정도가 매우 뛰어난 장점을 가지고 있다. 모의실험을 통해 Edgeworth 근사를 비롯한 기존의 여러 근사법보다 효율이 뛰어남을 확인하였다.

혼합효과모형의 리뷰 (Review of Mixed-Effect Models)

  • 이영조
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.123-136
    • /
    • 2015
  • 관측 가능한 변수들 사이의 관계를 묘사한 갈릴레오의 물리학 법칙 발견 이후, 과학은 큰 성과를 거두며 발전해왔다. 그러나, 관측할 수 없는 변량효과를 함께 이용하여 더 많은 자연 현상을 설명할 수 있게 되었고, 이를 이용한 최초의 통계적 모형인 혼합효과모형이 소개되었다. 계산기술의 발달과 더불어 복잡한 현상에 대한 추론을 위하여 혼합효과모형은 그 중요성이 더욱 커지고 있다. 이러한 혼합효과모형은 최근 다단계 일반화 선형모형을 포함한 여러 모형으로 확장되었으며, 관측할 수 없는 변량효과를 추론하기 위한 다단계 가능도가 제시되었다. 혼합효과모형 특집호를 통해 이러한 모형들이 여러 통계학적 문제점을 해결하는 과정을 제시하고, 앞으로 어떤 확장이 추가적으로 요구되는 지에 대하여 논할 것이다. 빈도록적 접근법과 베이지안 접근법을 함께 다룬다.

OLAP 데이터 큐브에서의 추론통제 프로세스 설계 (Design of an Inference Control Process in OLAP Data Cubes)

  • 이덕성;최인수
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.183-193
    • /
    • 2009
  • OLAP 데이터 큐브와 SDB(통계 데이터베이스) 모두 다차원 데이터 무리를 대상으로 하고, 이 데이터 무리의 모든 차원 별로 통계적인 요약처리를 한다는 데에는 공통점이 있으나 그 형성과정은 아주 다르다. SDB는 여러 베이스 데이터를 이용하여 자신이 쓸 베이스 데이터를 만들고 있으나 OLAP 데이터 큐브에서는 베이스 데이터 자체가 직접적으로 사용된다. 다시 말하면 SDB의 베이스 데이터는 머크로 데이터인데 반해 OLAP 데이터 큐브에서의 핵심 큐보이드 데이터는 마이크로 데이터라는 뜻이다. OLAP 데이터 큐브에 측정값을 입주시키는 데에 베이스 테이블을 사용한다. 구체적으로 핵심 큐보이드의 각 셀에 마이크로 데이터를 입주시키는 데에 베이스 테이블의 각 레코드를 사용한다. 그런데 OLAP 데이터 큐브에서는 마이크로 데이터가 사용되는 경우가 태반이기 때문에 베이스 테이블에서의 어떤 레코드는 존재하지 않게 되는 상황이 생길 수도 있게 된다. 그리고 이렇게 되면 핵심 큐보이드의 어떤 셀은 공백으로 남게 되는 것이다. Wang 등은 OLAP 데이터 큐브로부터 기밀 누설을 막을 수 있는 방법을 제안하였는데, 이 방법은 집계함수의 종류에 관계없이 적용시킬 수 있다고 주장하고 있다. 그러나 큐보이드의 어떤 셀 하나라도 공백으로 되어있는 경우는 집계함수의 종류에 관계없이 적용시킬 수 있다는 Wang의 주장이 틀리게 된다는 것을 본 연구에서는 밝히고 있다. 본 연구에서는 Wang의 오류를 없앤 OLAP 데이터 큐브에서의 새로운 추론통제 프로세스를 설계하는 데에 목적을 두고 있다.