• 제목/요약/키워드: 자료로부터 추론하기

검색결과 109건 처리시간 0.03초

유사추론 기반 예측모형

  • 장용식;최윤정
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.581-585
    • /
    • 2007
  • 본 연구는 비선형적인 시계열 자료로부터 최신 데이터와 유사한 사례를 탐색하여 미래를 예측하기 위하여 유사추론 기법을 이용한 예측 알고리즘을 제안한다. 기존의 연구들이 최신 데이터와 과거 사례와의 유사성을 비교하기 위해 유클리디언 거리 또는 평균 제곱에러 등을 이용하나, 추세의 유사성을 고려하지는 않는다. 본 연구는 사례 구간 크기, 예측 오차, 평균차이 검증, 사례간 추세의 유사성 등 다차원적 유사추론 요인을 이용한 예측방법과 그 효과를 제시한다.

  • PDF

'그림그래프에서 추론하기' 과제에서 나타나는 초등학교 5, 6학년 학생들의 통계적 소양 (Statistical Literacy of Fifth and Sixth Graders in Elementary School about the Beginning Inference from a Pictograph Task)

  • 문은혜;이광호
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제22권3호
    • /
    • pp.149-166
    • /
    • 2019
  • 초등학교 수학에서 자료와 가능성 영역은 통계적 과정에서 요구되는 기초적인 통계적 내용을 학습하여 통계의 기초 소양을 기르는 단원이다. 학생들은 실제 자료에서 정보를 추출하고, 이를 표와 그래프로 정리하여 결론을 통계적으로 추론하며, 합리적인 의사결정을 내리는 과정을 경험한다. 본 연구에서는 '그림그래프에서 추론하기' 과제에 대한 초등학교 5, 6학년 학생들의 통계적 소양을 분석하여 초등학교에서 추론 학습 가능성과 통계적 소양의 관점에서 그림그래프의 교육적 가치를 살펴본다. 학생들의 통계적 사고를 길러주는 것은 통계교육에서 중요한 목표이며, 비형식적인 통계 추론의 경험은 이후 학습할 형식적 통계적 추론에 도움을 줄 수 있다. 따라서 '그림그래프에서 추론하기' 과제에서 나타나는 초등학생들의 통계적 소양에 대한 논의는 학교 통계 교육에 유의미한 시사점을 제시할 것이다.

퍼지집합이론 및 뉴로-퍼지기법을 이용한 RMR 값의 추론 (Inference of RMR Value Using Fuzzy Set Theory and Neuro-Fuzzy Techniques)

  • 배규진;조만섭
    • 터널과지하공간
    • /
    • 제11권4호
    • /
    • pp.289-300
    • /
    • 2001
  • 터널의 설계에는 지반조사 자료의 부정확성과 평가의 애매성 그리고 자료수집 과정의 오류(observer error)등이 내재되어 있다. 그러므로 터널의 안정성과 경제적인 시공을 위해서는 시공 중 막장면의 조사가 매우 중요한 역할을 한다. 본 연구는 막장면 조사 시 지반의 고유 특성을 보다 정확하게 평가하고, 조사자의 주관성을 최소화시키기 위하여 수행되었다. 이러한 목적을 위하여 막장관찰 자료로부터 RMR값을 추론하고자 인공지능기법 중 퍼지집합이론과 뉴로-퍼지기법을 적용하였고, 46개의 학습자료에 대해 원래의 RMR값과 퍼지이론 및 뉴로저지기법의 추론에 의한 RM $R_{_FU}$ 및 RM $R_{_NF}$값의 상관성을 분석하였다. 본 연구의 결과는 원래의 RMR값과 퍼지추론에 의한 RM $R_{_FU}$값 및 뉴로-퍼지기법에 의한 RM $R_{_NF}$값의 상관계수가 각각 |R|= 0.96과 |R|=0.95로 상관성이 우수한 것으로 조사되었다. 이 결과로부터 암반평가를 위한 퍼지집합이론 및 뉴로-피지기법의 적용성이 충분함을 검증할 수 있었다.할 수 있었다.

  • PDF

중학교 1학년 학생들의 '경우의 수' 문제 해결과정에서 나타나는 표현기호와의 상호작용을 통한 곱셈추론 양식의 변화 (An Investigation of Two Seventh Graders' Modification of their Multiplicative Reasoning for Solving Combinatorial Problems and their Reciprocal Interactions with Represented Symbols)

  • 신재홍;이중권
    • 대한수학교육학회지:학교수학
    • /
    • 제11권3호
    • /
    • pp.351-368
    • /
    • 2009
  • 본 연구는 일 년간 행해진 두 명의 중학교 1학년 학생들과의 교육실험 자료로부터 '경우의 수'를 다룬 문제를 푸는 과정에서 어떻게 두 학생들이 자신들의 곱셈 추론양식을 수정, 변경해 나가며, 표현된 기호들과 상호작용을 해 나가는 지 보여주고 있다. Damon은 그의 곱셈적 추론방식을 수정하여 순환적 곱셈 추론의 구성단계에 있으며, Carol은 여전히 이원적 곱셈 추론 도식에 머물러 있는 것으로 보여 졌다. 이 연구는, 학생들이 그들 자신이 구성한 또는 교사에 의해 제시된 기호들을 다루는 과정에서 두 학생들이 겪는 어려움을 통해, 교사의 관점에서 잘 구성된 기호양식이라 하더라도, 그것이 반드시 학생들의 수학적 능력향상으로 연결되지 않을 수도 있음을 보여주고 있다.

  • PDF

중풍의 증형 진단을 위한 판별모형

  • 신양규
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권2호
    • /
    • pp.283-287
    • /
    • 1996
  • 본 연구는 중풍에서의 한의학의 풍부한 임상자료들에 대한 객관적이고도 논리적인 자료처리방법 및 변증으로부터 증형을 추론할 수 있는 통계적 방법을 연구하고자 한다. 중풍 전문의에 의해 수집된 65명의 환자들의 임상자료로부터 다변량 자료 분석의 하나인 판별분석을 이용하여 증후로부터 증형을 판단할 수 있는 수리적 판별모형을 구축하였다. 구축된 모형은 중풍 전문가 시스템을 개발하기 위한 기초가 될 것이다.

  • PDF

몬테칼로 베이지안 분석과 응용 사례

  • 강승호;박태성
    • Communications for Statistical Applications and Methods
    • /
    • 제3권1호
    • /
    • pp.169-177
    • /
    • 1996
  • 본 논문에서는 한 유명 농구선수의 과거의 연도별 평균득점과 평균 야투율을 기초로 앞으로의 경기에 대한 평균득점과 평균야투율을 추정하기 위해 몬테칼로 베이지안 분석법 중의 하나인 Sampling-Important-Resampling (SIR) 알고리즘을 이용하였다. 즉 과거의 자료로부터 평균득점과 평균야투율에 대한 사전밀도함수를 설정하고 SIR 알고리즘을 이용하여 사후 밀도함수를 구한 후에 이를 기초로 베이지안 추론을 하였다.

  • PDF

비실험 자료로부터의 인과 추론: 핵심 개념과 최근 동향 (Causal inference from nonrandomized data: key concepts and recent trends)

  • 최영근;유동현
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.173-185
    • /
    • 2019
  • 과학적 연구에서 핵심적인 연구 주제 또는 가설은 대부분 인과적 질문(causal question)을 포함한다. 예를 들어, 전염병 예방을 위한 치료법의 효과 연구, 특정 정책의 시행으로 인한 효용(utility)의 평가에 대한 연구, 특정 사용자를 대상으로 노출된 광고의 종류에 따른 광고의 효과성에 대한 연구는 모두 인과 관계(causal relationship)의 추론이 요구된다. 이러한 인과 관계를 다루는 통계적 인과 추론(statistical causal inference)의 주요 관심사 중 하나는 모집단에 일종의 개입(정책 혹은 처치)을 적용한 후 개입의 효과를 정확하게 추정하는 것이다. 인과 추론은 임상실험과 정책결정에서 주로 이용되었으나, 이른바 빅데이터 시대의 도래로 가용한 관측자료가 폭발적으로 증가하였고 이로 인하여 인과 추론에 대한 잠재적 응용가치와 수요가 지속적으로 증가하고 있다. 하지만 가용한 대부분의 자료는 임의실험 기반의 자료와 달리 개입이 임의로 분배되지 않은 비실험 관측자료이다. 따라서, 본 논문은 비실험 관측자료로부터 개입의 효과를 추정하기 위한 인과 추론의 핵심 개념과 최근의 연구동향을 소개하고자 한다. 이를 위하여 본문에서는 먼저 개입의 효과를 Neyman-Rubin의 잠재 결과(potential outcome) 모형으로 나타내고, 개입의 효과를 추정하는 여러 접근법 중 특히 성향점수(propensity score) 기반 추정법과 회귀모형 기반 추정법을 중점적으로 소개한다. 최근 연구동향으로는 (1) 평균 효과 크기 추정을 넘어선 개인별 효과 크기의 추정, (2) 효과크기 추정에 있어서 자료 규모의 증대로 인한 차원의 저주가 야기하는 난제들과 이에 대한 해결방안들, (3) 복합적 인과관계를 반영하기 위한 Pearl의 구조적 인과 모형(structural causal model) 및 잠재 결과 모형과의 비교의 3가지 주제로 구분하여 소개한다.

천문학에서의 대용량 자료 분석 (Analysis of massive data in astronomy)

  • 신민수
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1107-1116
    • /
    • 2016
  • 최근의 탐사 천문학 관측으로부터 대용량 관측 자료가 획득되면서, 기존의 일상적인 자료 분석 방법에 큰 변화가 있었다. 고전적인 통계적인 추론과 더불어 기계학습 방법들이, 자료의 표준화로부터 물리적인 모델을 추론하는 단계까지 자료 분석의 전 과정에서 활용되어 왔다. 적은 비용으로 대형 검출 기기들을 이용할 수 있게 되고, 더불어서 고속의 컴퓨터 네트워크를 통해서 대용량의 자료들을 쉽게 공유할 수 있게 되면서, 기존의 다양한 천문학 자료 분석의 문제들에 대해서 기계학습을 활용하는 것이 보편화되고 있다. 일반적으로 대용량 천문학 자료의 분석은, 자료의 시간과 공간 분포가 가지는 비 균질성 때문에 야기되는 효과를 고려해야 하는 문제를 가진다. 오늘날 증가하는 자료의 규모는 자연스럽게 기계학습의 활용과 더불어 병렬 분산 컴퓨팅을 필요로 하고 있다. 그러나 이러한 병렬 분산 분석 환경의 일반적인 자료 분석에서의 활용은 아직 활발하지 않은 상황이다. 천문학에서 기계학습을 사용하는데 있어서, 충분한 학습 자료를 관측을 통해 획득하는 것이 어렵고, 그래서 다양한 출처의 자료를 모아서 학습 자료를 수집해야 는 것이 일반적이다. 따라서 앞으로 준 지도학습이나 앙상블 학습과 같은 방법의 역할이 중요해 질 것으로 예상된다.

강우-빈도 곡선의 불확실성 분석을 이용한 매개변수 추정법의 평가 (Evaluation of Parameter Estimation Methods Using Uncertainty Analysis of Rainfall-Frequency Curves)

  • 한정우;권현한;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1272-1276
    • /
    • 2009
  • 극치강우사상에 의한 설계 홍수량의 갑작스런 증 감은 홍수, 가뭄과 같은 기상학적 요인에 기인한 재난을 발생시킨다. 많은 연구자들은 보다 정확한 확률강우량의 예측과 유출량의 예측을 위해 많은 노력을 하고 있다. 본 연구에서는 강원도 강릉 강우관측소를 대상으로 강우-빈도곡선의 불확실성 분석을 수행하였다. 관측 자료의 수집에서 발생하는 불확실성을 최소화 하고자 ARMA 모형을 이용하여 합성강우자료를 구축하였으며, 발생된 합성강우량을 Bootstrap 방법을 이용하여 대규모의 자료집단으로 발생시킴으로서 신뢰구간에 사용할 자료집단을 발생시켰다. 본 연구에서는 극치강우사상에 적합한 것으로 알려진 Gumbel 분포와 일반극치 분포(GEV 분포) 모형을 선정하였으며 각 확률분포모형에 대한 매개변수 추정방법으로 최우도법, 확률가중모멘트법 그리고 베이지안 추론방법을 사용하여 각 매개변수의 최후 추정치를 산정하였다. 또한 원 자료를 이용하여 최우도법, 확률가중모멘트법 그리고 베이지안 추론방법을 통해 매개변수를 산정 후 강우-빈도 곡선을 추정하여 합성강우자료의 Bootstrap 방법에 의해 발생된 자료로부터 산정한 강우-빈도 곡선의 신뢰구간과 비교함으로서 불확실성이 낮은 확률강우량을 산정할 수 있는 매개변수 추정방법을 평가하고자하였다.

  • PDF

Bulk tank milk의 품질평가를 위한 퍼지기반 추론 (Fuzzy reasoning for assessing bulk tank milk quality)

  • 김태운;정대유
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.39-57
    • /
    • 2004
  • 우유생산 농가에서는 그들 젖소의 우유를 저장하는 탱크 (bulk tank milk: BTM)로부터 채취된 샘플로부터 분석된 우유에 대한 품질관련 항목들, 즉 체세포 수 (somatic cell count: SCC), 표준 plate count (standard plate count: SPC), 사전 incubation count (preliminary incubation count: PIC) 등에 관한 정보를 정기적으로 제공 받는다. 이러한 정보는 일정기간 쌓이게 되면 우유의 품질을 유지하고 목장을 관리할 수 있는 중요한 지식 베이스가 될 수 있다. 그러나 우유 품질이나 목장의 관리상태를 평가하는 기준은 모호하고 퍼지한 용어로 많이 표현되고 있다. 즉 우유 품질을 최상급, 상급, 중간, 불량으로 표시하거나 목장의 관리상태를 아주 양호, 양호, 미흡 등으로 표시한다. 이러한 서술방식은 퍼지이론에서의 모호한 상태를 표현하는 기준과 많이 부합되고 있다. 본 연구의 목적은 BTM으로부터 추출한 샘플로부터 미생물학적 분석을 통해서 나온 결과를 이용해서 BTM의 품질과 목장의 관리상태에 대하여 추론하는 것을 목표로 하고 있다. 따라서 퍼지추론엔진에 기초하여 퍼지로직 기반의 추론방법을 개발하고 실제 데이터를 이용해서 평가하였다. 입력 데이터로는 Bulk Tank SCC, SPC, PIC, laboratory pasteurization count (LPC), non agalactiae Streptococci, Streptococci like organisms, Staphylococcus aureus등이다. 이러한 입력자료에 근거하여 BTM의 품질상태를 아주 양호, 양호, cooling문제, 청결문제, 환경적 mastitis, 환경적/청결 복합문제로 분류하고, 낙농가로부터 채취한 실제 데이터를 이용하여 추론하였다. 본 퍼지 추론 결과는 낙농생산자, 컨설턴트, 수의사 등 관련 종사자들에게 의사결정을 위한 참고자료로서 활용이 가능하다.

  • PDF