• 제목/요약/키워드: 통계적인 추론

검색결과 187건 처리시간 0.029초

유전자 발현 데이터 기반 구강암에서의 세포 조성 차이 분석 (Distinct cell subtype composition using gene expression data in oral cancer)

  • 이제근
    • 한국융합학회논문지
    • /
    • 제10권8호
    • /
    • pp.59-65
    • /
    • 2019
  • 암 조직에는 다양한 형태의 세포가 존재하지만, 이들의 조성을 실험적으로 확인하기는 매우 어렵다. 본 연구에서는 유전자 발현 데이터에 통계적 기계학습 모델을 적용하여 각 샘플의 세포 조성을 추론하고, 이러한 세포 조성이 암조직과 정상 조직간에 차이가 있는지를 확인하였다. 두 가지 서로 다른 회귀 모델을 이용하여 세포 조성을 예측한 결과 CD8 T cell과 Neutrophil이 구강암 조직에서 정상 조직에 비해 증가함을 확인할 수 있었다. 또한 비지도학습 중 하나인 t-SNE를 적용하여, 유추된 세포 조성에 의해 정상 조직과 구강암 조직이 서로 군집을 이루고 있음을 확인하였고, 지도 학습 기반의 다양한 분류 알고리즘들을 이용하여 세포 조성 정보를 이용하여 구강암과 정상 조직을 예측하는 것이 가능함을 보였다. 이 연구는 구강암의 면역 세포 침투에 대한 이해도를 증진하는데에 도움을 줄 수 있을 것이다.

극치수문자료의 경향성 분석 개념 및 비정상성 빈도해석 (Concept of Trend Analysis of Hydrologic Extreme Variables and Nonstationary Frequency Analysis)

  • 이정주;권현한;김태웅
    • 대한토목학회논문집
    • /
    • 제30권4B호
    • /
    • pp.389-397
    • /
    • 2010
  • 본 논문에서는 극치수문자료의 경향성 분석 개념을 소개하고 이를 빈도해석과 연계시켜 해석하는 방법론을 제시하고자 Gumbel 극치분포를 기반으로, 시간변화에 의한 수문빈도 특성 변화를 모의할 수 있는 Bayesian 모형을 구성하였다. 사후분포의 매개변수는 깁스표본법에 의한 Markov Chain Monte Carlo Simulation을 통해 추정하였으며, 이를 통해 경향성을 고려한 확률강우량과 불확실성 구간을 추정하였다. 또한 경향성을 고려한 확률강우량이 현재 알려진 확률강우량을 초과할 확률을 통해 동적 위험도 해석과정을 소개하였으며, 현재의 경향성에 대해서 시간에 따라 연속으로 추정된 확률밀도함수를 비교하여 수문학적 위험도가 증가할 수 있음을 모의결과를 통해 확인하였다. 이와 더불어 단순히 경향성의 존재여부를 확인하는데 그치지 않고 사후분포를 통해서 통계적 추론을 수행함으로써 경향성에 대한 통계학적인 유의성을 정량적으로 평가할 수 있었다.

대한치과보철학회지에서 볼 수 있는 통계적 오류의 고찰(2006 - 2010) (Assessment of statistical errors of articles published in the Journal of the Korean Academy of Prosthodontics: 2006 - 2010)

  • 강동완;서윤암;오남식;임회정
    • 대한치과보철학회지
    • /
    • 제50권4호
    • /
    • pp.258-270
    • /
    • 2012
  • 연구 목적: 대한치과보철학회지의 최근 5년간 게재된 논문 중에서 통계 방법이 사용된 논문의 빈도를 조사하고 통계 방법의 종류 및 오류의 유형과 빈도를 살펴 보고 오류별 적절한 통계 방법을 제시하고 통계분석 가이드라인을 개발하여 대한치과보철학회지의 학술적 발전에 기여하고자 한다. 연구 재료 및 방법: 2006년부터 2010년까지 게재된 논문 336편 중 통계방법이 사용된 255편을 연구대상으로 하여 연도별로 통계 방법 사용 여부, 주로 사용된 통계방법과 소프트웨어의 유형과 빈도를 조사하였다. 통계방법 별로 고안된 가이드라인에 따라 오류를 조사하였는데 주로 실험설계의 적절성, 분석법에 대한 가정검토, 표본의 독립성 및 변수의 적합성, 적절한 표본 수와 적절한 통계방법이 사용되었는지에 대한 평가를 하였고 이를 토대로 고안된 가이드라인을 제시하였다. 결과: 본 연구에서 조사된 논문 중 추론통계를 사용한 논문이 193편(75.9%)으로 대다수를 차지하였고 사용된 소프트웨어는 SPSS가 153편(59.77%)으로 가장 많았다. 추론통계를 사용한 논문들을 대상으로 통계방법을 분류한 결과 ANOVA (41.5%), t-test (20.0%), 비모수 방법(16.9%)순으로 많았고 최근에 가까울수록 다양한 분석법을 시도하였으나 유의한 변화는 관찰되지 않았다. 대부분의 논문들은 표본수의 산출근거를 제시하지 않았고, 분석법에 대한 가정(독립성, 정규성, 등분산성 등) 검토를 하지 않은 공통적인 오류를 범했다. 전체적으로는 61.2%의 통계적 오류를 범하였다. 결론: 대부분의 오류는 전체적인 분석 후 세부적인 분석으로 들어가야 하는데 두 요인에 대한 상호작용을 무시하고 단변수 분석을 여러 번 한 경우와 연구 계획 단계에서 적절한 표본 수를 산출하지 않아 나타난 경우 등이었다. 이러한 통계 오류를 최소화하기 위하여 분석 방법 별 검정 절차에 대한 통계분석 가이드라인을 제시하였다.

$H_2^{15}O$ 양전자단층촬영술을 이용한 뇌기능 지도 작성(I): 통계적 파라메터 지도작성법 (Functional Brain Mapping Using $H_2^{15}O$ Positron Emission Tomography ( I ): Statistical Parametric Mapping Method)

  • 이동수;이재성;김경민;정준기;이명철
    • 대한핵의학회지
    • /
    • 제32권3호
    • /
    • pp.225-237
    • /
    • 1998
  • 목적: $H_2^{15}O$ 양전자단층촬영으로 작업기억을 조사할 때 뇌기능을 국소화한 뇌기능지도를 만들기 위해 동원되는 통계적 가정과 추론의 여러 방법을 해석하고 뇌활성화와 관련된 뇌기능 국소화 방법에 영향을 미치는 요소를 조사하였다. 대상 및 방법: 정상인 6명에 대하여 각각 대조과제, 언어성 작업기억 활성화과제 2종류, 시각적 작업기억 활성화과제 1종류를 수행시키며 뇌혈류 $H_2^{15}O$ PET 촬영을 시행하였다. SPM96 소프트웨어를 이용하여 각 영상과 표준지도의 뇌피질 경계가 일치 되도록 부분 선형적으로 변형하였으며 선형화한 비선형적 변형 방법으로 사람에 따라 나타나는 뇌피질 및 내부 구조의 미세한 차이를 제거하였다. 공간정규회된 영상들을 16mm의 FWHM을 갖는 가우시안 커널로 중첩적분하여 편평화하였다. 각 화소의 방사능 계수는 뇌피질전체 뇌혈류, 활성화에 의한 특정 효과, 여러 교란변수의 영향과 오차의 선형 결합으로 이루어진다는 일반선형모델을 가정하고 공분산분석 방법으로 전체 뇌혈류 차이를 제거하였다. 각 화소의 방사능 계수가 자극과 뇌활성화 작업에 상관없을 경우 평탄한 무작위 가우스장의 행동을 따른다고 가정하고 특정화소의 계수차이가 이 무작위장의 정상적인 교란 이상인지 검정하였다. 화소별 t 값을 Z 값으로 바꾸어 표현하고 가설검정 결과에 따라 화소, 덩어리, 화소 또는 덩어리의 차이가 얼마나 유의한지 제시하였다. 결합분석을 하여 여러 과제를 수행할 때 동시에 화소의 계수가 증가하는 곳을 찾았다. 각 화소의 Z 값을 3차원으로 렌더링한 표준지도와 투명유리뇌에 투사하여 활성화된 부위를 알아볼 수 있게 하였다. 결과: 피검자 모두 성공적으로 검사를 마쳤으며 대조 과제와 기억 과제를 수행하는 동안 피험자는 평균 95%를 맞췄다. 활성화된 덩어리의 개수는 언어성 기억과제 I에서 4개, 언어성 기억과제 II에서 9개, 시각적 기억과제에서 9개, 결합분석에서 6개였다. 언어성 기억과제에서는 주로 왼쪽 뇌가, 시각적 기억과제에서는 오른쪽 뇌가 활성화되었다. 결론: $H_2^{15}O$ 양전자 단층촬영술과 통계적 파라메터 지도작성법이 언어성 및 시각적 작업기억과 관련되어 활성화된 지 영역을 찾는데 유용하였다.

  • PDF

국내 비만아동의 비만관리프로그램의 효과에 대한 메타분석 (Meta-analysis of the Effects of Obesity Management Program for Children)

  • 성경숙;윤영미;김은주
    • Child Health Nursing Research
    • /
    • 제19권4호
    • /
    • pp.262-269
    • /
    • 2013
  • 목적 국내에서 연구된 비만 아동의 관리프로그램의 효과를 확인하고 프로그램의 종류별, 종속변수별 효과크기를 산출하여 효과적인 아동의 비만관리프로그램의 형태를 파악하기 위함이다. 방법 본 연구에서는 2000년에서 2010년까지 비만 아동을 대상으로 운동 및 다양한 중재의 효과를 검증한 연구들이 주요 대상이었다. 본 연구에 포함된 연구는 대조군이 있는 실험연구, 비만 아동에게 중재를 제공한 연구, 서술 통계치와 추론 통계치가 사용가능한 연구들이 포함되었다. 선정기준에 적합한 연구들은 신뢰구간 95%, 통계적 유의수준 5%로 정하며 이용된 프로그램은 STATA 10.0을 이용하였다. 결과 총 61편의 연구가 분석에 이용되었으며 개별연구들의 결과를 결합한 효과크기는 -0.23 (95% CI, -0.32 ~ -0.15)로 중간 이하의 효과를 보였다. 중재별 결합추정치 중에서는 운동요법과 영양교육을 포함한 중재 방법이 중간 이상의 효과를 보였으며 종속변수 중에서는 혈중 렙틴, 인슐린이 큰 효과가 있었으며 중성지방, 혈당, 체지방률, 자아존중감이 중간크기의 효과가 있었다. 마지막으로 분석에 이용된 논문들은 출판상의 편향을 보이지 않았다. 결론 확인된 비만 아동의 관리프로그램을 각 지역사회기반을 둔 프로토콜 개발이 필요할 것이다. 비만아동의 지속적인 체중 및 건강유지를 위한 지속적인 연구가 진행되어야 할 것이다.

2차원 벡터 공정능력지수 Cpmk의 추정량과 극한분포 이론에 관한 연구 (On the Plug-in Estimator and its Asymptotic Distribution Results for Vector-Valued Process Capability Index Cpmk)

  • 조중재;박병선
    • Communications for Statistical Applications and Methods
    • /
    • 제18권3호
    • /
    • pp.377-389
    • /
    • 2011
  • 공정능력지수는 공정능력을 측정하고 분석하기 위하여 매우 중요한 역할을 하는 측도로, 품질수준과 밀접한 관계가 있을 뿐만 아니라 보다 높은 품질수준은 고객들에게 더 큰 만족을 가져다 준다. 제3세대 공정 능력지수 $C_{pmk}$는 gms히 6시그마 산업현장에서 공정능력을 평가하기 위하여 유용하게 사용되는 두 가지 지수 $C_p$$C_{pk}$보다 이론적으로 강력한 지수이다. 실제로 제조현장에서 두 가지 이상의 서로 연관이 있는 품질특성치들과 제품에 대한 규격한계들을 사용하여 보다 정확한 공정능력 분석이 필요할 것이다. 이러한 경우에 단순히 하나의 일변량 공정능력지수를 통하여 공정능력분석을 하기 보다는 벡터 공정능력지수나 다변량공정능력지수를 통하여 분석을 수행하는 것이 바람직할 것이다. 본 논문에서는 3세대 공정능력지수 $C_{pmk}$를 고려하여 2차원 벡터 공정능력지수 $C_{pmk}$ = ($C_{pmkx}$, $C_{pmky}$)$^t$에 대하여 연구하였다. 우선, $C_{pmk}$에 대한 플러그-인(plug-in) 추정량 $\hat{C}_{pmk}$과 관련하여 핵심내용인 극한 확률분포를 유도하였다. 나아가 이러한 결과를 기초로 이변량 정규분포하에서 공분산 행렬 $V_{pmk}$을 구체적으로 계산하였다. 또한 이 행렬의 추정을 통하여 벡터 공정능력지수 $C_{pmk}$에 대한 근사적인 공동 신뢰영역을 제시함으로써, 본 논문에서의 극한분포 연구결과가 벡터 공정능력지수 $C_{pmk}$에 대한 통계적 추론에 유용하게 활용될 수 있음을 보여주었다.

LDA 기반 은닉 토픽 추론을 이용한 TV 프로그램 자동 추천 (Automatic TV Program Recommendation using LDA based Latent Topic Inference)

  • 김은희;표신지;김문철
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.270-283
    • /
    • 2012
  • 다채널 TV, IPTV 및 Smart TV 서비스의 등장으로 인해 수많은 방송 채널과 방대한 TV 프로그램 콘텐츠가 시청자 단말로 제공됨으로써 시청자들은 자신이 원하는 콘텐츠를 쉽게 찾고 소비하는 것이 어려운 TV 시청 환경을 맞게 되었다. 따라서 TV 사용자들에게 자신이 선호하는 콘텐츠를 자동 추천해 줌으로써 원하는 콘텐츠로의 접근성을 증대시키는 것은 미래의 지능형 TV 서비스에 있어서 주요한 이슈이다. 이에 본 논문에서는 사용자의 선호 취향과 대중의 선호취향을 모두 고려한 협업필터링 개념의 통계적 기계학습 기반 TV 프로그램 추천 모델을 제시한다. 이를 위해 시청한 TV 콘텐츠에 대한 선호 토픽을 사용자의 시청 선호도로 보고, 최근 널리 활용되고 있는 LDA(Latent Dirichlet Allocation)모델을 TV 프로그램 추천 모델에 적용하였다. LDA 기반 TV 프로그램 추천 성능을 개선하기 위해 본 논문에서는 TV시청 이용내역 데이터를 기반으로, TV 사용자들의 관심 토픽을 은닉 변수로 하고, TV 사용자들의 관심 토픽에 대한 다양성을 반영하기 위해 은닉 변수의 확률분포 특성을 비대칭 디리클레(Dirichlet) 분포로 모형화하여 실험에 적용하였다. 제안된 LDA 기반 TV 프로그램 자동 추천 방법의 성능을 검증하기 위해, 유사 시청 특성을 갖는 사용자 그룹에 대해 상위 5개의 TV 프로그램을 일주일 단위로 추천하였을 경우 평균 66.5%, 2개월 단위의 추천에 대해서는 평균 77.9%의 precision 추천 성능을 확인할 수 있었다.

국가수준 학업성취도 평가의 서답형 문항을 이용한 중학교 과학 8개 핵심 개념에 대한 학습발달과정 탐색 (Exploring a Learning Progression for Eight Core Concepts of Middle School Science Using Constructed Response Items in the National Assessment of Educational Achievement (NAEA))

  • 이기영;동효관;최원호;권경필;이인호;김용진
    • 과학교육연구지
    • /
    • 제41권3호
    • /
    • pp.382-404
    • /
    • 2017
  • 이 연구에서는 2015년 국가수준 학업성취도 평가(NAEA)의 서답형 문항을 이용하여 중학교 과학 교과의 8개 핵심 개념에 대한 학습발달과정을 탐색하고자 하였다. 이를 위해 2015년 실시된 NAEA 서답형 8개 문항에 대한 중학교 3학년 7,390명의 응답 결과를 전산으로 입력하고 입력된 답안을 분석하여 수준별로 유형화하는 과정을 거쳤다. 이 과정을 마친 후 각 평가 구인별로 5개 수준을 설정하여 구인구성도를 작성하였다. 이 연구에서의 구인구성도는 발달 기반의 루브릭 형식으로 작성되었는데, 전체 학생들의 답안에 대해 수준을 부여하는 준거로 활용되었다. 또한, 평가 결과로 얻은 학생들의 점수를 평가 구인에 대한 성취 수준과 연결하기 위하여 통계적 해석으로 응답자의 점수나 성취 정도를 측정하는 Rasch 모델을 적용하였다. 마지막으로, Rasch 모델 적용 결과를 반영하여 구인구성도를 수정한 예비 학습발달과정을 작성하였다. 이 연구는 NAEA의 서답형 문항을 활용하여 학습발달과정 개발 가능성을 탐색하였다는 데 의의가 있다. 하지만, 이 연구에서 작성된 예비 학습발달과정이 개별 학생들 대상으로 종적으로 추적한 것이 아니므로 여전히 가설적이며 추론적이다. 그러므로 반복적인 연구 과정을 통해 지속적으로 수정 및 보완될 필요가 있다.

Holstein 젖소의 선형심사형질과 등급형질에 대한 환경효과 분석 (Analysis of Environmental Effects for Linear Type Traits and Scoring Traits on Holstein Cows)

  • 이득환;김은길
    • Journal of Animal Science and Technology
    • /
    • 제48권6호
    • /
    • pp.767-776
    • /
    • 2006
  • 젖소의 강건성 및 생산수명과 밀접한 관련성이 있는 선형심사형질들에 대한 여러가지 환경요인들의 효과를 알아보고 측정치에 영향하는 환경요인들에 대한 효과를 추정함으로써 통계적 유전분석을 위한 기초자료를 제공하고자 한국종축개량협회에서 2000년부터 2004년까지 국 Holstein 젖소 115,646두를 대상으로 측정한 15개의 선형심사 1차형질과 5개의 선형심사 2차형질에 대한 통계분석모형을 찾고 해당요인들에 대한 효과를 제시하였다. 모형설정을 위한 1차 연구로써 농가(H), 심사년도(Y), 심사월(M) 심사자(A)에 따라 분석에 고려된 대분분의 형질에서 고도의 유의적인 차이가 있었기 때문에 해당요인들을 결합한 HYMA 효과를 고려하고 산차, 비유기간, 등록구분 및 착유개시 후 심사시까지의 시간을 주 요인으로 하는 분산분석을 실시하였다. HYMA 효과에 대한 보정을 실시한 후 산차 및 비유기간은 분석에 고려된 1차 심사형질 및 2차 심사형질 전체에 있어서 고도의 유의적인 차이가 있는 것으로 분석되었고 등록구분은 유방부위의 심사점수 등 일부의 형질에서 유의적인 차이가 있는 것으로 분석된 반면에 심사시간은 대부분의 형질에서 유의적인 차이를 보이지 않았다. 유방부위의 심사점수, 유두배열 및 발굽각도 등은 산차가 증가할수록 심사점수가 감소하는 경향을 보인 반면에 기타 형질들은 산차가 증가할수록 점차 증가하는 경향을 보였다. 2~3산에서 최대의 최종심사점수를 보였는데 이는 우리나라 착유우의 생산수명이 짧고 다산우가 적은 것과 관련이 있는 것으로 추론된다. 비유기간에 따라 예각성, 뒷유방의 부착높이, 뒷유방의 너비 및 최종점수는 비유곡선과 유사한 경향치를 보이는 것으로 평가되었다. 2차 선형심사형질에 있어서는 산차가 증가하거나 비유기간이 증가할수록 지제 및 비유기관의 점수가 낮아지고 있는 경향을 보였으며 유용특질은 비유기간에 따라 비유곡선과 유사한 경향치를 보였다. 따라서 최종심사점수는 비유기간에 따른 보정을 실시함이 바람직할 것으로 사료된다.

표본 개념의 교육적 의의와 인식 특성 연구 (Pedagogical Significance and Students' Informal Knowledge of Sample and Sampling)

  • 이경화;지은정
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제15권2호
    • /
    • pp.177-196
    • /
    • 2005
  • 현재 학교 수학에서 통계는 표본 평균의 분포에 주목하여 표본과 모집단의 관계를 분석하는 높은 수준의 내용을 다루고 있다. 그러나 통계적 사고의 출발점이자 통계학에서 주요 연구 대상인 표본은 다소 소홀히 다루고 있다. 이 연구에서는 표본 개념의 교육적 의의를 살펴보고 초등학교 5학년부터 고둥학교 2학년까지 학생들을 대상으로 표본에 대한 그들의 인식을 조사하였다. 조사 결과, 학생들이 비형식적인 표본 개념을 지니고 있음을 확인하였다. 특히, 표본이 대표성을 지녀야 하고, 모집단과 표본 사이의 관계를 고려하기 위해 비례추론을 사용하는 것에 관련하여 높은 인식 수준을 나타내었다 또한 이런 능력들은 학년이 올라가면서 자발적으로 향상되는 것으로 파악되었다. 그러나 표본 조사 자체를 전수 조사에 비해 신뢰하지 않으며, 표본의 편의성과 관련하여서는 매우 낮은 인식 수준을 나타내었다 이것은 그 동안 표본 개념이 학교수학에서 소극적으로 다루어져 온 결과로 보인다. 그러므로 표본 개념의 교수학적 변환 방안에 대한 적극적인 연구가 필요함을 제기하였다.

  • PDF