• 제목/요약/키워드: Scatter plots

검색결과 34건 처리시간 0.021초

우리나라 고등학생들의 상관관계 이해도 조사 (Korean High School Students' Understanding of the Concept of Correlation)

  • 노아라;유연주
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제23권4호
    • /
    • pp.467-490
    • /
    • 2013
  • 상관관계는 두 통계적 변량 사이의 관계를 이해하는 데 필요한 핵심적인 통계의 개념이다. 우리나라의 중등교육과정에서는 제7차 교육과정까지 산점도와 분할표를 이용하여 상관관계를 비형식적으로 다루도록 하였고, 2007 교육과정 이후 상관관계에 대한 내용을 삭제하였다. 이 연구에서는 비형식적인 상관관계의 교육을 받은 고등학생들의 상관관계와 관련된 이해도 및 오개념을 조사하였다. 학생들은 상관관계가 선형적 관계성에 근접한 정도를 의미하는 것을 잘 알지 못하였고 자료의 밀집된 모양이 유발하는 시각적 오개념에 취약하였다. 또한 글로 표현된 상관관계의 강도 비교에 대한 서술문의 진위성을 잘 판단하지 못하였다. 많은 학생들이 $2{\times}2$ 분할표에 제시된 범주형 자료를 보고 상대빈도수의 개념을 이용하여 연관성을 판단하지 못하였다. 우리나라 고등학생들의 상관관계 개념의 이해도가 부족하고 오개념이 빈번한 것으로 볼 때, 통계의 기본적 소양인 두 변량 사이의 상관관계에 대한 지도가 강화되어야 할 것이다.

  • PDF

PARTIAL INTRINSIC BAYES FACTOR

  • Joo Y.;Casella G.
    • Journal of the Korean Statistical Society
    • /
    • 제35권3호
    • /
    • pp.261-280
    • /
    • 2006
  • We have developed a new model selection criteria, the partial intrinsic Bayes factor, which is designed for cases when we select a model among a small number of candidate models. For example, we can choose only a few candidate models after exploring scatter plots. By simulation study, we have showed that PIBF performs better than AIC, BIC and GCV.

Q-omics: Smart Software for Assisting Oncology and Cancer Research

  • Lee, Jieun;Kim, Youngju;Jin, Seonghee;Yoo, Heeseung;Jeong, Sumin;Jeong, Euna;Yoon, Sukjoon
    • Molecules and Cells
    • /
    • 제44권11호
    • /
    • pp.843-850
    • /
    • 2021
  • The rapid increase in collateral omics and phenotypic data has enabled data-driven studies for the fast discovery of cancer targets and biomarkers. Thus, it is necessary to develop convenient tools for general oncologists and cancer scientists to carry out customized data mining without computational expertise. For this purpose, we developed innovative software that enables user-driven analyses assisted by knowledge-based smart systems. Publicly available data on mutations, gene expression, patient survival, immune score, drug screening and RNAi screening were integrated from the TCGA, GDSC, CCLE, NCI, and DepMap databases. The optimal selection of samples and other filtering options were guided by the smart function of the software for data mining and visualization on Kaplan-Meier plots, box plots and scatter plots of publication quality. We implemented unique algorithms for both data mining and visualization, thus simplifying and accelerating user-driven discovery activities on large multiomics datasets. The present Q-omics software program (v0.95) is available at http://qomics.sookmyung.ac.kr.

저수지 최적수질측정망 구축시스템 개발 및 적용 (Construction and Application of Network Design System for Optimal Water Quality Monitoring in Reservoir)

  • 이요상;권세혁;이상욱;반양진
    • 한국수자원학회논문집
    • /
    • 제44권4호
    • /
    • pp.295-304
    • /
    • 2011
  • 효과적인 수질관리를 위해서는 수질정보의 기대수준에 맞는 신뢰성 있는 수질자료가 확보되어야 한다. 이런 점에서 볼 때 수질모니터링은 조사지점, 수질항목, 측정주기 등이 성패의 중요한 요인이 되며, 이중에서 특히 조사지점은 가장 중요한 사항으로 판단된다. 그러나 지금까지 수질조사를 위한 관측지점은 대부분 정성적 판단에 따라 정해지고 있었기 때문에 수질 대표성이 문제가 되기도 하였다. 본 논문에서는 이와같은 수질측정망 구축 시 문제점을 과학적인 통계기법을 적용하여 개선한최적수질측정망구축시스템으로제시하였다. 구축된 최적수질측정망 구축시스템은 SAS 프로그램 버전 9.2를 기반으로 만들었으며, 이용자의사용편의성을 고려하여 간단한 입력으로 측정망을 구축할 수 있는 체계로 구성하였다. 분석 데이 터형식은 자료 입출력 및 관리가 용이한 엑셀데이터를 사용하도록 하였으며, 관측지점별 데이터는 시트로만 구별하게 하였다. 시스템에서는 시계열 분석과 유사성계산을 하여, 각 수질의 변화패턴을 고려할 수 있는 상관계수를 활용한 다차원척도법을 적용하여 그 결과를 덴드로그램으로 제시하며, 그 결과를 활용하여 군집 개수를 결정한다. 이용자가 최종 산점도 출력시스템에 원하는 군집의 개수를 입력하면 수질 특성 파악이 가능한 주성분 산점도가 출력되며, 군집 내 관측지점의 중심점을 대표지점으로 선정하면 된다.

3차원 잔차산점도를 이용한 로지스틱회귀모형에서 교호작용의 탐색 (Exploring interaction using 3-D residual plots in logistic regression model)

  • 강명욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.177-185
    • /
    • 2014
  • 로지스틱회귀모형에서 설명변수만으로는 충분히 설명이 되지 못하고 설명변수의 변환된 형태인 이차항 또는 교호작용항이 필요한 경우가 있다. 설명변수가 두 개이고 조건부 분포가 이변량 정규분포를 따르는 경우 로지스틱회귀모형에서는 기본적으로 이차항과 교호작용항이 모형에 포함되어야 한다. 하지만 조건부 분포의 분산과 상관계수에 따라 이차항과 교호작용항이 필요하지 않게 되는 경우도 있다. 분산이나 상관계수에 대한 정보는 산점도를 보고 대체적인 판단이 가능하지만 교호작용항의 필요성을 판단하기가 쉽지 않다. 본 논문에서는 3차원 잔차산점도를 이용한 교호작용의 탐색방법을 제시하고 이 방법을 실제 자료에 적용시켜본다.

Studies on Layered Modulation for SVC Signals in DVB-S2 System

  • Wang, Yi;Kim, Seung-Chul;Lee, Kye-San;Sohn, Won
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 추계학술대회
    • /
    • pp.181-184
    • /
    • 2008
  • The paper describes a Layered Modulation using the SVC signals and studies the properties of the modulation with respect to several parameters by the computer simulation. The SVC signals will include a base layer signal and an enhancement signal, and the base layer signal is the more important one in its channel robustness. The parameters will include a carrier frequency, a bandwidth, power level, modulation type and code rate. We analyze the demodulating and decoding process of the Layered Modulation system through several scatter plots. And then we discuss the affect of the layer signal power difference to the BER performance, which also proves the base layer signal is more important than the enhancement layer signal.

  • PDF

Enhancement of Aerosol Concentration in Korea due to the Northeast Asian Forest Fire in May 2003

  • In, Hee-Jin;Kim, Yong-Pyo;Lee, Kwon-H.
    • Asian Journal of Atmospheric Environment
    • /
    • 제3권1호
    • /
    • pp.1-8
    • /
    • 2009
  • Enhancement of aerosol optical thickness (AOT) and surface aerosol mass concentration in Korea for an active forest fire episode in Northeast Asia were estimated by Community Multi-scale Air Quality (CMAQ) model. MODIS/TERRA remote detects of fires in Northeast Asia for May 2003 gave a constraint for estimation of wildfire emissions with an NDVI distribution for recent five years. The simulated wildfire plumes and enhancement of AOT were evaluated and well resolved by comparing multiple satellite observations such as MODIS, TOMS, and others. Scatter plots of observed daily mean aerosol extinction coefficient versus $PM_{10}$ concentration in ground level in Korea showed distinctively different trends based on the ambient relative humidity.

고해상도 위성영상의 분광혼합분석을 이용한 산림 황폐화 탐지 (High Spatial Resolution Spectral Mixture analysis for Forest forest Denudation Detection)

  • 윤보열;이광재;김윤수;김용승
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.279-282
    • /
    • 2006
  • 분광혼합은 위성영상에서 공간해상도의 한계로 인해 다른 분광 속성을 가진 물질들이 하나의 픽셀 내에 존재하게 될 때 발생하게 된다. 이러한 문제를 해결하고자 분광분리 알고리즘을 통해 픽셀의 순수한 영역만을 선정하여 정확도 높은 탐지가 가능하도록 하는 분광혼합분석(Spectral Mixture Analysis, 이하 SMA)을 고해상도 영상에 적용하였다. 본 연구는 산림의 훼손이 심각한 강원도 정선군 임계지역의 QuickBird 다중분광 위성영상을 이용하였다. 주성분분석(Principal Component Analysis, 이하 PCA)으로 생성된 결과 영상의 1, 2, 3번 밴드를 추출한 후에 밴드간의 Scatter plots 내에서 끝지점에 위치하는 Endmember를 3개(나지, 산림, 초지) 선정하였다. 선정된 Endmember를 토대로 작성된 fraction 영상을 이용하여 강원도 임계지역의 산림훼손으로 초지와 나지로 변화된 지역을 탐지하여 보았다.

  • PDF

Comparison of Shape Variability in Principal Component Biplot with Missing Values

  • Shin, Sang-Min;Choi, Yong-Seok;Lee, Nae-Young
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.1109-1116
    • /
    • 2008
  • Biplots are the multivariate analogue of scatter plots. They are useful for giving a graphical description of the data matrix, for detecting patterns and for displaying results found by more formal methods of analysis. Nevertheless, when some values are missing in data matrix, most biplots are not directly applicable. In particular, we are interested in the shape variability of principal component biplot which is the most popular in biplots with missing values. For this, we estimate the missing data using the EM algorithm and mean imputation according to missing rates. Even though we estimate missing values of biplot of incomplete data, we have different shapes of biplots according to the imputation methods and missing rates. Therefore we propose a RMS(root mean square) for measuring and comparing the shape variability between the original biplots and the estimated biplots.

Comparison of Daily Soil Water Contents Obtained by Energy Balance-Water Budget Approach and TDR

  • Rim, Chang-Soo
    • Korean Journal of Hydrosciences
    • /
    • 제8권
    • /
    • pp.57-68
    • /
    • 1997
  • The daily soil water contents were obtained from the time domain reflectometry(TDR) method and energy balance-water budget approach with eddy correlation at the two small semiarid watersheds of Lucky Hills and Kendall during the summer rainy period. There was a comaprison of daily soil water content measured and estimated from these two different approaches. The comparison is valuable to evaluate the accuracy of current soil water content measuring system using TDR and energy balance-water budget approach using eddy correlation method at a small watershed scale. The degree of simiarity between the regressions of these two methods of measuring soil water content was explained by determining the correlations between these methods. Simple linear regression analyses showed that soil water content measured from TDR method was responsible for 58% and 63% of the variations estimated from energy balance-water budget approach with edy correlation at Lucky Hills and Kendall, respectively. The scatter plots and the regression analyses revealed that two different approaches for soil water content measurement at a small watershed scale have no significant difference.

  • PDF