• Title/Summary/Keyword: 정규분포 검정

Search Result 159, Processing Time 0.055 seconds

Multi-dimension Categorical Data with Bayesian Network (베이지안 네트워크를 이용한 다차원 범주형 분석)

  • Kim, Yong-Chul
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.11 no.2
    • /
    • pp.169-174
    • /
    • 2018
  • In general, the methods of the analysis of variance(ANOVA) for the continuous data and the chi-square test for the discrete data are used for statistical analysis of the effect and the association. In multidimensional data, analysis of hierarchical structure is required and statistical linear model is adopted. The structure of the linear model requires the normality of the data. A multidimensional categorical data analysis methods are used for causal relations, interactions, and correlation analysis. In this paper, Bayesian network model using probability distribution is proposed to reduce analysis procedure and analyze interactions and causal relationships in categorical data analysis.

Introduction to numba library in Python for efficient statistical computing (효율적인 통계 계산을 위한 파이썬 numba 라이브러리의 소개)

  • Cho, Younsang;Yu, Donghyeon;Son, Won;Park, Seoncheol
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.6
    • /
    • pp.665-682
    • /
    • 2020
  • This paper introduces numba library in Python, which improves computational efficiency of the provided implemented code written by naive Python language by applying just-in-time (JIT) compilation. To apply just-in-time compilation, the numba only needs to use a decorator on a target Python function. We provide implementation examples with numba for the permutation test and the parameter estimation for Gaussian mixture distribution. We also numerically show the efficiency of numba by comparing the total computation times of the implementation using naive python and the implementation using numba for each application.

A Study on the Analysis of Autonomous Nerve System Response for the Computational Task (연산 작업에 대한 자율 신경계의 반응에 대한 연구)

  • Ha, Eun-Ho;Park, Gwang-Hoon;Kim, Dong-Youn;Rim, Young-Hoon;Ko, Han-Woo;Kim, Dong-Sun
    • Science of Emotion and Sensibility
    • /
    • v.3 no.1
    • /
    • pp.63-71
    • /
    • 2000
  • 본 연구에서는 20대의 건강한 남자대학생 45명을 대상으로 작업조건(안정상태, 연산작업상태, 휴식상태, 반복연산작업상태, 연산작업후 아정상태)과 연산레벨(연산작업의 난이도)에 따른 생리신호의 측정을 위한 실험 프로토콜을 제안하고 측정된 생리신호에 대한 분석을 하였다. 연산작업에 대하여 측정된 파라메터에 대하여 1) 정규분포화를 위한 파라메터의 변환 2) 파라메터간의 산관관계의 조사 3) 연산작업에 대한 파라메터의 표준화 4) 작업조건과 연산레벨에 대한 파라메터의 차이에 대한 유의성검정을 하여 연산스트레스를 평가할 수 있는 파라메터를 추출하였다. 연산작업시의 파라메터는 안정산태의 파라메터와 유의적인 차이를 나타내어 연구에 사용된 연산작업이 생리신호의 변화를 발생시키는 것으로 밝혀졌고 연산작업후의 휴식상태에서 측정된 대부분의 파라메터의 갓이 연산작업전의 안정상태의 파라메터의 통계적으로 유의적인 차이가 없어서 본 연구에 사용된 연산작업은 단기적 스트레스를 유발하는 것으로 밝혀졌다. 그리고, 동일한 연산레벨에 대한 연산작업을 반복하더라도 파라메터의 값은 처음으로 연산작업을 할 때의 파라메터의 값과 유의적인 차이가 없었다. 그러나, 연산레벨에 따라서는 Heart Rate, HRV의 LF/HF, HRV의 MF/(LF+HF), Return Map의 분산, 코끝의 Mean Temperature, GSR-Mean과 호흡수는 차이가 있는 것으로 밝혀졌다. 따라서 이들 파라메터를 사용하면 연산스트레스의 강도를 지수화할 수 있을 것이다.

  • PDF

A Case Study on Stochastic Fracture Network Modeling for Rock Slopes of Busan-Ulsan Highway(Reach 5) (부산-울산 고속국도(5공구)에 위치한 암반사면의 추계론적 절리연결구조 모사에 대한 사례연구)

  • Heo, In-Sill;Um, Jeong-Gi;Kim, Yang-Phil;Kim, Kook-Han;Lee, Young-Kyun
    • The Journal of Engineering Geology
    • /
    • v.16 no.4 s.50
    • /
    • pp.337-349
    • /
    • 2006
  • Seven hundred and fifty one fractures of the rhyolitic tuffaceous rock masses were mapped using 6 scanlines placed on rock slope exposures that were within 8.02 km of Busan-Ulsan highway. These data were analyzed to find the number of fracture sets that exist in the rock slopes and the probability distributions of orientation, spacing, trace length and fracture size in 3-D for each of the fracture sets. All the fracture set orientation distributions exhibit high variability. The Fisher distributions were found to be unsuitable to represent the statistical distribution of orientation for most of the fracture sets. The probability distributions, gamma, exponential and lognormal were found to be highly suitable to represent the distribution of spacing and semi-trace length of fracture sets. In obtain-ing these distributions, corrections were applied for sampling biases associated with spacing and trace length. The generated fracture system in 3-D was used to make predictions of fracture traces for each fracture set on 2-D win-dows. Developed stochastic 3-D fracture network for the rock mass was validated by comparing statistical proper-ties of the observed fracture traces on scanlines with the predicted fracture traces on the scanlines. This exercise fumed out to be successful.

Optimal design of a nonparametric Shewhart-Lepage control chart (비모수적 Shewhart-Lepage 관리도의 최적 설계)

  • Lee, Sungmin;Lee, Jaeheon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.2
    • /
    • pp.339-348
    • /
    • 2017
  • One of the major issues of statistical process control for variables data is monitoring both the mean and the standard deviation. The traditional approach to monitor these parameters is to simultaneously use two seperate control charts. However there have been some works on developing a single chart using a single plotting statistic for joint monitoring, and it is claimed that they are simpler and may be more appealing than the traditonal one from a practical point of view. When using these control charts for variables data, estimating in-control parameters and checking the normality assumption are the very important step. Nonparametric Shewhart-Lepage chart, proposed by Mukherjee and Chakraborti (2012), is an attractive option, because this chart uses only a single control statistic, and does not require the in-control parameters and the underlying continuous distribution. In this paper, we introduce the Shewhart-Lepage chart, and propose the design procedure to find the optimal diagnosis limits when the location and the scale parameters change simultaneously. We also compare the efficiency of the proposed method with that of Mukherjee and Chakraborti (2012).

A Study on the Computer Application and Learning Model in the CAQC Education (CAQC교육에 있어서 컴퓨터 활용과 학습모델에 관한 연구 - 히스토그램을 중심으로 한 학습모델 -)

  • Choi Myung-Ho
    • Journal of Engineering Education Research
    • /
    • v.3 no.2
    • /
    • pp.3-13
    • /
    • 2000
  • The paper has analyzed and summarized about the theoretical problem occurred in the CAQC, and has developed the learning model focused on the histogram as a case study. The range of study is to systematize the basic method of histogram generally used, and to make step by step procedures under the interactive relation with the improvement of the theory that must be added in case of the calculation by the aided of MS-Excel software. A histogram is the theory to understand the population distribution from which samples are extracted, so alternative methods are presented to estimate the population shape through an experiment and a practice. In order to enlarge the application area of the histogram in the factory, the theory of normal test, the criteria of process capability index and the probability calculation of PPM are added to the histogram. The learning model of CAQC education is proposed that is consistent with the target of histogram to control and search the cause of item defectives fast and correctly.

  • PDF

Characterization of Weed Occurrence in Major Horticultural Crops - III. Phenological Aspects of Major Weeds (원예경작지(園藝耕作地)에서의 잡초발생(雜草發生) 특성에 관(關)한 연구(硏究) - III. 주요잡초종(主要雜草種)의 발생계절성(發生季節性))

  • Woo, I.S.;Pyon, J.Y.;Guh, J.O.
    • Korean Journal of Weed Science
    • /
    • v.9 no.2
    • /
    • pp.130-140
    • /
    • 1989
  • 1) Dormancy brocken weed seeds were planted in soil at 15 days interval from June to December in 1986 and 1987 and test of normality and normal distribution curve were made to determine seasonal distribution characteristics of weed emergence in fields. Monthly emergence distribution pattern of each species can be concluded as following normal distribution equations. E. crusgalli $y={\frac{1}{2.52{\sqrt{2{\pi}}}}}e^{-{\frac{(x-10.057)^2}{12.7}}}$ E. indica $y={\frac{1}{2.17{\sqrt{2{\pi}}}}}e^{-{\frac{(x-9.16)^2}{9.45}}}$ A. lividus $y={\frac{1}{7.74{\sqrt{2{\pi}}}}}e^{-{\frac{(x-10.06)^2}{15.46}}}$ S. nigrum $y={\frac{1}{2.7{\sqrt{2{\pi}}}}}e^{-{\frac{(x-9.695)^2}{14.58}}}$ C. busrsa-pastoris $y={\frac{1}{2.83{\sqrt{2{\pi}}}}}e^{-{\frac{(x-9.02)^2}{16.02}}}$ D. sanguinalis $y={\frac{1}{2.8{\sqrt{2{\pi}}}}}e^{-{\frac{(x-8.58)^2}{15.67}}}$ S. viridis $y={\frac{1}{2.72{\sqrt{2{\pi}}}}}e^{-{\frac{(x-9.36)^2}{14.8}}}$ C. album $y={\frac{1}{2.596{\sqrt{2{\pi}}}}}e^{-{\frac{(x-8.07)^2}{13.48}}}$ P. oleraeda $y={\frac{1}{2.45{\sqrt{2{\pi}}}}}e^{-{\frac{(x-10.83)^2}{12.01}}}$ 2) Emergence peak period of weed species tested were from the end of May to early August and yearly variation of emergence was observed in E. crus-galli, S. viridis, S, nigrum, and P. oleracea and this fact may more related to rainfall pattern rather than temperature.

  • PDF

Probability-Based USD Code for Reinforced Concrete (확률이론(確率理論)에 기초(基礎)한 철근(鐵筋)콘크리트 강도설계규준(强度設計規準))

  • Cho, Hyo Nam;Chang, Dong Il;Shin, Jae Chul
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.6 no.4
    • /
    • pp.53-60
    • /
    • 1986
  • This study is directed to propose a probability based LRFD design code, which could possibly replace the traditional USD provisions of the current code, based on the AFOSM reliability theory. The uncertainties of resistances and load effects for each R.C. structural elements are evaluated and adopted considering our practice, and a set of rational target reliability indices are selected based on the calibration with the reliability of the current R.C. design code and by considering the desired hierarchy of safety level. Then, a set of common load factors are chosen from the results of load and resistance factors which are computed by AFOSM method using the Rackwitz-Fiessler's efficient practical algorithm which is to transform the non-normal variables into the equivalent normal variables. It may be asserted that the proposed LRFD code for the R.C. building structures may have to be incorporated into the current RC. design codes as a design provision corresponding to the USD provisions of the current R.C. design code.

  • PDF

Development of a Gene's Functional Classifying System for a Microarray Data using a Gene Ontology (유전자 온톨로지를 이용한 마이크로어레이 데이터의 유전자 기능 분석 시스템의 개발)

  • Lee, Jong-Keun;Park, S.S.;Hong, D.W.;Yoon, J.H.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.246-251
    • /
    • 2006
  • 마이크로어레이 실험은 수 천에서 수 만개의 유전자 발현 결과를 동시에 측정할 수 있어 질병의 발현 형질 분류 등에 유용하게 이용되고 있다. 그러나 마이크로어레이 실험은 동일한 플랫폼의 실험이라 할지라도 환경 등에 따라 그 실험 결과에 차이가 나는 등 오차를 항상 포함하고 있다. 또한 마이크로어레이 실험은 아직 고가의 실험으로 분류되어 다수의 샘플에 대한 반복 실험 결과를 얻기 어려운 상황이다. 따라서 이종의 플랫폼, 데이터 포맷, 정규화 기법 등이 서로 다른 데이터를 효율적으로 통합하여 유용한 정보를 추출하는 새로운 방식의 개발이 필요하다. 본 논문은 이와 같은 문제를 해결하기 위한 기초 단계 연구 결과이다. 마이크로어레이 실험 데이터로부터 통계적 방법을 이용하여 유의(informative) 유전자를 추출하고 유전자 온톨로지(Gene Ontology : GO)와의 연계를 통하여 유전자 정보의 기능적 분류 결과를 사용자에게 제공하는 유전자 기능 분석 시스템의 설계 및 구현 방안을 보인다. 본 시스템의 실험방법에서는 3-Fold Filtering 기법을 통하여 발현 차가 큰 유전자를 추출하고, t-검정 기법에 의하여 이들 유전자를 순위화 하였으며, 이 중 상위 100개의 유전자를 유의 유전자로 추출하였다. 다음, 이 들 유의 유전자의 t-검정 값을 GO의 유전자 기능을 나타내는 해당 텀 (term)에 가중치로 부과하여 각 유전자들과 기능적으로 연관성이 높은 텀들을 추출한다. 또한 본 연구의 유효성을 검증하기 위하여 본 시스템에 의한 마이크로어레이 데이터 분석 결과를 전문가에 의한 유전자 기능 분석 결과와 비교한다.투명성 있는 서비스를 제공하고 높은 신뢰성과 안정성이 확보될 수 있도록 구성하고자 한다. Query 수행을 여러 서버로 분산처리하게 함으로써 성능에 대한 신뢰성을 향상 시킬 수 있는 Load Balancing System을 제안한다.할 때 가장 효과적인 라우팅 프로토콜이라고 할 수 있다.iRNA 상의 의존관계를 분석할 수 있었다.수안보 등 지역에서 나타난다 이러한 이상대 주변에는 대개 온천이 발달되어 있었거나 새로 개발되어 있는 곳이다. 온천에 이용하고 있는 시추공의 자료는 배제하였으나 온천이응으로 직접적으로 영향을 받지 않은 시추공의 자료는 사용하였다 이러한 온천 주변 지역이라 하더라도 실제는 온천의 pumping 으로 인한 대류현상으로 주변 일대의 온도를 올려놓았기 때문에 비교적 높은 지열류량 값을 보인다. 한편 한반도 남동부 일대는 이번 추가된 자료에 의해 새로운 지열류량 분포 변화가 나타났다 강원 북부 오색온천지역 부근에서 높은 지열류량 분포를 보이며 또한 우리나라 대단층 중의 하나인 양산단층과 같은 방향으로 발달한 밀양단층, 모량단층, 동래단층 등 주변부로 NNE-SSW 방향의 지열류량 이상대가 발달한다. 이것으로 볼 때 지열류량은 지질구조와 무관하지 않음을 파악할 수 있다. 특히 이러한 단층대 주변은 지열수의 순환이 깊은 심도까지 가능하므로 이러한 대류현상으로 지표부근까지 높은 지온 전달이 되어 나타나는 것으로 판단된다.의 안정된 방사성표지효율을 보였다. $^{99m}Tc$-transferrin을 이용한 감염영상을 성공적으로 얻을 수 있었으며, $^{67}Ga$-citrate

  • PDF

Improvement of the Method using the Coefficient of Variation for Automatic Multi-segmentation Method of a Rating Curve (수위-유량관계곡선의 자동구간분할을 위한 변동계수 활용기법의 개선)

  • Kim, Yeonsu;Kim, Jeongyup;An, Hyunuk;Jung, Kwansue
    • Journal of Korea Water Resources Association
    • /
    • v.48 no.10
    • /
    • pp.807-816
    • /
    • 2015
  • In general, the water stage-discharge relationship curve is established based on the assumptions of linearity and homoscedasticity. However, the relationship between the water stage and discharge is affected from geomorphological factors, which violates the basic assumptions of the water stage-discharge relationship curve. In order to reduce the error due to the violations, the curve is divided into several sections based on the manager's judgement considering change of cross-sectional shape. In this research, the objective-splitting criteria of the curve is proposed based on the measured data without the subjective decision. First, it is assumed that the coefficient of variation follows the normal distribution. Then, if the newly calculated coefficient of variation is outside of the 95% confidential interval, the curve is divided. Namely, the groups is divided by the characteristics of the coefficient of variation and the reasonable criteria is provided for establishing a multi-segmented rating curve. To validate the proposed method, it was applied to the data generated by three artificial power functions. In addition, to confirm the applicability of the proposed method, it is applied to the water stage and discharge data of the Muju water stage gauging station and Sangegyo water stage gauging station. As a result, it is found that the automatically divided rating curve improves the accuracy and extrapolation accuracy of the rating curve. Finally, through the residual analysis using Shapiro-Wilk normality test, it is confirmed that the residual of water stage-discharge relationship curve tends to follow the normal distribution.