• 제목/요약/키워드: Data interpretation, statistical

검색결과 174건 처리시간 0.031초

후미추돌사고의 속도변화와 승차자 상해에 관한 실증적 분석 (An empirical study on the relationship of speed change and injuries subjected by rear-end collisions)

  • 강성모;김주환
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.797-807
    • /
    • 2009
  • 후미추돌사고가 발생하면 사고의 규모인 차량손상정도와 승차자 상해는 속도변화에 영향을 받는다. 본 연구는 서울, 인천 지역에서 발생한 실제 사고사례자료로부터 사진판독에 의해 손상깊이를 측정하고 사고개황 및 속도에 관한 진술 자료로부터 속도변화를 산출하였으며, 진단기간, 입원일 등 상해발생관련 자료를 수집하였다. 손상깊이와 승차자의 상해.무상해의 유무 및 증상기간의 예측평가를 위한 손상깊이와 입원치료기간에 대한 관계영역도표를 구하여 실증적인 자료와 비교하였다. 또한, 수집한 실제 사고자료의 진단기간 및 입원일 등 상해정도는 통계분석결과 객관적 충격정도인 피추돌차의 손상깊이 및 속도변화와 전혀 상관관계가 없는 것으로 나타났는데, 이는 선행연구와 본 연구의 통계분석결과를 종합하여 설정한 상해역치에 미달하는 대인사고 사례가 약 78.1%로 거짓 또는 과장된 상해주장이 많은 것으로 나타났다. 향후 상해주장에 대한 인정은 사고 규모에 대한 객관적 정보의 제공 및 본 연구에서 제시한 상해역치 수준의 적용은 유용할 것으로 사료된다.

  • PDF

토픽 모형을 이용한 텍스트 데이터의 단어 선택 (Feature selection for text data via topic modeling)

  • 장우솔;김예은;손원
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.739-754
    • /
    • 2022
  • 텍스트 데이터는 일반적으로 많은 변수를 포함하고 있으며 변수들 사이의 연관성도 높아 통계 분석의 정확성, 효율성 등에서 문제가 생길 수 있다. 이러한 문제점에 대처하기 위해 목표 변수가 주어진 지도 학습에서는 목표 변수를 잘 설명할 수 있는 단어들을 선택하여 이 단어들만 통계 분석에 이용하기도 한다. 반면, 비지도 학습에서는 목표 변수가 주어지지 않으므로 지도 학습에서와 같은 단어 선택 절차를 활용하기 어렵다. 이 연구에서는 토픽 모형을 이용하여 지도 학습에서의 목표 변수를 대신할 수 있는 토픽을 생성하고 각 토픽별로 연관성이 높은 단어들을 선택하는 단어 선택 절차를 제안한다. 제안된 절차를 실제 텍스트 데이터에 적용한 결과, 단어 선택 절차를 이용하면 많은 토픽에서 공통적으로 자주 등장하는 단어들을 제거함으로써 토픽을 더 명확하게 식별할 수 있었다. 또한, 군집 분석에 적용한 결과, 군집과 범주 사이에 높은 연관성을 가지는 군집 분석 결과를 얻을 수 있는 것으로 나타났다. 목표 변수에 대한 정보없이 토픽 모형을 이용하여 선택한 단어들을 분류 분석에 적용하였을 때 목표 변수를 이용하여 단어들을 선택한 경우와 비슷한 분류 정확성을 얻을 수 있음도 확인하였다.

DESIGN AND ANALYSIS OF RANDOMIZED CLINICAL TRIALS REQUIRING PROLONGED OBSERVATION OF EACH PATIENT I. INTRODUCTION AND DESIGN

  • Peto R.;Pike M.C.;Armitage P.;Breslow N.E.;Cox D.R.;Howard S.V.;Mantel N.;Mcpherson K.;Peto J.;Smith P.G.
    • 대한예방의학회:학술대회논문집
    • /
    • 대한예방의학회 1994년도 교수 연수회(역학)
    • /
    • pp.206-233
    • /
    • 1994
  • The Medical Research Council has for some years encouraged collaborative clinical trials in leukaemia and other cancers, reporting the results in the medical literature. One unreported result which deserves such publication is the development of the expertise to design and analyse such trials. This report was prepared by a group of British and American statisticians, but it is intended for people without any statistical expertise. Part!, which appears in this issue, discusses the design of such trials; Part II, which will appear separately in the January 1977 issue of the Journal, gives full instructions for the statistical analysis of such trials by means of life tables and the logrank test, including a worked example, and discusses the interpretation of trial results, including brief reports of particular trials. Both parts of this report are relevant to all clinical trials which study time to death, and would be equally relevant to clinical trials which study time to other particular classes of untoward event: first stroke, perhaps, or first relapse, metastasis, disease recurrence, thrombosis, transplant rejection, or death from a particular cause. Part I, in this issue, collects together ideas that have mostly already appeared in the medical literature, but Part II, next month, is the first simple account yet published for non-statistical physicians of how to analyse efficiently data from clinical trials of survival duration. Such trials include the majority of all clinical trials of cancer therapy; in cancer trials, however, it may be preferable to use these statistical methods to study time to local recurrence of tumour, or to study time to detectable metastatic spread, in addition to studying total survival. Solid tumours can be staged at diagnosis; if this, or any other available information in some other disease is an important determinant of outcome, it can be used to make the overall logrank test for the whole heterogeneous trial population more sensitive, and more intuitively satisfactory, for it will then only be necessary to compare like with like, and not, by chance, Stage I with Stage III.

  • PDF

Probability Estimation of Snow Damage on Sugi (Cryptomeria japonica) Forest Stands by Logistic Regression Model in Toyama Prefecture, Japan

  • Kamo, Ken-Ichi;Yanagihara, Hirokazu;Kato, Akio;Yoshimoto, Atsushi
    • Journal of Forest and Environmental Science
    • /
    • 제24권3호
    • /
    • pp.137-142
    • /
    • 2008
  • In this paper, we apply a logistic regression model to the data of snow damage on sugi (Cryptomeria japonica) occurred in Toyama prefecture (in Japan) in 2004 for estimating the risk probability. In order to specify the factors effecting snow damage, we apply a model selection procedure determining optimal subset of explanatory variables. In this process we consider the following 3 information criteria, 1) Akaike's information criterion, 2) Baysian information criterion, 3) Bias-corrected Akaike's information criterion. For the selected variables, we give a proper interpretation from the viewpoint of natural disaster.

  • PDF

데크플레이트의 웨브국부좌굴에 관한 내력식 제안 (A Proposal for Strength Formula of Web Crippling in Trapezoidal Sheeting)

  • 신태송
    • 한국강구조학회 논문집
    • /
    • 제13권6호
    • /
    • pp.641-649
    • /
    • 2001
  • 본 논문에서는 데크플레이트의 웨브 국부좌굴에 관한 실용적인 내력식을 제안하고자 한다. 실험에서 유추된 해석모델을 이론적으로 규명한 기존의 연구를 바탕으로 내력에 영향을 미치는 주요 변수들을 조사 분석하여 관련 함수들을 유도한다. 각 변수들을 기존의 실험자료와 종합적으로 비교 분석하여 간편한 내력식을 제안한다. 유럽기준 EC 3 부록 Z 에 따른 통계평가로부터 저항 부분안전계수 ${\gamma}_M$ 을 구하며 목표로 하는 값 1.1과 비교되어진다.

  • PDF

Application of Clustering Methods for Interpretation of Petroleum Spectra from Negative-Mode ESI FT-ICR MS

  • Yeo, In-Joon;Lee, Jae-Won;Kim, Sung-Hwan
    • Bulletin of the Korean Chemical Society
    • /
    • 제31권11호
    • /
    • pp.3151-3155
    • /
    • 2010
  • This study was performed to develop analytical methods to better understand the properties and reactivity of petroleum, which is a highly complex organic mixture, using high-resolution mass spectrometry and statistical analysis. Ten crude oil samples were analyzed using negative-mode electrospray ionization Fourier transform ion cyclotron resonance mass spectrometry (ESI FT-ICR MS). Clustering methods, including principle component analysis (PCA), hierarchical clustering analysis (HCA), and k-means clustering, were used to comparatively interpret the spectra. All the methods were consistent and showed that oxygen and sulfur-containing heteroatom species played important roles in clustering samples or peaks. The oxygen-containing samples had higher acidity than the other samples, and the clustering results were linked to properties of the crude oils. This study demonstrated that clustering methods provide a simple and effective way to interpret complex petroleomic data.

교량의 경험적 손상도 곡선 (Empirical Fragility Curves for Bridge)

  • 이종헌;김운학;최정호
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제6권1호
    • /
    • pp.255-262
    • /
    • 2002
  • This paper presents a statistical analysis of empirical fragility curves for bridge. The empirical fragility curves are developed utilizing bridge damage data obtained from the 1995 Hyogoken Nanbu(Kobe) earthquake. Two-parameter lognormal distribution functions are used to represent the fragility curves with the parameters estimated by the maximum likelihood method. This paper also presents methods of testing the goodness of fit of the fragility curves and estimating the confidence intervals of the two parameters(median and log-standard deviation) of the distribution. An analytical interpretation of randomness and uncertainty associated with the median is provided.

AN EVALUATION OF FACTORS AFFECTING THE SELECTION OF BUILDING CONTRACTORS: THE CASE OF NIGERIA

  • K.T. Odusanmi;H.N Onukwube;C.C. Ekwoanya;F.O Achi
    • 국제학술발표논문집
    • /
    • The 2th International Conference on Construction Engineering and Project Management
    • /
    • pp.830-836
    • /
    • 2007
  • This paper is concerned with identifying the importance of the pre-qualification factors used in selecting contractors and also in determining the importance of various criteria used for the award of contract. The study was carried out through questionnaire survey administered to a population of 60 respondents in consultancy and client's organisation. The data analysis included a statistical comparison of means and interpretation. The result of this study showed that experience of the contractor is the most important prequalification factor while technical expertise is the most important criteria in the award of contract. The result of this study will enable clients, consultants and contractors to lay emphasis on the influencing factors in terms of pre-qualification and award of contract.

  • PDF

격자형 지질정보의 자료유도 통합을 위한 이론적 배경 (Theoretical Background for Data-driven Integration of Raster-based Geological Information)

  • 이기원;지광훈
    • 대한공간정보학회지
    • /
    • 제3권1호
    • /
    • pp.115-121
    • /
    • 1995
  • 최근 지리정보시스템의 여러 지질학적 응용 중에서 광물탐사를 위한 격자형 자료의 공간적 통합론에 관한 연구가 많이 이루어지고 있다. 본 연구에서는 보통 확률, 통계적 배경을 갖는 목표유도형방법과 구분되는 자료유도형 방법의 예로서 Dempster-Shafer의 이론과 퍼지이론의 이론적 배경을 자료재표현의 원리와 자료통합논리에 입각하여 설명하고자 한다. 기존의 지질, 지화학 및 물리탐사정보를 이용한 시해 연구에서 위의 두 이론은 광물탐사문제에 상당히 유용한 결정보조 정보를 제공하는 것으로 입증되고 있으며, 본 연구에서 논의된 몇 가지 관련 사항들은 이 이론들의 보다 적절한 실제 적용 및 해석에 도움이 될 것으로 생각된다.

  • PDF

An Experimental Estimation of Two Detection Limit Models

  • Ma Chang-Jin;Tohno Susumu;Kasahara Mikio;Kang Gong-Unn
    • Journal of Korean Society for Atmospheric Environment
    • /
    • 제20권E1호
    • /
    • pp.29-33
    • /
    • 2004
  • In environmental studies, decisions are often made on the analytical data indicating certain contaminants as being 'detected' or 'non-detectible.' Since detection limits are analytical method specific, one has to first review the concepts and definitions associated with analytical method systems and specifications. In this study, the experimental analytical values for a series of low level standards (for an ionic species) were used as an example to estimate two different method detection limits (MDL). The scores of EPA's MDL and Pallesen's MDL determined by real analytical scores are 0.0575 and 0.0561 mg/L, respectively for our nitrate data. These scores determined by two different MDL models are roughly similar, while there are apparent differences between two methods with respect to statistical and systematical procedure. However, determination of MDL for one's laboratory provides some practical applications which helps to assure one's regulating authorities that one's measured scores are accurate.