• 제목/요약/키워드: Multivariate Statistical Analysis

검색결과 632건 처리시간 0.03초

붓스트랩을 이용한 다차원척도법의 효율성 연구 (A study on the efficiency of multidimensional scalin using bootstrap method)

  • 김우종;강기훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.301-309
    • /
    • 2009
  • 다차원척도법은 다변량분석에서 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 비유사성을 측정하고, 그 값들 혹은 반복하여 측정된 경우에는 그 값들의 평균을 이용하여 개체들을 저차원의 공간상에 도시화시켜 표현하는 분석방법이다. 본 논문에서는 응답자의 답변에 기초하여 비유사성을 측정할 때 이상치 또는 응답자의 답변이 불성실할 경우 발생하는 변이문제와 개체들 간의 거리에 대한 통계적 추론 문제에 붓스트랩 방법을 적용하는 내용을 다루고, 활용가능성을 무료일간지에 대한 유사성 평가 자료를 이용하여 실증적으로 분석하였다.

  • PDF

Investigating the performance of different decomposition methods in rainfall prediction from LightGBM algorithm

  • Narimani, Roya;Jun, Changhyun;Nezhad, Somayeh Moghimi;Parisouj, Peiman
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.150-150
    • /
    • 2022
  • This study investigates the roles of decomposition methods on high accuracy in daily rainfall prediction from light gradient boosting machine (LightGBM) algorithm. Here, empirical mode decomposition (EMD) and singular spectrum analysis (SSA) methods were considered to decompose and reconstruct input time series into trend terms, fluctuating terms, and noise components. The decomposed time series from EMD and SSA methods were used as input data for LightGBM algorithm in two hybrid models, including empirical mode-based light gradient boosting machine (EMDGBM) and singular spectrum analysis-based light gradient boosting machine (SSAGBM), respectively. A total of four parameters (i.e., temperature, humidity, wind speed, and rainfall) at a daily scale from 2003 to 2017 is used as input data for daily rainfall prediction. As results from statistical performance indicators, it indicates that the SSAGBM model shows a better performance than the EMDGBM model and the original LightGBM algorithm with no decomposition methods. It represents that the accuracy of LightGBM algorithm in rainfall prediction was improved with the SSA method when using multivariate dataset.

  • PDF

프로파일 분석에서의 다변량 검정법 비교 연구 (A Study on Multivariate Tests in the Profile Analysis)

  • 박진경;박태성
    • 응용통계연구
    • /
    • 제12권1호
    • /
    • pp.97-107
    • /
    • 1999
  • 프로파일 분석은 반복측정 자료를 분석하는데 있어서 널리 사용되는 다변량 분석모형이다. 프로파일 분석에서는 처리 그룹간의 비교와 반응 프로파일의 평행성 검정을 위해서 4가지 검정통계량이 널리 사용되고 있다. 이들 검정통계량은 Wilks의 통계량($\Lambda$), Pillai's Trace 통계량(V), Hotelling-Lawley Trace 통계량(U), Roy's Maximum Root 통계량($\Theta$ )이다. 그 동안 이들 통계량들을 비교하기 위한 여러 연구가 있었지만 주로 일반적인 다변량 분산분석 모형에 근거한 비교였다. 본 논문에서는 자료가 반복측정 자료이고 우리의 관심이 프로파일 분석에 있을 때에 이 4가지 통계량의 비교에 초점을 맞추었다.

  • PDF

동적 평행좌표그림과 그의 활용 (The dynamic parallel coordinate plot and its applincations)

  • 장대흥;양수정
    • 응용통계연구
    • /
    • 제9권1호
    • /
    • pp.45-52
    • /
    • 1996
  • 자료의 구조와 특징을 파악하기 위한 탐색적 자료분석을 행할 때 유용한 수단으로 통계 그래픽스가 이용된다. 평행좌표그림(parallel coordinate plot)을 통계 그래픽스의 한 방법인 동적 그래픽스로서 이용하기 위하여 동적 평행좌표그림이 쓰이는데, 이 도구를 이용하면 3차원 이상의 다차원 자료를 동적 그래픽스로 표현, 분석할 수 있다. 본 논문에서는 하나의 동적 평행좌표그림을 제시하고, 자료분석의 예를 보였다.

  • PDF

Prognostic Value of Peritoneal Washing Cytology in Gynecologic Malignancies: a Controversial Issue

  • Binesh, Fariba;Akhavan, Ali;Behniafard, Nasim;Zabihi, Somayeh;Hosseinizadeh, Elhamsadat
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권21호
    • /
    • pp.9405-9410
    • /
    • 2014
  • Purpose: To evaluate the prognostic impact of peritoneal washing cytology in patients with endometrial and ovarian cancers. Materials and Methods: We retrospectively identified 86 individuals with ovarian carcinomas, ovarian borderline tumors and endometrial adenocarcinomas. The patients had been treated at Shahid Sadoughi Hospital and Ramazanzadeh Radiotherapy Center, Yazd, Iran between 2004 and 2012. Survival differences were determined by Kaplan-Meier analysis. Multivariate analysis was performed using the Cox regression method. A p<0.05 value was considered statistically significant. Results: There were 36 patients with ovarian carcinomas, 4 with borderline ovarian tumors and 46 with endometrial carcinomas. The mean age of the patients was $53.8{\pm}15.2years$. In patients with ovarian carcinoma the overall survival in the negative cytology group was better than the patients with positive cytology although this difference failed to reach statistical significance (p=0.30). At 0 to 50 months the overall survival was better in patients with endometrial adenocarcinoma and negative cytology than the patients with positive cytology but then it decreased (p=0.85). At 15 to 60 months patients with FIGO 2009 stage IA-II endometrial andocarcinoma and negative peritoneal cytology had a superior survival rate compared to 1988 IIIA and positive cytology only, although this difference failed to reach statistical significance(p=0.94). Multivariate analysis using Cox proportional hazards model showed that stage and peritoneal cytology were predictors of death. Conclusions: Our results show good correlation of peritoneal cytology with prognosis in patients with ovarian carcinoma. In endometrial carcinoma it had prognostic importance. Additional research is warranted.

잠재변수 모형에서의 군집효율을 이용한 변수선택 (Variable selection for latent class analysis using clustering efficiency)

  • 김성경;서병태
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.721-732
    • /
    • 2018
  • 잠재집단 모형은 다변량 범주형 자료 안에 숨겨진 집단을 찾는 매우 중요한 도구종의 하나이다. 하지만 실제 자료분석에서 너무 많은 관찰변수들을 포함시킨 모형은 모형을 복잡하게 만들고 또한 모수추정의 정확도에 영향을 주기 때문에 정보가 손실되지 않는 내에서 유용한 변수를 찾는 것은 중요한 문제이다. Dean과 Raftery (2010)은 잠재집단 모형에서의 변수선택을 위해 BIC를 이용한 Headlong search 알고리즘을 제시하였는데 본 논문에서는 이 방법을 대체할 수 있는 방법으로 적합한 모형으로부터 계산된 잠재집단에 속할 사후확률을 이용하여 변수 선택을 하는 방법을 제안하고자 한다. 이를 위하여 잠재집단 모형의 적합성을 측정할 수 있는 새로운 통계량과 이를 이용한 변수선택 알고리즘을 제시할 것이다. 또한 제안된 방법의 효율성을 모의실험과 실증자료 분석을 통해 살펴보고자 한다.

위암 환자의 예후인자로서 림프관 정맥 및 신경 침범의 의의 (The Significance of Lymphatic, Venous, and Neural Invasion as Prognostic Factors in Patients with Gastric Cancer)

  • 김치호;장석원;강수환;김상운;송선교
    • Journal of Gastric Cancer
    • /
    • 제5권2호
    • /
    • pp.113-119
    • /
    • 2005
  • 목적: 표준화된 술식으로 위절제술을 시행한 위암 환자를 대상으로 임상병리학적 특성, 특히 암세포의 림프관, 정맥 및 신경 침범 유무가 환자의 예후에 미치는 영향을 확인 하고자 하였다. 대상 및 방법: 1995년 1월부터 1999년 12월까진 만 5년간 영남대학교 의과대학 부속병원 외과에서 위암으로 진단되어 위절제를 시행받은 1,018명의 의무기록을 토대로 후향적 연구를 시행하였다. 통계는 chi-dquare test를 이용하고 예후 인자들은 Cox proportional hazards regression model을 사용한 다변량 분석을 통해 분석하였다. 생존율은 Kaplan-Meier 방법으로 5년 생존율을 구하고 log-rank test로 검정하였다. 유의 수준은 P < 0.05를 기준으로 하였다. 통계처리는 SPSS for Windows (Version 10.0, SPSS lnc, USA) 프로그램을 이용하였다. 결과: 각 임상병리학적 특성에 대한 단변량 분석 결과, 환자의 연령, 종양의 크기 및 위치, Borrmann형, 조직 분화도, 위절제술의 범위, 암의 위벽 침윤도, 림프절 전이 정도, 병기, 원격 전이 유무, 수술의 근치도 등이 유의하였으며, 이상의 유의한 인다들을 다변량 분석한 결과 암의 위벽 침윤도, 림프절 전이, 림프관 침범, 신경 침범 및 수술의 근치도가 독립적 예후 인자로서 유의하였다. 결론: 기존의 TNM 병기 분류법이 병의 진행 상태를 객관적으로 표현할 수 있고 기본적인 예후 인자로서 역할을 하지만, 병리조직학적 검사 소견에서 림프관 및 신경 침범 유무를 확인하는 것은 위암의 예후 판정에 추가적인 정보를 제공할 수 있을 것으로 기대한다.

  • PDF

방사성폐기물 처분을 위한 결정질 기반암의 지하수 수질 평가 (Evaluation of Groundwater Quality in Crystalline Bedrock Site for Disposal of Radioactive Waste)

  • 이정환;정해룡;정재열;박주완;윤시태
    • 방사성폐기물학회지
    • /
    • 제12권4호
    • /
    • pp.275-286
    • /
    • 2014
  • 본 연구에서는 결정질 기반암에 위치하는 12개 시추공의 지하수 수질을 분석하여, 다변량 통계 분석법을 활용하여 지하수 수질 진화 특성 및 성분 기원을 평가하였다. 지하수 수질 유형은 Na(Ca)-$HCO_3$형과 Ca-$HCO_3$형이 가장 우세하여, 물-암석 반응에 의한 직접적인 양이온 교환 반응($Ca^{2+}{\rightarrow}Na^+$)을 지시하며, 현장 지하수 특성과 실내 지하수 분석 결과에 기초한 연구지역의 지하수 수질 진화는 초기 내지 중간 정도의 단계를 지시하는 것으로 사료된다. 다변량 분석 결과, 인위적인 기원인 $NO_3{^-}$와 다른 성분들 간의 상관성을 살펴보면, $Na^+$, $Cl^-$와 양의 상관성을 나타난다. 염무의 기원인 $Cl^-$와는 $Na^+$, $SO{_4}^{2-}$, $Mg^{2+}$, $K^+$와 양의 상관성을 나타낸다. 그러나 다른 성분들($Ca^{2+}$, $Fe^{2+}$, $HCO_3{^-}$, $F^-$, $SiO_2$)과는 상관성이 나타나지 않는다. $Cl^-$ 농도가 일반적인 지하수 수질 범위에 포함되고 $NO_3{^-}$ 농도는 먹는물 수질기준치 이하로서 농도가 매우 낮으며, 대부분의 광물에 대해서 지하수 화학성분들은 불포화상태를 지시한다. 따라서, 연구지역의 수질 성분들은 대부분 물-암석 반응을 통한 자연적인 기원을 지시하고 부분적으로는 자연적인 염무와 농업과 관련된 인위적인 오염으로부터 기인된다.

사고 특성요인들의 다중대응분석에 기반한 연구실안전 개선 방안 (Improvement Implication of Research Lab Safety based on Multiple Correspondence Analysis of Accident-related Factors)

  • 임현교;김윤태
    • 한국안전학회지
    • /
    • 제39권1호
    • /
    • pp.104-113
    • /
    • 2024
  • Unlike in general manufacturing process, safety management in laboratory-based research area is complicated because the latter generally involves trying untested methods or handling unusual substances in small amounts. Laboratory accidents in South Korea have recently shown an increasing trend. Unfortunately, statistics on such accidents are not officially published by any domestic public agencies. In this study, multivariate analysis was performed on the relationships between variables to develop effective strategies for preventing laboratory accidents. A Cross-Tabulation Analysis of accident-related factors in 179 accident cases revealed that the laboratory type, accident type, and unsafe-act type are all statistically significant, whereas the unsafe condition and management factors differ with the statistical criteria. Furthermore, the results of a Multiple-Correspondence Analysis showed that accidents can be divided largely into three groups having different accident causes and injury types; this confirms the necessity of different strategies to prevent accidents of each type. The findings also reveal differences between the distribution of accident types mentioned in the accident case collection books and actual reported cases. This suggests that an official statistical system administered by a public institution would be necessary for effective prevention of laboratory accidents.

Independent Predictors for Recurrence of Chronic Subdural Hematoma

  • Jung, Yoon-Gyo;Jung, Na-Young;Kim, El
    • Journal of Korean Neurosurgical Society
    • /
    • 제57권4호
    • /
    • pp.266-270
    • /
    • 2015
  • Objective : Chronic subdural hematoma (CSDH) is one of the most frequent problems encountered in neurosurgery. Although burr-hole trephination is widely performed to treat CSDH, the incidence rate of recurrent CSDH is still 2-37%. The goal of this study is to determine the risk factors that affect recurrent CSDH. Methods : A total of 182 patients were included in this study who underwent burr-hole trephination. The clinical factors and radiographic features between the recurrence and the no recurrence groups were analyzed to find the parameters related to the postoperative recurrence of CSDH. Results : For the recurrence of CSDH that occurred in 25 patients (13.7%), among various risk factors, pre and postoperative midline displacements, which are more than 10 mm (p=0.000), and preoperative hemiparesis (p=0.026) had contributed to recurrent CSDH with statistical significance by univariate analysis. Unilateral CSDH were more frequently related to recurrent CSDH (16.3%), although it was not a statistical significant result (p=0.052). Furthermore, preoperative midline displacement only had statistical meaning for the recurrence of CSDH by multivariate analysis. Conclusion : This study indicates that the midline displacement on the preoperative computed tomography scan is the only independent predictor for the recurrence of CSDH.