• 제목/요약/키워드: split data

검색결과 591건 처리시간 0.028초

Prognostic Evaluation of Categorical Platelet-based Indices Using Clustering Methods Based on the Monte Carlo Comparison for Hepatocellular Carcinoma

  • Guo, Pi;Shen, Shun-Li;Zhang, Qin;Zeng, Fang-Fang;Zhang, Wang-Jian;Hu, Xiao-Min;Zhang, Ding-Mei;Peng, Bao-Gang;Hao, Yuan-Tao
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권14호
    • /
    • pp.5721-5727
    • /
    • 2014
  • Objectives: To evaluate the performance of clustering methods used in the prognostic assessment of categorical clinical data for hepatocellular carcinoma (HCC) patients in China, and establish a predictable prognostic nomogram for clinical decisions. Materials and Methods: A total of 332 newly diagnosed HCC patients treated with hepatic resection during 2006-2009 were enrolled. Patients were regularly followed up at outpatient clinics. Clustering methods including the Average linkage, k-modes, fuzzy k-modes, PAM, CLARA, protocluster, and ROCK were compared by Monte Carlo simulation, and the optimal method was applied to investigate the clustering pattern of the indices including platelet count, platelet/lymphocyte ratio (PLR) and serum aspartate aminotransferase activity/platelet count ratio index (APRI). Then the clustering variable, age group, tumor size, number of tumor and vascular invasion were studied in a multivariable Cox regression model. A prognostic nomogram was constructed for clinical decisions. Results: The ROCK was best in both the overlapping and non-overlapping cases performed to assess the prognostic value of platelet-based indices. Patients with categorical platelet-based indices significantly split across two clusters, and those with high values, had a high risk of HCC recurrence (hazard ratio [HR] 1.42, 95% CI 1.09-1.86; p<0.01). Tumor size, number of tumor and blood vessel invasion were also associated with high risk of HCC recurrence (all p< 0.01). The nomogram well predicted HCC patient survival at 3 and 5 years. Conclusions: A cluster of platelet-based indices combined with other clinical covariates could be used for prognosis evaluation in HCC.

국제유가의 변동성이 한국 거시경제에 미치는 영향 분석 : EGARCH 및 VECM 모형의 응용 (A Study on the Impact of Oil Price Volatility on Korean Macro Economic Activities : An EGARCH and VECM Approach)

  • 김상수
    • 유통과학연구
    • /
    • 제11권10호
    • /
    • pp.73-79
    • /
    • 2013
  • Purpose - This study examines the impact of oil price volatility on economic activities in Korea. The new millennium has seen a deregulation in the crude oil market, which invited immense capital inflow into Korea. It has also raised oil price levels and volatility. Drawing on the recent theoretical literature that emphasizes the role of volatility, this paper attends to the asymmetric changes in economic growth in response to the oil price movement. This study further examines several key macroeconomic variables, such as interest rate, production, and inflation. We come to the conclusion that oil price volatility can, in some part, explain the structural changes. Research design, data, and methodology - We use two methodological frameworks in this study. First, in regards to the oil price uncertainty, we use an Exponential-GARCH (Exponential Generalized Autoregressive Conditional Heteroskedasticity: EGARCH) model estimate to elucidate the asymmetric effect of oil price shock on the conditional oil price volatility. Second, along with the estimation of the conditional volatility by the EGARCH model, we use the estimates in a VECM (Vector Error Correction Model). The study thus examines the dynamic impacts of oil price volatility on industrial production, price levels, and monetary policy responses. We also approximate the monetary policy function by the yield of monetary stabilization bond. The data collected for the study ranges from 1990: M1 to 2013: M7. In the VECM analysis section, the time span is split into two sub-periods; one from 1990 to 1999, and another from 2000 to 2013, due to the U.S. CFTC (Commodity Futures Trading Commission) deregulation on the crude oil futures that became effective in 2000. This paper intends to probe the relationship between oil price uncertainty and macroeconomic variables since the structural change in the oil market became effective. Results and Conclusions - The dynamic impulse response functions obtained from the VECM show a prolonged dampening effect of oil price volatility shock on the industrial production across all sub-periods. We also find that inflation measured by CPI rises by one standard deviation shock in response to oil price uncertainty, and lasts for the ensuing period. In addition, the impulse response functions allude that South Korea practices an expansionary monetary policy in response to oil price shocks, which stems from oil price uncertainty. Moreover, a comparison of the results of the dynamic impulse response functions from the two sub-periods suggests that the dynamic relationships have strengthened since 2000. Specifically, the results are most drastic in terms of industrial production; the impact of oil price volatility shocks has more than doubled from the year 2000 onwards. These results again indicate that the relationships between crude oil price uncertainty and Korean macroeconomic activities have been strengthened since the year2000, which resulted in a structural change in the crude oil market due to the deregulation of the crude oil futures.

MIKE SHE 모형을 이용한 경안천 유역의 지하수 함양량 산정 (Groundwater Recharge Estimation for the Gyeongan-cheon Watershed with MIKE SHE Modeling System)

  • 김철겸;김현준;장철희;임상준
    • 한국수자원학회논문집
    • /
    • 제40권6호
    • /
    • pp.459-468
    • /
    • 2007
  • 본 연구에서는 대상유역인 경안천 유역 (유역면적 $260km^2$)에 대한 지하수 함양량 추정을 위해, 완전 분포형 모형인 MIKE SHE를 적용하였다. 모형 입력자료로서 DEM 토지이용도, 정밀토양도 등과 같은 GIS 자료를 구축하고, 기상자료를 이용하여 증발산 입력자료를 생성하였다. 유역 최종 출구점인 경안 수위표 지점에서의 유출자료를 활용하여 모형 보정과 검증을 수행한 결과, 관측치의 경향을 잘 모의하는 것으로 나타났으며, 유역내 운영되고 있는 마평 지하수위 관측소의 관측지하수위와 모의치를 비교한 결과도 매우 양호하게 나타났다. 모형을 이용하여 대상유역에 대한 연간 지하수 함양량을 산정하고, 기존의 감수곡선법에 의해 계산된 값과 비교한 결과 비슷한 모의값을 보였다. 결론적으로 모형을 통한 지하수위 모의 및 함양량 모의에 신뢰성이 높게 나타났으며, 함양량의 시공간적인 분포 특성 파악에 유의하게 활용될 수 있을 것으로 생각된다.

면접점수 표준화 방법 모의실험 비교 (Simulation comparison of standardization methods for interview scores)

  • 박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권2호
    • /
    • pp.189-196
    • /
    • 2011
  • 이 연구에서는 면접점수 표준화 방법으로 흔히 사용되고 있는 절사평균 방법, 순위평균 방법 및 z-점수평균 방법을 모의실험을 통해 비교하고자 한다. 모의실험 기법은 피면 접자의 참값 점수와 이것과 독립적인 잡음 변수가 심사자의 전문성에 의해 가중평균 형태로 심사자의 평가점수에 영향을 미친다고 가정한다. 다시 말해 심사자의 전문성이 커지면 개인의 참값 점수에 가까운 심사자의 점수가 관측되고, 심사자의 전문성이 작아지면 참값 점수 대신에 잡음 변수에 더 가까운 심사자의 점수가 관측된다. 여기에 심사자의 성향편의가 더해져 심사자의 최종 평가점수가 관측된다고 가정한다. 이 모의실험에서는 각 표준화 방법에 의한 심사자의 평균점수와 참값의 순위상관 값을 계산하여 이 값이 큰 방법을 좋은 방법으로 평가하였다. 그 결과 참값의 분포가 정규분포이면 z-점수평균이 가장 좋은 성능을 보였으며, 라플라스 분포이면 전체면접에서는 z-점수평균이 순위평균보다 다소 성능이 좋았으나 반분면접에서는 순위평균이 z-점수평균보다 다소 성능이 좋았다. 절사평균은 일반적으로 성능이 가장 낮게 나타났다.

블록 중심 그래프 처리 시스템의 부하 분산을 위한 동적 블록 재배치 기법 (Dynamic Block Reassignment for Load Balancing of Block Centric Graph Processing Systems)

  • 김예원;배민호;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권5호
    • /
    • pp.177-188
    • /
    • 2018
  • 최근 웹, 소셜 네트워크 서비스, 모바일, 사물인터넷 등의 ICT 기술의 발전으로 인해 처리 및 분석이 필요한 그래프 데이터의 규모가 급속하게 증가하였다. 이러한 대규모 그래프 데이터는 단일 기기에서의 처리가 어렵기 때문에 여러 기기에 나누어 분산/병렬 처리하는 것이 필요하다. 기존 그래프 처리 알고리즘들은 단일 메모리 환경을 기반으로 연구되어 분산/병렬 처리환경에 적용되기 힘들다. 이에 대규모 그래프의 보다 효과적인 분산/병렬 처리를 위해 정점 중심 방식의 그래프 처리 시스템들과, 정점 중심 방식의 단점을 보완한 블록 중심 방식의 그래프 처리 시스템들이 등장하였다. 이러한 시스템들은 초기 그래프 분할 상태가 전체 처리 성능에 상당한 영향을 미친다. 한 번에 최적의 상태로 그래프를 분할하는 것은 매우 어려운 문제이므로, 그래프 처리 시간에 점진적으로 그래프 분할 상태를 개선하는 여러 로드 밸런싱 기법들이 연구되었다. 그러나 기존 기법들은 대부분 정점 중심 그래프 처리 시스템을 대상으로 하여 블록 중심 그래프 처리 시스템에 적용이 어렵다. 본 논문에서는 블록 중심 그래프 처리 시스템을 대상으로 적용 가능한 로드 밸런싱 기법을 제안한다. 제안 기법은 동적으로 블록을 재배치하여 점진적으로 그래프 분할 상태를 개선시키며, 해를 찾아나가는 과정에서 지역 최적해를 벗어나기 위한 블록 분할 전략을 함께 제시한다.

보건 관련 공익광고에서 정교화가능성과 해석수준이 광고태도에 미치는 영향 (Public Service Good Health Advertising: Effects of Elaboration Likelihood and Construal Level on Consumer Attitudes)

  • 박종철;김경진
    • 유통과학연구
    • /
    • 제12권6호
    • /
    • pp.67-79
    • /
    • 2014
  • Purpose - This study aims to accomplish three major research goals. First, it strives to change consumers' focus from peripheral routes to a central route of public service advertising related to the good health policy, without problematic effects, by influencing consumers' knowledge or involvement. Second, this study examines the elaboration likelihood model (ELM) and construal level theory (CLT). Specifically, we consider that the central route of ELM might correspond with the focal goal of CLT. Third, this study analyzes ELM through CLT. That is, ELM predicted that low involvement would take the peripheral route, and high involvement would take the central route. Research design, data, and methodology - This study consisted of three experiments. The first experiment had a 2×2 between-subject design. The subjects were university students and the research period was approximately one year. The first independent variable was the involvement of the overweight issue; this variable was measured and split by the median. The second independent variable was the temporal distance (near vs. distant future); this variable was manipulated. The second experiment also had a 2×2 between-subject design. The first variable was the involvement of cervical adenocarcinoma prevention, and was considered already manipulated by sex. Specifically, males had a low involvement of the disease, but females had high involvement. The second independent variable was priming (power vs. submissive). Power priming would induce abstract thinking, but submissive priming would take concrete processing. The third experiment had a 2×2×2 between-subject design. The first variable was cognitive depletion, and was manipulated by memorizing 9-digit numbers. The second and third independent variables were involvement and abstract thinking induction, such as prior experiments. Data were collected through questionnaires, and were analyzed by an SPSS program. Major hypotheses were tested by examining the interaction effects through ANOVA. Results - Major findings are as follows. First, even for low-involved consumers in the overweight category, distant future manipulation induced them to focus not on the peripheral route but on the central route of the public service advertisement. This result does not correspond to the typical ELM prediction. Second, under power priming, low-involved males of the cervical adenocarcinoma category focused on the peripheral route because of the induction to abstract thinking. This result replicated the first experiment, and confirmed the theoretical robustness. Third, high-involved females focused not on the central but on the peripheral route under the mixed condition of cognitive depletion and near future manipulation. Depletion consumed cognitive resources, and the processing mode of consumers changed from systematic to heuristic. Conclusions - ELM needs to be complemented through CLT in context of public service good health advertising. Specifically, the involvement of ELM may impact consumers' thinking mode (abstract vs. concrete), and the interaction effects may influence consumers' focus on advertising (central vs. peripheral route). This study's limitations were bounded subjects, limited stimuli, and somewhat weak external validity.

NAND 플래시 메모리를 위한 로그 기반의 B-트리 (Log-Structured B-Tree for NAND Flash Memory)

  • 김보경;주영도;이동호
    • 정보처리학회논문지D
    • /
    • 제15D권6호
    • /
    • pp.755-766
    • /
    • 2008
  • 최근 NAND 플래시 메모리는 하드 디스크에 비해 작고, 속도가 빠르며, 저 전력 소모 등의 장점을 가지고 있어 차세대 저장 매체로 각광받고 있다. 그러나 쓰기-전-소거 구조, 비대칭 연산 속도 및 단위와 같은 독특한 특징으로 인하여, 디스크 기반의 시스템이나 응용을 NAND 플래시 메모리 상에 직접 구현시 심각한 성능저하를 초래할 수 있다. 특히 NAND 플래시 메모리 상에 B-트리를 구현할 경우, 레코드의 잦은 삽입, 삭제 및 재구성에 의한 많은 양의 중첩 쓰기가 발생할 수 있으며, 이로 인하여 급격한 성능 저하가 발생할 수 있다. 이러한 성능 저하를 피하기 위해 ${\mu}$-트리가 제안되었으나, 잦은 노드 분할 및 트리 높이의 빠른 신장 등의 문제점을 가지고 있다. 본 논문에서는 갱신 연산을 위해 특정 단말 노드에 해당하는 로그 노드를 할당하고, 해당 로그 노드에 있는 변경된 데이터를 한 번의 쓰기 연산으로 저장하는 로그 기반의 B-트리(LSB-트리)를 제안한다. LSB-트리는 부모 노드의 변경을 늦추어 추가적인 쓰기 연산의 횟수를 줄일 수 있다는 장점을 가지고 있다. 또한 키 값에 따라 데이터를 순차적으로 삽입할 때, 로그 노드를 새로운 단말 노드로 교환함으로써 추가적인 쓰기 연산의 횟수를 줄일 수 있다. 마지막으로, 다양한 비교 실험을 통하여 ${\mu}$-트리와 비교함으로써 LSB-트리의 우수성을 보인다.

$[Ni(C_2N_2H_8)_3]\cdotCr_2O_7$의 결정구조 (The Crystal Structure of Tris(ethylenediamine)nickel(II)-dichromate, $[Ni(C_2N_2H_8)_3]\cdotCr_2O_7$)

  • 김세환;김승빈;남궁해
    • 한국결정학회지
    • /
    • 제7권1호
    • /
    • pp.36-43
    • /
    • 1996
  • Tris(ethylenediamine)nickel(II)Dichromate [Ni(C2N2H8)3]·Cr2O7착화합물 및 결정의 구조를 X-선 회절법으로 연구하였다. 이 결정은 단사정계이고, 공간군은 P21/b(군번호=14)이다. 단위세포길이는 a=8.268(2), b=13.865(2), c=14.921(2)Å, γ=102.04(2)°, V=1672.9(5)Å3, Z=4, Dc=1.806 gcm-3, μ=24.05 cm-0.1이다. 회절반점들의 세기는 흑연 단색화 장치가 있는 자동4축 회절기로 얻었으며 Mo-Kα X-선(λ=0.7107Å)을 사용하였다. 구조분석은 중원자법으로 풀었으며, 최소자승법으로 정밀화 하였을 때, 최종 신뢰도 값들은 2248개의 회절반점에 대하여 R=0.045, Rw=0.051, Rall=0.059 및 S=2.171이었다. 니켈 착이온 가운데 하나의 에칠렌디아민 고리중에서 두 개의 탄소원자가 무질서하게 상호교차하는 네 개의 원자로 나타났다. 무질서한 에칠렌디아민의 두가지 고리구조들의 α- 과 β- 각들이나 수소결합들을 고려하였을 때 Ni-착이온의 입체구조는 Λδδδ-와 Λδδλ- 구조들의 무질서배열로 보아진다.

  • PDF

반복최적화 무감독 분광각 분류 기법을 이용한 하이퍼스펙트럴 영상 분류에 관한 연구 (A Study on the Hyperspectral Image Classification with the Iterative Self-Organizing Unsupervised Spectral Angle Classification)

  • 조현기;김대성;유기윤;김용일
    • 대한원격탐사학회지
    • /
    • 제22권2호
    • /
    • pp.111-121
    • /
    • 2006
  • 분광각(Spectral Angle)을 이용한 분류는 같은 종류의 지표 대상물의 분광 특성이 대기 및 지형적인 영향으로 인해 원점을 기준으로 유사한 분광각을 가지며, 선형적인 분포 모양을 가진다는 가정에 기초한 분류 방식이다. 최근 분광각을 이용한 무감독 분류에 대한 연구가 활발히 이루어지고 있으나, 하이퍼스펙트럴 데이터의 특성을 반영한 효과적인 무감독 분류에 대한 연구는 미진한 상태이다 본 연구는 하이퍼스펙트럴 영상 분류에 있어서 기존 무감독 분광각 분류(USAC, Unsupervised Spectral Angle Classification) 연구에서 나타난 문제점들을 보완한 반복최적화 무감독 분광각 분류(ISOUSAC, Iterative Self-Organizing USAC) 기법을 제안하고 있다. 이를 위해, 무감독 분광각 분류에 적합한 각 분할(Angle Range Division) 기법을 적용하여 군집 초기 중심을 설정하였고, 군집 중심 계산에 있어서 각 중심을 이용하였다. 뿐만 아니라 병합(Merge)과 분할(Split)를 통한 유동적인 군집 분석을 수행하였다. 결과를 통해, 제안된 알고리즘이 기존의 기법보다 수행 시간뿐 아니라 시각적, 정량적인 면에서 우수한 결과를 도출하였으며, 분광각을 이용한 군집 유효성 지수(Validity Index)를 제안함으로써 기존의 무감독 분광각 분류와 정량적 비교를 수행하였다.

Frequency Ratio와 Evidential Belief Function을 활용한 산사태 유발에 대한 환경지리적 민감성 분석과 검증 - 2013년 춘천 산사태를 중심으로 - (Analysis and Validation of Geo-environmental Susceptibility for Landslide Occurrences Using Frequency Ratio and Evidential Belief Function - A Case for Landslides in Chuncheon in 2013 -)

  • 이원영;성효현;안세진;박선기
    • 한국지형학회지
    • /
    • 제27권1호
    • /
    • pp.61-89
    • /
    • 2020
  • The objective of this study is to characterize landslide susceptibility depending on various geo-environmental variables as well as to compare the Frequency Ratio (FR) and Evidential Belief Function (EBF) methods for landslide susceptibility analysis of rainfall-induced landslides. In 2013, a total of 259 landslides occurred in Chuncheon, Gangwon Province, South Korea, due to heavy rainfall events with a total cumulative rainfall of 296~721mm in 106~231 hours duration. Landslides data were mapped with better accuracy using the geographic information system (ArcGIS 10.6 version) based on the historic landslide records in Chuncheon from the National Disaster Management System (NDMS), the 2013 landslide investigation report, orthographic images, and aerial photographs. Then the landslides were randomly split into a testing dataset (70%; 181 landslides) and validation dataset (30%; 78 landslides). First, geo-environmental variables were analyzed by using FR and EBF functions for the full data. The most significant factors related to landslides were altitude (100~200m), slope (15~25°), concave plan curvature, high SPI, young timber age, loose timber density, small timber diameter, artificial forests, coniferous forests, soil depth (50~100cm), very well-drained area, sandy loam soil and so on. Second, the landslide susceptibility index was calculated by using selected geo-environmental variables. The model fit and prediction performance were evaluated using the Receiver Operating Characteristic (ROC) curve and the Area Under Curve (AUC) methods. The AUC values of both model fit and prediction performance were 80.5% and 76.3% for FR and 76.6% and 74.9% for EBF respectively. However, the landslide susceptibility index, with classes of 'very high' and 'high', was detected by 73.1% of landslides in the EBF model rather than the FR model (66.7%). Therefore, the EBF can be a promising method for spatial prediction of landslide occurrence, while the FR is still a powerful method for the landslide susceptibility mapping.