• 제목/요약/키워드: Feature Set Selection

검색결과 186건 처리시간 0.028초

Prediction of Prognosis in Glioblastoma Using Radiomics Features of Dynamic Contrast-Enhanced MRI

  • Elena Pak;Kyu Sung Choi;Seung Hong Choi;Chul-Kee Park;Tae Min Kim;Sung-Hye Park;Joo Ho Lee;Soon-Tae Lee;Inpyeong Hwang;Roh-Eul Yoo;Koung Mi Kang;Tae Jin Yun;Ji-Hoon Kim;Chul-Ho Sohn
    • Korean Journal of Radiology
    • /
    • 제22권9호
    • /
    • pp.1514-1524
    • /
    • 2021
  • Objective: To develop a radiomics risk score based on dynamic contrast-enhanced (DCE) MRI for prognosis prediction in patients with glioblastoma. Materials and Methods: One hundred and fifty patients (92 male [61.3%]; mean age ± standard deviation, 60.5 ± 13.5 years) with glioblastoma who underwent preoperative MRI were enrolled in the study. Six hundred and forty-two radiomic features were extracted from volume transfer constant (Ktrans), fractional volume of vascular plasma space (Vp), and fractional volume of extravascular extracellular space (Ve) maps of DCE MRI, wherein the regions of interest were based on both T1-weighted contrast-enhancing areas and non-enhancing T2 hyperintense areas. Using feature selection algorithms, salient radiomic features were selected from the 642 features. Next, a radiomics risk score was developed using a weighted combination of the selected features in the discovery set (n = 105); the risk score was validated in the validation set (n = 45) by investigating the difference in prognosis between the "radiomics risk score" groups. Finally, multivariable Cox regression analysis for progression-free survival was performed using the radiomics risk score and clinical variables as covariates. Results: 16 radiomic features obtained from non-enhancing T2 hyperintense areas were selected among the 642 features identified. The radiomics risk score was used to stratify high- and low-risk groups in both the discovery and validation sets (both p < 0.001 by the log-rank test). The radiomics risk score and presence of isocitrate dehydrogenase (IDH) mutation showed independent associations with progression-free survival in opposite directions (hazard ratio, 3.56; p = 0.004 and hazard ratio, 0.34; p = 0.022, respectively). Conclusion: We developed and validated the "radiomics risk score" from the features of DCE MRI based on non-enhancing T2 hyperintense areas for risk stratification of patients with glioblastoma. It was associated with progression-free survival independently of IDH mutation status.

자본시장(資本市場)의 경제적(經濟的) 효율성(效率性)에 관한 연구(硏究) (A Study on the Economic Efficiency of Capital Market)

  • 남수현
    • 재무관리연구
    • /
    • 제2권1호
    • /
    • pp.55-75
    • /
    • 1986
  • This article is to analyse the economic efficiency of capital market, which plays a role of resource allocation in terms of financial claims such as stock and bond. It provides various contributions to the welfare theoretical aspects of modern capital market theory. The key feature that distinguishes the theory described here from traditional welfare theory is the presence of uncertainty. Securities has time dimensions and the state and outcome of the future are really uncertain. This problem resulting from this uncertainty can be solved by complete market, but it has a weak power to explain real stock market. Capital Market is faced with the uncertainity because it is a kind of incomplete market. Individuals and firms in capital market made their consumption-investment decision by their own criteria, i. e. the maximization of expected utility form intertemporal consumption and the maximization of the market value of firm. We noted that allocative decisions that had to be made in the economy could be naturally subdivided into two groups. One set of decisions concerned the allocation of first-period resources among consumption $C_i$, investment in risky firms $I_j$, and riskless investment M. The other decisions concern the distribution among individuals of income available in the second period $Y_i(\theta)$. Corresponing to this grouping, the theoretical analysis of efficiency has also been dichotomized. The optimality of the distribution of output in the second period is distributive efficiency" and the optimality of the allocation of first-period resources is 'the efficiency of investment'. We have found in the distributive efficiency that the conditions for attainability is the same as the conditions for market optimality. The necessary and sufficient conditions for attainability or market optimality is that (1) all utility functions are such that -$\frac{{U_i}^'(Y_i)}{{U_i}^"(Y_i)}={\mu}_i+{\lambda}Y_i$-linear risk tolerance function where the coefficients ${\mu}_i$ and $\lambda$ are independent of $Y_i$, and (2) there are homogeneous expectations, i. e. ${\Large f}_i(\theta)={\Large f}(\theta)$ for every i. On the other hand, the efficiency of investment has disagreement about optimal investment level. The investment level for market rule will not generally lead to Pareto-optimal allocation of investment. This suboptimality is caused by (1)the difference of Diamond's decomposable production function and mean-variance valuation model and (2) the selection of exelusive investment or competitive investment. In conclusion, this article has made an analysis of conditions and processes of Pareto-optimal allocation of resources in capital marker and tried to connect with significant issues in modern finance.

  • PDF

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

Ensemble of Nested Dichotomies 기법을 이용한 스마트폰 가속도 센서 데이터 기반의 동작 인지 (Ensemble of Nested Dichotomies for Activity Recognition Using Accelerometer Data on Smartphone)

  • 하으뜸;김정민;류광렬
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.123-132
    • /
    • 2013
  • 최근 스마트 폰에 다양한 센서를 내장할 수 있게 되었고 스마트폰에 내장된 센서를 이용항 동작 인지에 관한 연구가 활발히 진행되고 있다. 스마트폰을 이용한 동작 인지는 노인 복지 지원이나 운동량 측정. 생활 패턴 분석, 운동 패턴 분석 등 다양한 분야에 활용될 수 있다. 하지만 스마트 폰에 내장된 센서를 이용하여 동작 인지를 하는 방법은 사용되는 센서의 수에 따라 단일 센서를 이용한 동작인지와 다중 센서를 이용한 동작인지로 나눌 수 있다. 단일 센서를 이용하는 경우 대부분 가속도 센서를 이용하기 때문에 배터리 부담은 줄지만 다양한 동작을 인지할 때에 특징(feature) 추출의 어려움과 동작 인지 정확도가 낮다는 문제점이 있다. 그리고 다중 센서를 이용하는 경우 대부분 가속도 센서와 중력센서를 사용하고 필요에 따라 다른 센서를 추가하여 동작인지를 수행하며 다양한 동작을 보다 높은 정확도로 인지할 수 있지만 다수의 센서를 사용하기 때문에 배터리 부담이 증가한다는 문제점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 스마트 폰에 내장된 가속도 센서를 이용하여 다양한 동작을 높은 정확도로 인지하는 방법을 제안한다. 서로 다른 10가지의 동작을 높을 정확도로 인지하기 위해 원시 데이터로부터 17가지 특징을 추출하고 각 동작을 분류하기 위해 Ensemble of Nested Dichotomies 분류기를 사용하였다. Ensemble of Nested Dichotomies 분류기는 다중 클래스 문제를 다수의 이진 분류 문제로 변형하여 다중 클래스 문제를 해결하는 방법으로 서로 다른 Nested Dichotomy 분류기의 분류 결과를 통해 다중 클래스 문제를 해결하는 기법이다. Nested Dichotomy 분류기 학습에는 Random Forest 분류기를 사용하였다. 성능 평가를 위해 Decision Tree, k-Nearest Neighbors, Support Vector Machine과 비교 실험을 한 결과 Ensemble of Nested Dichotomies 분류기를 사용하여 동작 인지를 수행하는 것이 가장 높은 정확도를 보였다.

헌혈자와 비헌혈자의 헌혈에 대한 지식, 태도 및 동기에 대한 비교 (Comparison Study of Knowledge, Attitude and Motivation Between Blood Donors and Non-donors)

  • 신재학;사공준;김석범;김창윤;강복수;정종학;송달효
    • Journal of Yeungnam Medical Science
    • /
    • 제6권2호
    • /
    • pp.159-172
    • /
    • 1989
  • 일부 가두 및 단체 헌혈자와 헌혈 미경험자들의 헌혈에 대한 태도, 지식 및 동기 등을 비교조사하기 위해 1989년 3월 1일부터 3월 31일까지 대구적십자 혈액원 소속 가두헌혈차를 방문하여 헌혈한 사람과 동 기관에서 실시한 단체헌혈캠페인의 헌혈자 622명과 가두헌혈자를 방문하여 헌혈을 거부하였거나 단체헌혈캠페인에서 거부한 322명을 대상으로 자기기입식 설문서를 이용하여 조사분석하여 다음과 같은 결과를 얻었다. 헌혈자군은 남자가 84.1%, 여자 15.9%였고 비헌혈자군은 남자 73.6%, 여자 26.4%였고 16-24세군이 헌혈자군 63.2%, 비헌혈자군 72.7%를 차지하였다. 그 외 교육정도, 직업분포, 종교, 가구당 월수입, 결혼상태 및 건상상태의 분포도 헌혈자군과 비헌혈자군이 유사하였다. 헌혈에 관한 정보습득 매체는 TV가 헌혈자군 75.2%, 비헌혈자군 78.9%로 가장 많았고, 헌혈차직원, 라디오, 신문 순이었다. 잡지를 통한 정보습득이 헌혈자군에서 유의하게 많았다(p<0.05). 헌혈자군의 70.6%, 비헌혈자군의 58.1%가 헌혈을 권유받은 적이 있다고 대답했으며(p<0.01), 권유의 근원은 두군 모두에서 친구가 가장 많았고 헌혈차직원이 그 다음이었다. 헌혈 및 혈액에 관한 지식측정 문항 중 정답률이 가장 높은 것은 "혈액의 생성 및 소멸"에 관한 것이었으며 오답률이 가장 높았던 문항은 "수혈을 통한 암전파 가능"이었다. 헌혈자군의 평균정답률은 62.6%였고 비헌혈자군은 54.1%로 뚜렷한 차이가 있었다(p<0.01). 그리고 교육수준이 높을수록 정답률도 높아지는 경향이었다. 헌혈에 대한 태도측정 문항중에서 "혈액에 대한 느낌", "수혈을 가정한 혈액선택" 및 "혈액부족상황에 대한 견해"가 헌혈자군과 비헌혈자군 사이에 태도가 차이가 있었다(p<0.05). 헌혈자군 비헌혈자군에서 헌혈의 가장 큰 동기는 "예치성 동기"였고 그 다음이 "인도주의적 이유"이었다. 헌혈에 응하지 않은 이유의 분포는 헌혈자군과 비헌혈자군 모두에서 "주사침공포", "헌혈차나 혈액원 방문이 두렵다" 그리고 "헌혈이 건강이나 활동에 지장" 등의 순으로 중요한 이유였다. 이상의 소견으로 보아 헌혈에 대한 홍보 및 계몽활동시 잡지를 이용하는 방안이 더욱 고려 되어야겠으며 홍보내용은 위의 지식측정문항중 오답률이 높은 것과 헌혈에 응하지 않은 이유중 잘못 인식하고 있는 부분에 대해 중점적으로 다뤄져야겠으며 각종 두려움에 관한 문제를 해결하기 위해서 다회 헌혈자의 비중을 높여야겠다.

  • PDF

중환자실 섬망 환자와 비섬망 환자 구분에 기여하는 임상 지표에 관한 연구 (A Study on Clinical Variables Contributing to Differentiation of Delirium and Non-Delirium Patients in the ICU)

  • 고찬영;김재진;조동래;오주영;박진영
    • 정신신체의학
    • /
    • 제27권2호
    • /
    • pp.101-110
    • /
    • 2019
  • 연구목적 중환자실 환자들의 섬망 발생 유무와 관련이 되어 있는 것으로 알려진 많은 임상 지표들이 있지만, 이 중 실제 섬망군과 비섬망군을 분류하는 데 있어서 어떠한 지표가 보다 중요한 역할을 하는지에 대한 연구는 충분히 이루어지지 않았다. 본 연구는 중환자실 내에서 섬망이 발생한 군과 발생하지 않은 군 사이의 재실 기간 내 특징을 비교하고, 두 군을 효과적으로 구분할 수 있는 임상 지표들을 확인하고자 하였다. 방 법 2013년 3월 1일부터 2017년 5월 31일까지 강남세브란스병원 중환자실에 있던 6386명의 환자들 중, 섬망과 연관성을 보일 것으로 예상되는 40개의 임상 지표에 대한 데이터가 재실 기간 중 적어도 한 번 이상 측정되거나, 확인이 가능한 환자 1559명을 대상으로 하였다. 무작위 부분집합 특징 선택 방법 및 주성분분석을 사용하여 섬망과 비섬망을 구분하는 데에 기여도가 높은 특징들의 순위를 구하고, 몇 개의 상위 지표가 동시에 사용되었을 때에 섬망과 비섬망을 가장 효율적으로 판별할 수 있는지를 확인하였다. 확인된 상위 지표만을 이용한 것과 전체 임상 지표를 모두 사용하였을 때의 섬망과 비섬망을 구분할 수 있는 정확도에 대해서 비교 분석하였다. 결 과 총 40개 변수 중 32개의 변수에서 섬망과 비섬망군 간 유의미한 차이를 보였다. 주성분 분석(Principal Component Analysis, PCA)상, 상위 6개 변수인 리치몬드 흥분 진정 척도(Richmond Agitation Sedation Scale, RASS), 도뇨관 사용 유무, 혈관 카테터 사용 유무, 해밀턴 불안 척도(Hamilton Anxiety Rating Scale, HAM-A), 혈액 요소 질소(Blood Urea Nitrogen, BUN), 급성 생리학 및 만성 건강 평가-II (Acute Physiology and Chronic Health Examination II, APACHE II)를 사용했을 때에 섬망과 비섬망군이 가장 잘 구분되었다. 이들 상위 6개 변수에 대해 단일 변수 로지스틱 회귀분석 시행 시 모두 섬망 여부 결정에 대한 유의성을 보였다. 다중 변수 회귀분석 시행 시, 혈관 카테터 사용 유무 를 제외하고 나머지 5개 변수에서 모두 섬망 여부 결정에 대한 유의성을 보였다. 수신자판단특성곡선 분석 결과 신뢰구간 95%에서 곡선하면적 0.818로 높은 판별력을 보였다. 전체 임상 변수를 모두 사용한 수신자판단특성곡선 분석 결과에서는 곡선하면적 0.881로 매우 높은 판별력을 보였다. 결 론 본 연구 결과, 리치몬드 흥분 진정 척도, 도뇨관 사용 유무, 혈관 카테터 사용 유무, 해밀턴 불안 척도, 혈액 요소 질소, 급성 생리학 및 만성 건강 평가-II가 섬망이 발생한 군과 섬망이 발생하지 않은 군을 구분하는데 가장 유용하였다. 중환자실 환자 중 리치몬드 흥분 진정 척도 및 해밀턴 불안 척도 점수가 과도하게 낮거나, 도뇨관 및 혈관 카테터 등의 침습적인 시술을 사용하였을 경우 좀 더 집중적인 모니터링을 통해 섬망의 가능성을 살펴보아야 할 것이다.