• 제목/요약/키워드: Weighted Prediction

검색결과 243건 처리시간 0.027초

유전 알고리즘을 이용한 국소가중회귀의 다중모델 결합을 위한 점진적 앙상블 학습 (Incremental Ensemble Learning for The Combination of Multiple Models of Locally Weighted Regression Using Genetic Algorithm)

  • 김상훈;정병희;이건호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권9호
    • /
    • pp.351-360
    • /
    • 2018
  • 전통적으로 나태한 학습에 해당하는 국소가중회귀(LWR: Locally Weighted Regression)모델은 입력변수인 질의지점에 따라 예측의 해를 얻기 위해 일정구간 범위내의 학습 데이터를 대상으로 질의지점의 거리에 따라 가중값을 달리 부여하여 학습 한 결과로 얻은 짧은 구간내의 회귀식이다. 본 연구는 메모리 기반학습의 형태에 해당하는 LWR을 위한 점진적 앙상블 학습과정을 제안한다. LWR를 위한 본 연구의 점진적 앙상블 학습법은 유전알고리즘을 이용하여 시간에 따라 LWR모델들을 순차적으로 생성하고 통합하는 것이다. 기존의 LWR 한계는 인디케이터 함수와 학습 데이터의 선택에 따라 다중의 LWR모델이 생성될 수 있으며 이 모델에 따라 예측 해의 질도 달라질 수 있다. 하지만 다중의 LWR 모델의 선택이나 결합의 문제 해결을 위한 연구가 수행되지 않았다. 본 연구에서는 인디케이터 함수와 학습 데이터에 따라 초기 LWR 모델을 생성한 후 진화 학습 과정을 반복하여 적절한 인디케이터 함수를 선택하며 또한 다른 학습 데이터에 적용한 LWR 모델의 평가와 개선을 통하여 학습 데이터로 인한 편향을 극복하고자 한다. 모든 구간에 대해 데이터가 발생 되면 점진적으로 LWR모델을 생성하여 보관하는 열심학습(Eager learning)방식을 취하고 있다. 특정 시점에 예측의 해를 얻기 위해 일정구간 내에 신규로 발생된 데이터들을 기반으로 LWR모델을 생성한 후 유전자 알고리즘을 이용하여 구간 내의 기존 LWR모델들과 결합하는 방식이다. 제안하는 학습방법은 기존 단순평균법을 이용한 다중 LWR모델들의 선택방법 보다 적합도 평가에서 우수한 결과를 보여주고 있다. 특정지역의 시간 별 교통량, 고속도로 휴게소의 시간별 매출액 등의 실제 데이터를 적용하여 본 연구의 LWR에 의한 결과들의 연결된 패턴과 다중회귀분석을 이용한 예측결과를 비교하고 있다.

전화망에서의 음성인식을 위한 전처리 연구 (Front-End Processing for Speech Recognition in the Telephone Network)

  • 전원석;신원호;양태영;김원구;윤대희
    • 한국음향학회지
    • /
    • 제16권4호
    • /
    • pp.57-63
    • /
    • 1997
  • 본 논문에서는 다양한 전화선 채널에서 수집된 한국통신(KT)의 데이터베이스를 이용하여 인식 시스템의 성능을 향상시키기 위한 효율적인 특징벡터 및 전처리방법을 연구하였다. 먼저 잡음 및 주변 환경 변화에 강인한 갓으로 알려져 있는 특징벡터들을 이용한 인식 성능을 비교하고, 가중 켑스트랄 거리측정 방법을 이용하여 인식시스템의 성능 향상을 검증하였다. 실험 결과, KT의 인식 시스템에서 이용하는 LPC 켑스트럼의 경우에 비하여 PLP(Perceptual Linear Prediction)과 MFCC)Mel Frequency Cepstral Coefficient)등에 대하여 인식률이 향상되었다. 켑스트럼간의 거리측정에 있어서는 RPS(Root Power Sums)와 BPL(Band Pass Lifter)과 같은 가중 켑스트랄 거리측정 함수들이 인식성능 향상에 도움을 주었다. 스펙트럼 차감법(Spectral Subtraction)의 적용은 왜곡에 의한 효과가 커서 인식률이 저하되었지만, RASTA(RelAtive SpecTrAl) 처리방법, CMS(Cepstral Mean Subtraction), SBR(Signal Bias Removal)의 적용시에는 인식 성능 향상을 보였다. 특히, CMS 방법은 간편하면서도 높은 인식 성능 향상을 보였다. 마지막으로, CMS의 실시간 구현을 위한 방법들의 인식 성능을 비교하고, 인식 성능 저하를 막기 위한 개선책을 제시하였다.

  • PDF

접근성 변수를 반영한 통행발생 및 통행분포모형 개발 (Development of Estimation Model of Trip Generation Model and Trip Distribution Model Reflecting Coefficient of Accessibility)

  • 전용현;노정현;장준석
    • 한국산학기술학회논문지
    • /
    • 제18권6호
    • /
    • pp.576-584
    • /
    • 2017
  • 교통수요 예측 결과는 교통계획 및 운영과 같은 의사결정 과정에서 매우 주요하게 작용되고 있다. 교통수요 예측 시 적용되는 기존 교통수요 예측 4단계 모형은 지정된 기점과 종점 간의 통행만을 대상으로 하며 모형의 특성상 접근성 향상에 따라 유발되는 수요는 고려하지 못하고 있다. 따라서 본 연구는 기존 모형의 한계를 보완하고 모형의 추정력 및 신뢰성을 제고하기 위해 접근성을 반영한 전국 지역 간 통행발생 및 통행분포모형 개발에 목적을 두었다. 접근성을 반영한 통행발생 및 통행분포모형 정산 결과, 접근성 계수의 부호는 양(+)의 값으로 추정되었다. 통행목적 중 업무통행은 타 목적통행에 비해 외부요소의 제약에 가장 둔감한 것으로 나타났으며 여가통행은 통행비용에 가장 민감한 것으로 나타났다. 정산된 통행발생 및 통행분포모형을 관측자료 와의 비교를 통해 검증한 결과, 접근성을 반영한 모형의 가중평균(weighted average) 오차율(%), RMSE(Root Mean Square Error), 총 오차량(total error)등이 기존 모형에 비해 감소하는 것으로 나타남에 따라 모형의 추정력 및 신뢰성이 개선됨을 확인하였다.

셀룰러 오토마타 기반 WCA2D 모형을 이용한 부산 온천천 유역 고해상도 도시 침수 해석 (High-resolution Urban Flood Modeling using Cellular Automata-based WCA2D in the Oncheon-cheon Catchment in Busan, South Korea)

  • 최현진;이송희;우현아;노성진
    • 대한토목학회논문집
    • /
    • 제43권5호
    • /
    • pp.587-599
    • /
    • 2023
  • 기후변화로 인해 전 세계 주요 도시에서 홍수의 빈도와 위험성이 증가함에 따라, 도시 침수에 대비한 선제적 대응을 위해 넓은 공간 영역에서 고해상도 2차원 침수 정보를 신속하고 정확하게 해석할 수 있는 모의 기술의 중요성이 대두되고 있다. 기존의 천수 방정식(shallow water equations)에 기반한 물리적 해석 방법은 고해상도 침수 예측을 위해 많은 컴퓨터 자원과 계산 시간이 소요되는 한계가 있다. 본 연구는 전환 규칙과 가중치 기반 시스템을 사용하여 침수의 시공간 변화를 모의하는 셀룰러 오토마타(cellular automata) 기반 2차원 침수 해석 모형 Weighted Cellular Automata 2D (WCA2D)의 이론적 배경을 고찰하고, 부산 온천천 유역의 침수 사상 모의를 통해 재현하여 국내 도시 유역에 대한 적용성을 검토하였다. 또한, Open Computing Language (OpenCL)와 Open Multi-Processing (OpenMP)과 같은 병렬계산(parallel computing)기술을 적용한 버전을 순차계산(sequential computing)결과와 비교하여 연산성능을 평가 하였다. 연구결과, WCA2D 모형에 의한 최대 침수심 분포는 과거침수 피해지도와 유사하게 모의되어, 복잡한 지형특성을 가지는 도시유역 침수의 시공간적 변화를 해석하기에 적절함을 확인하였다. 또한,병렬 계산 적용시 순차 계산 버전에 비해 OpenCL과 OpenMP는 약8배~14배, 5배~6배 연산 효율이 향상되어 효율적인 도시 침수 모의가 가능하였다.

Prediction of Prognosis in Glioblastoma Using Radiomics Features of Dynamic Contrast-Enhanced MRI

  • Elena Pak;Kyu Sung Choi;Seung Hong Choi;Chul-Kee Park;Tae Min Kim;Sung-Hye Park;Joo Ho Lee;Soon-Tae Lee;Inpyeong Hwang;Roh-Eul Yoo;Koung Mi Kang;Tae Jin Yun;Ji-Hoon Kim;Chul-Ho Sohn
    • Korean Journal of Radiology
    • /
    • 제22권9호
    • /
    • pp.1514-1524
    • /
    • 2021
  • Objective: To develop a radiomics risk score based on dynamic contrast-enhanced (DCE) MRI for prognosis prediction in patients with glioblastoma. Materials and Methods: One hundred and fifty patients (92 male [61.3%]; mean age ± standard deviation, 60.5 ± 13.5 years) with glioblastoma who underwent preoperative MRI were enrolled in the study. Six hundred and forty-two radiomic features were extracted from volume transfer constant (Ktrans), fractional volume of vascular plasma space (Vp), and fractional volume of extravascular extracellular space (Ve) maps of DCE MRI, wherein the regions of interest were based on both T1-weighted contrast-enhancing areas and non-enhancing T2 hyperintense areas. Using feature selection algorithms, salient radiomic features were selected from the 642 features. Next, a radiomics risk score was developed using a weighted combination of the selected features in the discovery set (n = 105); the risk score was validated in the validation set (n = 45) by investigating the difference in prognosis between the "radiomics risk score" groups. Finally, multivariable Cox regression analysis for progression-free survival was performed using the radiomics risk score and clinical variables as covariates. Results: 16 radiomic features obtained from non-enhancing T2 hyperintense areas were selected among the 642 features identified. The radiomics risk score was used to stratify high- and low-risk groups in both the discovery and validation sets (both p < 0.001 by the log-rank test). The radiomics risk score and presence of isocitrate dehydrogenase (IDH) mutation showed independent associations with progression-free survival in opposite directions (hazard ratio, 3.56; p = 0.004 and hazard ratio, 0.34; p = 0.022, respectively). Conclusion: We developed and validated the "radiomics risk score" from the features of DCE MRI based on non-enhancing T2 hyperintense areas for risk stratification of patients with glioblastoma. It was associated with progression-free survival independently of IDH mutation status.

기계학습을 활용한 상품자산 투자모델에 관한 연구 (A Study on Commodity Asset Investment Model Based on Machine Learning Technique)

  • 송진호;최흥식;김선웅
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.127-146
    • /
    • 2017
  • 상품자산(Commodity Asset)은 주식, 채권과 같은 전통자산의 포트폴리오의 안정성을 높이기 위한 대체투자자산으로 자산배분의 형태로 투자되고 있지만 주식이나 채권 자산에 비해 자산배분에 대한 모델이나 투자전략에 대한 연구가 부족한 실정이다. 최근 발전한 기계학습(Machine Learning) 연구는 증권시장의 투자부분에서 적극적으로 활용되고 있는데, 기존 투자모델의 한계점을 개선하는 좋은 성과를 나타내고 있다. 본 연구는 이러한 기계학습의 한 기법인 SVM(Support Vector Machine)을 이용하여 상품자산에 투자하는 모델을 제안하고자 한다. 기계학습을 활용한 상품자산에 관한 기존 연구는 주로 상품가격의 예측을 목적으로 수행되었고 상품을 투자자산으로 자산배분에 관한 연구는 찾기 힘들었다. SVM을 통한 예측대상은 투자 가능한 대표적인 4개의 상품지수(Commodity Index)인 골드만삭스 상품지수, 다우존스 UBS 상품지수, 톰슨로이터 CRB상품지수, 로저스 인터내셔날 상품지수와 대표적인 상품선물(Commodity Futures)로 구성된 포트폴리오 그리고 개별 상품선물이다. 개별상품은 에너지, 농산물, 금속 상품에서 대표적인 상품인 원유와 천연가스, 옥수수와 밀, 금과 은을 이용하였다. 상품자산은 전반적인 경제활동 영역에 영향을 받기 때문에 거시경제지표를 통하여 투자모델을 설정하였다. 주가지수, 무역지표, 고용지표, 경기선행지표 등 19가지의 경제지표를 이용하여 상품지수와 상품선물의 등락을 예측하여 투자성과를 예측하는 연구를 수행한 결과, 투자모델을 활용하여 상품선물을 리밸런싱(Rebalancing)하는 포트폴리오가 가장 우수한 성과를 나타냈다. 또한, 기존의 대표적인 상품지수에 투자하는 것 보다 상품선물로 구성된 포트폴리오에 투자하는 것이 우수한 성과를 얻었으며 상품선물 중에서도 에너지 섹터의 선물을 제외한 포트폴리오의 성과가 더 향상된 성과를 나타남을 증명하였다. 본 연구에서는 포트폴리오 성과 향상을 위해 기존에 널리 알려진 전통적 주식, 채권, 현금 포트폴리오에 상품자산을 배분하고자 할 때 투자대상은 상품지수에 투자하는 것이 아닌 개별 상품선물을 선정하여 자체적 상품선물 포트폴리오를 구성하고 그 방법으로는 기간마다 강세가 예측되는 개별 선물만을 골라서 포트폴리오를 재구성하는 것이 효과적인 투자모델이라는 것을 제안한다.

단백질 서열의 상동 관계를 가중 조합한 단백질 이차 구조 예측 (Prediction of Protein Secondary Structure Using the Weighted Combination of Homology Information of Protein Sequences)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1816-1821
    • /
    • 2016
  • 단백질은 대부분의 생물학적 과정에서 중대한 역할을 수행하고 있으므로, 단백질 진화, 구조와 기능을 알아내기 위하여 많은 연구가 수행되고 있는데, 단백질의 이차 구조는 이러한 연구의 중요한 기본적 정보이다. 본 연구는 대규모 단백질 구조 자료로부터 단백질 이차 구조 정보를 효과적으로 추출하여 미지의 단백질 서열이 가지는 이차 구조를 예측하려 한다. 질의 서열과 상동관계에 있는 단백질 구조자료내의 서열들을 광범위하게 찾아내기 위하여, 탐색에 사용하는 프로파일의 구성에 질의 서열과 유사한 서열들을 사용하고 갭을 허용하여 반복적인 탐색이 가능한 PSI-BLAST를 사용하였다. 상동 단백질들의 이차구조는 질의 서열과의 상동 관계의 강도에 따라 가중되어 이차 구조 예측에 기여되었다. 이차 구조를 각각 세 개와 여덟 개로 분류하는 예측 실험에서 상동 서열들과 신경망을 동시에 사용하여 93.28%와 88.79%의 정확도를 얻어서 기존 방법보다 성능이 향상되었다.

R기반의 딥 러닝을 이용한 데이터 예측 프로세스에 관한 연구 (A novel on Data Prediction Process using Deep Learning based on R)

  • 정세훈;김종찬;박홍준;소원호;심춘보
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.421-422
    • /
    • 2015
  • 최근 신경망 분석의 향상된 성능을 보여주는 심화 신경망 기술인 딥 러닝(Deep learning)이 각광을 받고 있는 실정이다. 이에 본 논문에서는 딥 러닝을 기반으로 분석 시각화 툴인 R을 이용한 특정 변수의 오류율 검증과 빅 데이터 예측 프로세스 설계를 제안한다. 딥 러닝에 적용된 알고리즘은 RBM(Restricted Boltzmann Machine)을 적용하였다. 특정 입력 변수에 대한 종속 변수 구분 후 각 종속 변수의 가중치를 적용한다. RBM 알고리즘을 통해 최종 데이터의 검증 및 오류율 검출과정을 R 프로그래밍에 적용하여 설계한다.

  • PDF

치매 환자에서 뇌 자기공명영상의 특징과 비정형 항정신병 약제 사용여부의 상관 관계 (Association between Characteristics of Brain Magnetic Resonance Imaging and Atypical Antipsychotics Use in Dementia Patients)

  • 최종택;김지원;노양호;류석환;우성일;한상우;황재욱
    • 생물정신의학
    • /
    • 제20권3호
    • /
    • pp.97-103
    • /
    • 2013
  • Objectives We aimed to identify the neuroimaging marker for prediction of the use of atypical antipsychotics (AAP) in dementia patients. Methods From April 2010 to March 2013, 31 patients who were diagnosed as dementia at the psychiatric department of Soonchunhyang University Hospital, completed the brain magnetic resonance imaging scan and cognitive test for dementia. Ten patients were treated with AAP for the improvement of behavioral and psychological symptoms of dementia (BPSD) and the other 21patients were not. Using T1 weighted and Fluid Attenuated Inversion Recovery (FLAIR) images of brain, areas of white matter (WM), gray matter (GM), cerebrospinal fluid (CSF) and white matter hyperintensities (WMH) have been segmented and measured. Multivariate logistic regression models were applied for assessment of association between AAP use and the GM/WM ratio, the WMH/whole brain (GM + WM + CSF) ratio. Results There was a significant association between AAP use and the GM/WM ratio (odds ratio, OR = 1.18, 95% confidence interval, CI 1.01-1.38, p = 0.037), while there was no association between AAP use and the WMH/whole brain ratio (OR = 0.82, 95% CI 0.27-2.48, p = 0.73). Conclusions The GM/WM ratio could be a biological marker for the prediction of AAP use and BPSD in patients with dementia. It was more likely to increase as dementia progress since atrophy of WM was more prominent than that of GM over aging.

Prediction of concrete compressive strength using non-destructive test results

  • Erdal, Hamit;Erdal, Mursel;Simsek, Osman;Erdal, Halil Ibrahim
    • Computers and Concrete
    • /
    • 제21권4호
    • /
    • pp.407-417
    • /
    • 2018
  • Concrete which is a composite material is one of the most important construction materials. Compressive strength is a commonly used parameter for the assessment of concrete quality. Accurate prediction of concrete compressive strength is an important issue. In this study, we utilized an experimental procedure for the assessment of concrete quality. Firstly, the concrete mix was prepared according to C 20 type concrete, and slump of fresh concrete was about 20 cm. After the placement of fresh concrete to formworks, compaction was achieved using a vibrating screed. After 28 day period, a total of 100 core samples having 75 mm diameter were extracted. On the core samples pulse velocity determination tests and compressive strength tests were performed. Besides, Windsor probe penetration tests and Schmidt hammer tests were also performed. After setting up the data set, twelve artificial intelligence (AI) models compared for predicting the concrete compressive strength. These models can be divided into three categories (i) Functions (i.e., Linear Regression, Simple Linear Regression, Multilayer Perceptron, Support Vector Regression), (ii) Lazy-Learning Algorithms (i.e., IBk Linear NN Search, KStar, Locally Weighted Learning) (iii) Tree-Based Learning Algorithms (i.e., Decision Stump, Model Trees Regression, Random Forest, Random Tree, Reduced Error Pruning Tree). Four evaluation processes, four validation implements (i.e., 10-fold cross validation, 5-fold cross validation, 10% split sample validation & 20% split sample validation) are used to examine the performance of predictive models. This study shows that machine learning regression techniques are promising tools for predicting compressive strength of concrete.