• 제목/요약/키워드: Performance-based Statistics

검색결과 1,057건 처리시간 0.045초

DLBCL 환자의 대사경로 정보를 이용한 생존예측 (Predicting Survival of DLBCL Patients in Pathway-Based Microarray Analysis)

  • 이광현;이선호
    • 응용통계연구
    • /
    • 제23권4호
    • /
    • pp.705-713
    • /
    • 2010
  • 마이크로어레이 실험 결과로부터 생존예측지표를 개발하는 일은 관찰 유전자수가 환자의 수보다 훨씬 많고 또 반응변수가 중도절단이 포함된 생존시간이기 때문에 어려운 작업이다. 또한 개별유전자 분석의 문제점이 대두되면서 동일한 대사기능을 수행하는 유전자들의 집합을 대상으로 분석하는 방법이 대두되고 있다. DLBCL 환자들의 마이크로어레이 유전자 발현 자료와 생존시간, 유전자들의 대사경로 정보를 바탕으로 생물학적 해석이 쉬운 생존예측지표를 찾고 그 정확성을 검정하는 pilot study를 실시하였다. 또한 유전자 걸러내기가 지표의 효율성에 미치는 영향력도 비교하여 보았다.

시계열 모형과 기상변수를 활용한 태양광 발전량 예측 연구 (A study on solar energy forecasting based on time series models)

  • 이근호;손흥구;김삼용
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.139-153
    • /
    • 2018
  • 최근 정부의 친환경 정책에 따라 태양광 발전 설비가 지속적으로 증가하고 있다. 태양광 발전량은 에너지원인 태양의 특성상 계절에 따라 하루 중 발전이 이루어지는 시간이 일정하지 않다. 이러한 특성으로 인해 태양광 발전량 예측에서는 연속된 시간간격으로 수집된 자료에 적용할 수 있는 시계열 모형 적용에 어려움이 있다. 본 논문에서 제안하는 방법은 연속된 시간자료를 각 시간대 별로 분리, 재구성하여 24개의 (1시-24시) 일별 자료 형태로 예측에 활용하는 방법이다. 강원도 영암 태양광 발전소의 시간별 발전량 자료를 공공데이터포털에서 수집하여 연구하였다. 기존방법과 제안된 방법의 성능차이를 비교하기 위해 ARIMAX, 신경망(neural network model) 모형을 동일한 모형과 변수를 가지는 환경에서 성능차이를 확인하였다.

Appearance-Order-Based Schema Matching

  • Ding, Guohui;Cao, Keyan;Wang, Guoren;Han, Dong
    • Journal of Computing Science and Engineering
    • /
    • 제8권2호
    • /
    • pp.94-106
    • /
    • 2014
  • Schema matching is widely used in many applications, such as data integration, ontology merging, data warehouse and dataspaces. In this paper, we propose a novel matching technique that is based on the order of attributes appearing in the schema structure of query results. The appearance order embodies the extent of the importance of an attribute for the user examining the query results. The core idea of our approach is to collect statistics about the appearance order of attributes from the query logs, to find correspondences between attributes in the schemas to be matched. As a first step, we employ a matrix to structure the statistics around the appearance order of attributes. Then, two scoring functions are considered to measure the similarity of the collected statistics. Finally, a traditional algorithm is employed to find the mapping with the highest score. Furthermore, our approach can be seen as a complementary member to the family of the existing matchers, and can also be combined with them to obtain more accurate results. We validate our approach with an experimental study, the results of which demonstrate that our approach is effective, and has good performance.

Performance Analysis of Economic VaR Estimation using Risk Neutral Probability Distributions

  • Heo, Se-Jeong;Yeo, Sung-Chil;Kang, Tae-Hun
    • 응용통계연구
    • /
    • 제25권5호
    • /
    • pp.757-773
    • /
    • 2012
  • Traditional value at risk(S-VaR) has a difficulity in predicting the future risk of financial asset prices since S-VaR is a backward looking measure based on the historical data of the underlying asset prices. In order to resolve the deficiency of S-VaR, an economic value at risk(E-VaR) using the risk neutral probability distributions is suggested since E-VaR is a forward looking measure based on the option price data. In this study E-VaR is estimated by assuming the generalized gamma distribution(GGD) as risk neutral density function which is implied in the option. The estimated E-VaR with GGD was compared with E-VaR estimates under the Black-Scholes model, two-lognormal mixture distribution, generalized extreme value distribution and S-VaR estimates under the normal distribution and GARCH(1, 1) model, respectively. The option market data of the KOSPI 200 index are used in order to compare the performances of the above VaR estimates. The results of the empirical analysis show that GGD seems to have a tendency to estimate VaR conservatively; however, GGD is superior to other models in the overall sense.

시계열 회귀모형에 근거한 자동차 보험료 추정 (Estimating Automobile Insurance Premiums Based on Time Series Regression)

  • 김영화;박원서
    • 응용통계연구
    • /
    • 제26권2호
    • /
    • pp.237-252
    • /
    • 2013
  • 보험료 및 보험료 구성요소에 대한 예측모형은 합리적인 보험료 결정에 필수적이다. 본 연구에서는 가변수 회귀모형, 독립변수 추가모형, 자기회귀 오차모형, 계절형 ARIMA 모형, 개입모형 등 적정한 자동차 대물 손해보험료 추정에 사용되는 다양한 모형을 소개하였다. 또한 실제 자동차 대물 보험료 자료를 이용하여 각 모형을 이용하여 보험료, 심도, 빈도 등을 추정하였으며, 모형의 추정결과는 추정치와 실제 자료값의 차이에 근거한 RMSE(Root Mean Squared Errors) 값을 통해 비교하였다. 실제 자료 분석 결과, 자기회귀 오차모형이 가장 좋은 성능을 보여주는 것을 알 수 있었다.

Penalized logistic regression using functional connectivity as covariates with an application to mild cognitive impairment

  • Jung, Jae-Hwan;Ji, Seong-Jin;Zhu, Hongtu;Ibrahim, Joseph G.;Fan, Yong;Lee, Eunjee
    • Communications for Statistical Applications and Methods
    • /
    • 제27권6호
    • /
    • pp.603-624
    • /
    • 2020
  • There is an emerging interest in brain functional connectivity (FC) based on functional Magnetic Resonance Imaging in Alzheimer's disease (AD) studies. The complex and high-dimensional structure of FC makes it challenging to explore the association between altered connectivity and AD susceptibility. We develop a pipeline to refine FC as proper covariates in a penalized logistic regression model and classify normal and AD susceptible groups. Three different quantification methods are proposed for FC refinement. One of the methods is dimension reduction based on common component analysis (CCA), which is employed to address the limitations of the other methods. We applied the proposed pipeline to the Alzheimer's Disease Neuroimaging Initiative (ADNI) data and deduced pathogenic FC biomarkers associated with AD susceptibility. The refined FC biomarkers were related to brain regions for cognition, stimuli processing, and sensorimotor skills. We also demonstrated that a model using CCA performed better than others in terms of classification performance and goodness-of-fit.

음성위조 탐지에 있어서 데이터 증강 기법의 성능에 관한 비교 연구 (Comparative study of data augmentation methods for fake audio detection)

  • 박관열;곽일엽
    • 응용통계연구
    • /
    • 제36권2호
    • /
    • pp.101-114
    • /
    • 2023
  • 데이터 증강 기법은 학습용 데이터셋을 다양한 관점에서 볼 수 있게 해주어 모형의 과적합 문제를 해결하는데 효과적으로 사용되고 있다. 이미지 데이터 증강기법으로 회전, 잘라내기, 좌우대칭, 상하대칭등의 증강 기법 외에도 occlusion 기반 데이터 증강 방법인 Cutmix, Cutout 등이 제안되었다. 음성 데이터에 기반한 모형들에 있어서도, 1D 음성 신호를 2D 스펙트로그램으로 변환한 후, occlusion 기반 데이터 기반 증강기법의 사용이 가능하다. 특히, SpecAugment는 음성 스펙트로그램을 위해 제안된 occlusion 기반 증강 기법이다. 본 연구에서는 위조 음성 탐지 문제에 있어서 사용될 수 있는 데이터 증강기법에 대해 비교 연구해보고자 한다. Fake audio를 탐지하기 위해 개최된 ASVspoof2017과 ASVspoof2019 데이터를 사용하여 음성을 2D 스펙트로그램으로 변경시켜 occlusion 기반 데이터 증강 방식인 Cutout, Cutmix, SpecAugment를 적용한 데이터셋을 훈련 데이터로 하여 CNN 모형을 경량화시킨 LCNN 모형을 훈련시켰다. Cutout, Cutmix, SpecAugment 세 증강 기법 모두 대체적으로 모형의 성능을 향상시켰으나 방법에 따라 오히려 성능을 저하시키거나 성능에 변화가 없을 수도 있었다. ASVspoof2017 에서는 Cutmix, ASVspoof2019 LA 에서는 Mixup, ASVspoof2019 PA 에서는 SpecAugment 가 가장 좋은 성능을 보였다. 또, SpecAugment는 mask의 개수를 늘리는 것이 성능 향상에 도움이 된다. 결론적으로, 상황과 데이터에 따라 적합한 augmentation 기법이 다른 것으로 파악된다.

An Application of the Clustering Threshold Gradient Descent Regularization Method for Selecting Genes in Predicting the Survival Time of Lung Carcinomas

  • Lee, Seung-Yeoun;Kim, Young-Chul
    • Genomics & Informatics
    • /
    • 제5권3호
    • /
    • pp.95-101
    • /
    • 2007
  • In this paper, we consider the variable selection methods in the Cox model when a large number of gene expression levels are involved with survival time. Deciding which genes are associated with survival time has been a challenging problem because of the large number of genes and relatively small sample size (n<

건물 내 스몰셀 네트워크에서 채널 선택 기반 다중점 협력통신 (Coordinated Multi-Point Communications with Channel Selection for In-building Small-cell Networks)

  • 반일학;김세진
    • 인터넷정보학회논문지
    • /
    • 제23권5호
    • /
    • pp.9-15
    • /
    • 2022
  • 본 논문은 매크로 기지국(Macro base station, MBS) 커버리지에 위치한 건물 내부의 밀집된 스몰셀 네트워크 환경에서 매크로 사용자 단말(Macro user equipment, MUE)의 성능향상을 위한 채널 선택 기반 다중점 협력통신(Coordinated multi-point, CoMP) 방법을 제안한다. 제안하는 CoMP 방법에서 건물 내에 위치한 MUE의 성능향상을 위해 스몰셀 기지국(Small-cell base station, SBS)들이 이웃한 MUE에게 간섭을 적게 미치는 방법으로 채널을 선택하고 CoMP가 필요한 MUE에게 적절한 신호를 송신한다. 시뮬레이션 결과에서 제안하는 CoMP 방법이 기존의 랜덤채널할당 기반의 스몰셀 네트워크 방법과 CoMP방법보다 MUE의 성능을 각각 최대 164%와 51%까지 향상시킨다.

A Coverage Function for Arbitrary Testing Profile and Its Performance

  • Park Joong-Yang;Fujiwara Takaji;Park Jae-Heung
    • International Journal of Reliability and Applications
    • /
    • 제6권2호
    • /
    • pp.87-99
    • /
    • 2005
  • Coverage-based software reliability growth models (SRGMs) have been developed and successfully applied in practice. Performance of a coverage-based SRG M depends on the coverage function employed by the SRGM. When the coverage function represents the coverage growth behavior well irrespective of type of the testing profile the corresponding coverage-based SRGM is expected to be widely applicable. This paper first conducts a study of selecting the most representative coverage functions among the available coverage functions. Then their performances are empirically evaluated and compared. The result provides a foundation for developing widely applicable coverage-based SRGMs and monitoring the progress of a testing process.

  • PDF