• 제목/요약/키워드: Performance-based Statistics

검색결과 1,048건 처리시간 0.021초

ROC와 CAP 곡선에서의 최적 분류점 (Optimal Threshold from ROC and CAP Curves)

  • 홍종선;최진수
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.911-921
    • /
    • 2009
  • 신용평가 연구에서 부도와 정상차주에 대한 판별력을 평가하는 방법으로 Receiver Operating Characteristic(ROC)와 Cumulative Accuracy Profile(CAP) 곡선을 사용한다. ROC 곡선에서 최적의 분류정확도를 갖는 분류점과 CAP 곡선에서 최대의 이익을 나타내는 분류점은 일반적인 정확도의 개념으로 정의된 동일한 성과를 가진 접선을 사용하여 구한다. 본 연구에서는 정확도의 대안적인 측도로 진실율을 제안하고, 이 진실율을 이용하여 ROC와 CAP 곡선에서 대안적인 최적의 분류점을 구한다. 대부분 실제 차주의 모집단에서 부도차주는 정상차주보다 훨씬 수가 적다. 이러한 경우에 진실율은 정확도보다 비용함수의 측면에서 더욱 효율적일 수 있다. 진실율을 이용하여 최적의 분류정확도를 나타내는 분류점과 최대의 이익을 의미하는 분류점에 대응하는 스코어는 동일하다는 것을 보였으며, 이 스코어는 부도와 정상 차주의 분포함수의 동일성을 검정하는 Kolmogorov-Smirnov 통계량에 대응하는 스코어와도 일치하는 것을 발견하였다.

시계열 모형을 이용한 KTX 여객 수요예측 연구 (A Study on Demand Forecasting for KTX Passengers by using Time Series Models)

  • 김인주;손흥구;김삼용
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1257-1268
    • /
    • 2014
  • KTX에 등장에 따라 국내 여객시장은 KTX 시장을 중심으로 변화가 이루어졌다. 이에 따라 KTX 이용 여객의 수요예측은 열차 운영에 있어서 매우 중대한 사안이다. 본 논문에서는 여러 시계열 모형의 비교를 통해 KTX 이용 여객의 수요와 연관이 있는 요일과 공휴일, 명절을 어떠한 형태로 고려할 것인지 연구하였다. 모형 간 예측력을 비교하기 위하여 Mean Absolute Percentage Errors (MAPE)를 사용하였으며, 1달간의 단기간 예측에 있어서 변동성을 고려해줄 수 있는 Reg-AR-GARCH 모형이 우수한 예측력을 나타냈으며, 1달을 초과한 기간의 예측에서는 Reg-ARMA 모형이 우수한 예측력을 나타냈다.

크기가 1인 표본들로 구성된 집단에 기반한 모평균의 차이를 검정하기 위한 최소 조합 t-검정 방법 (A minimum combination t-test method for testing differences in population means based on a group of samples of size one)

  • 허미영;임창원
    • 응용통계연구
    • /
    • 제30권2호
    • /
    • pp.301-309
    • /
    • 2017
  • 일반적으로 각 N개의 모집단에서 2개 이상의 표본이 추출되었을 때, $H_0:{\mu}_1={\cdots}={\mu}_N$의 가설에 대하여 검정할 수 있지만 각 모집단으로부터 표본이 한 개씩 추출된다면 ${\bar{X}}$가 존재하지 않으므로 모평균의 차이 검정은 불가능하다. 하지만 하나씩 추출된 표본으로 구성된 집단을 두 집단으로 나누어 임의의 평균을 생성함으로써 평균의 차이를 비교한다면 표본들 사이에 존재할 수 있는 이질성을 파악할 수 있다. 따라서 우리는 두 집단으로 나눌 수 있는 조합의 수만큼 평균 차이를 검정할 수 있는 최소 조합 t-검정 방법을 제안하고자 한다. 최종적으로 본 논문에서는 한 개씩 추출된 표본들 사이의 이질성을 확인하기 위하여 평균 차이를 검정할 수 있는 방법을 제안하였고 모의실험 연구를 통해 성능을 확인하였고 실제 자료 분석을 통해 결과를 도출하였다.

RHadoop을 이용한 빅데이터 분산처리 시스템 (Big data distributed processing system using RHadoop)

  • 신지은;정병호;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권5호
    • /
    • pp.1155-1166
    • /
    • 2015
  • 기하급수적으로 증가하는 대용량 데이터를 저장, 분석하는데 기존 방식으로는 거의 불가능하여 이를 가능케 해 주는 기술이 바로 하둡이다. 최근에 R은 하둡기술을 활용하여 분산처리에 기반한 빅데이터 분석 엔진으로 활용되고 있다. 본 논문에서는 R과 하둡의 통합환경인 RHadoop을 이용하여 실제 데이터와 모의실험 데이터에서 다양한 데이터 크기에 따라 병렬 다중 회귀분석을 구현하고자 한다. 또한, 제안된 RHadoop 플랫폼의 성능을 평가하기 위해 기본 R 패키지의 lm 함수, bigmemory 상에서 유용한 biglm 패키지와 처리 속도를 비교하였다. 실험결과 RHadoop은 데이터 노드가 많을수록 병렬처리로 인해 빠른 처리속도를 보였고 또한 대용량의 데이터에 대해 다른 패키지들보다 빠른 처리속도를 보였다.

독립성분의 순서화 방법 비교 (Comparison of several criteria for ordering independent components)

  • 최은빈;조수림;박미라
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.889-899
    • /
    • 2017
  • 독립성분분석은 혼합된 신호에서 원신호들을 분리하기 위해서 사용되는 다변량 분석방법으로서, 블라인드 음원 분리 중 가장 널리 사용되는 방법이다. 독립성분분석은 주성분분석이나 요인분석과 같이 선형변환을 사용하지만, 원신호들의 통계적 독립과 비정규성 가정을 필요로 한다는 점에서 다르다. 설명되는 분산의 누적비율이 클수록 더 중요한 성분을 의미하게 되는 주성분분석과 달리, 독립성분분석에서는 독립성분들의 중요순서를 결정하는데 적절한 유일한 기준이 정해지지 않는다. 군집분석이나 차원축소된 그래프 작성 등과 같은 후속 연구를 진행하기 위해서는 일부의 주요 독립성분을 사용하게 되므로, 성분의 순서를 정하는 것은 의미가 있다. 본 연구에서는 성분의 순서를 결정하기 위한 몇 가지 기준의 성능을 비교하였다. 첨도와 첨도의 절댓값, 음의 엔트로피, 콜모고로프-스미르노프 통계량, 계수제곱합을 이용한 방법이 고려되었다. 이들은 알려진 그룹을 분류하는 능력을 기준으로 평가되었다. 두 가지 형태의 자료를 이용한 분석결과를 제시하였다.

이노베이션 상태공간 지수평활 모형을 이용한 시간별 전력 수요의 예측 (Hourly electricity demand forecasting based on innovations state space exponential smoothing models)

  • 원다영;성병찬
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.581-594
    • /
    • 2016
  • 본 논문은 이노베이션 상태공간모형을 근간으로 기존의 지수평활법을 포괄할 수 있는 다중 계절형 모형을 소개한다. 특히 이 모형은, 기존 모형의 한계를 극복하고 동일한 계절 내의 다양성을 표현할 수 있도록 계절 성분을 행렬로 표현하는 정교한 구조를 가지고 있다. 이런 구조를 이용하면 비슷한 패턴을 가지는 계절 성분의 모수를 그룹별로 분류할 수 있다. 따라서, 다중 계절형 모형은 모수절약 원칙을 달성할 수 있으며 모형의 해석이 용이한 장점을 가지고 있을 뿐만 아니라, 잠재적으로 임의의 개수의 계절성도 수용 가능하다. 본 연구에서는 다중 계절형 모형을 이용하여 시간 단위로 관측된 한국 전력 수요량을 분석하고 예측한다. 특히, 시간별 전력 수요량의 계절성은 1일 및 1주일의 두 가지로 고려되었고 이를 토대로 유사한 요일들은 공통 계절로 그룹화하였다. 모형의 예측 성능을 평가하기 위하여 기존 지수평활법의 예측 결과와 비교하였다. 그 결과, 다중 계절형 모형이 기존 지수평활법보다 예측력이 우수함을 확인하였다.

음향 장면 분류를 위한 경량화 모형 연구 (Light weight architecture for acoustic scene classification)

  • 임소영;곽일엽
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.979-993
    • /
    • 2021
  • 음향 장면 분류는 오디오 파일이 녹음된 환경이 어디인지 분류하는 문제이다. 이는 음향 장면 분류와 관련한 대회인 DCASE 대회에서 꾸준하게 연구되었던 분야이다. 실제 응용 분야에 음향 장면 분류 문제를 적용할 때, 모델의 복잡도를 고려하여야 한다. 특히 경량 기기에 적용하기 위해서는 경량 딥러닝 모델이 필요하다. 우리는 경량 기술이 적용된 여러 모델을 비교하였다. 먼저 log mel-spectrogram, deltas, delta-deltas 피쳐를 사용한 합성곱 신경망(CNN) 기반의 기본 모델을 제안하였다. 그리고 원래의 합성곱 층을 depthwise separable convolution block, linear bottleneck inverted residual block과 같은 효율적인 합성곱 블록으로 대체하고, 각 모델에 대하여 Quantization를 적용하여 경량 모델을 제안하였다. 경량화 기술을 고려한 모델은 기본 모델에 대비하여 성능이 비슷하거나 조금 낮은 성능을 보였지만, 모델 사이즈는 503KB에서 42.76KB로 작아진 것을 확인하였다.

희박 벡터 자기 회귀 모형의 로버스트 추정 (Robust estimation of sparse vector autoregressive models)

  • 김동영;백창룡
    • 응용통계연구
    • /
    • 제35권5호
    • /
    • pp.631-644
    • /
    • 2022
  • 본 논문은 고차원 시계열 자료에 이상점이 존재하는 경우 희박벡터자기회귀모형(sparse VAR; sVAR)의 모수를 강건하게 추정하는 방법에 대해서 연구하였다. 먼저 Xu 등 (2008)이 독립인 자료에서 밝혔듯이 adaptive lasso 방법이 sVAR 모형에서도 어느 정도의 강건함을 가짐을 모의 실험을 통해 알 수 있었다. 하지만, 이상점의 개수가 증가하거나 이상점의 영향력이 커지는 경우 효율성이 현저히 저하되는 현상도 관찰할 수 있었다. 따라서 이를 개선하기 위해서 최소절대편차(least absolute deviation; LAD)와 Huber 함수를 기반으로 벌점화 시키는 adaptive lasso를 이용하여 sVAR 모형을 추정하는 방법을 본 논문에서는 제안하고 그 성능을 검토하였다. 모의 실험을 통해 제안한 로버스트 추정 방법이 이상점이 존재하는 경우에 모수 추정을 더 정확하게 하고 예측 성능도 뛰어남을 확인했다. 또한 해당 방법론들을 전력사용량 데이터에 적용한 결과 이상점으로 의심되는 시점들이 존재하였고, 이를 고려하여 강건하게 추정하는 제안한 방법론이 더 좋은 예측 성능을 보임을 확인할 수 있었다.

Classification of Textured Images Based on Discrete Wavelet Transform and Information Fusion

  • Anibou, Chaimae;Saidi, Mohammed Nabil;Aboutajdine, Driss
    • Journal of Information Processing Systems
    • /
    • 제11권3호
    • /
    • pp.421-437
    • /
    • 2015
  • This paper aims to present a supervised classification algorithm based on data fusion for the segmentation of the textured images. The feature extraction method we used is based on discrete wavelet transform (DWT). In the segmentation stage, the estimated feature vector of each pixel is sent to the support vector machine (SVM) classifier for initial labeling. To obtain a more accurate segmentation result, two strategies based on information fusion were used. We first integrated decision-level fusion strategies by combining decisions made by the SVM classifier within a sliding window. In the second strategy, the fuzzy set theory and rules based on probability theory were used to combine the scores obtained by SVM over a sliding window. Finally, the performance of the proposed segmentation algorithm was demonstrated on a variety of synthetic and real images and showed that the proposed data fusion method improved the classification accuracy compared to applying a SVM classifier. The results revealed that the overall accuracies of SVM classification of textured images is 88%, while our fusion methodology obtained an accuracy of up to 96%, depending on the size of the data base.

The Impact of Business Risk-Based Audit Approach on Reducing Unsystematic Risks: Evidence from Jordanian Banks

  • AL-QUDAH, Laith A.
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제8권1호
    • /
    • pp.343-352
    • /
    • 2021
  • This study aims to identify the impact of the audit approach based on business risks (i.e., external environment risk, operations risk, information risk) in reducing unsystematic risks (i.e., operational risk, credit risk, liquidity risk, capital risk, and administrative risk) in Jordanian banks. To reduce the effect of unsystematic risks and, thus, improve banking performance, an audit approach based on business risks has emerged. To achieve the objectives, this study relied on descriptive statistics and the regression approach to study twenty-five Jordanian banks. The researcher used the intentional sampling method represented by employees of the accounting, financial and control departments in Jordanian banks. Seventeen banks contributed to the study, with a percentage of 68%, totaling 356 employees. A questionnaire was designed to obtain the data, and due to homogeneity among the sampling members, a purposive sample was drawn and 300 questionnaires were distributed. The results of the study found a statistically significant effect of the audit approach based on business risks with its combined dimensions on reducing unsystematic risks in Jordanian banks. The results of the study also found a statistically significant effect of the business risk-based audit approach with its combined dimensions on reducing operational risks in Jordanian banks.