• 제목/요약/키워드: Statistical Area Metric

검색결과 11건 처리시간 0.027초

The Robustness of Coding and Modulation for Body-Area Networks

  • Biglieri, Ezio;Alrajeh, Nabil
    • Journal of Communications and Networks
    • /
    • 제16권3호
    • /
    • pp.264-269
    • /
    • 2014
  • We consider transmission over body area networks. Due to the difficulty in assessing an accurate statistical model valid for multiple scenarios, we advocate a system design technique favoring robustness. Our approach, which is based on results in [12] and generalizes them, examines the variation of a performance metric when the nominal statistical distribution of fading is replaced by the worst distribution within a given Kullback-Leibler divergence from it. The sensitivity of the performance metric to the divergence from the nominal distribution can be used as an indication of the design robustness. This concept is applied by evaluating the error probability of binary uncoded modulation and the outage probability-the first parameter is useful to assess system performance with no error-control coding, while the second reflects the performance when a near-optimal code is used. The usefulness of channel coding can be assessed by comparing its robustness with that of uncoded transmission.

Applying a modified AUC to gene ranking

  • Yu, Wenbao;Chang, Yuan-Chin Ivan;Park, Eunsik
    • Communications for Statistical Applications and Methods
    • /
    • 제25권3호
    • /
    • pp.307-319
    • /
    • 2018
  • High-throughput technologies enable the simultaneous evaluation of thousands of genes that could discriminate different subclasses of complex diseases. Ranking genes according to differential expression is an important screening step for follow-up analysis. Many statistical measures have been proposed for this purpose. A good ranked list should provide a stable rank (at least for top-ranked gene), and the top ranked genes should have a high power in differentiating different disease status. However, there is a lack of emphasis in the literature on ranking genes based on these two criteria simultaneously. To achieve the above two criteria simultaneously, we proposed to apply a previously reported metric, the modified area under the receiver operating characteristic cure, to gene ranking. The proposed ranking method is found to be promising in leading to a stable ranking list and good prediction performances of top ranked genes. The findings are illustrated through studies on both synthesized data and real microarray gene expression data. The proposed method is recommended for ranking genes or other biomarkers for high-dimensional omics studies.

물리적 불확실성을 내재한 입력변수의 확률 통계 기반 유효 범위 결정 방법 및 신뢰성 평가 (Statistical Effective Interval Determination and Reliability Assessment of Input Variables Under Aleatory Uncertainties)

  • 주민호;도재혁;최수교;이종수
    • 대한기계학회논문집A
    • /
    • 제41권11호
    • /
    • pp.1099-1108
    • /
    • 2017
  • 동일한 시험조건에서 반복시험으로부터 얻어진 실험 데이터는 이론적으로 동일한 값을 가져야 한다. 그러나 실제 데이터 결과는 다양한 환경 요소들에 의해 발생하는 오차와 불확실성을 가지게 되어 시험 값이 변동량을 가진다. 이는 정확한 실험 데이터를 얻는데 제한사항이 된다. 본 연구에서는 확률통계 방법을 이용하여 불확실성을 가진 입력변수의 유효범위를 결정하는 알고리즘을 제안하였다. 또한 실제 현장에서 사용되는 볼트 체결 마찰계수 데이터를 이용하여 제안된 알고리즘을 적용하여 불확실성을 내재한 입력변수의 유효범위를 산출하고 이에 대한 신뢰성 평가를 하였다.

A Comparative Study of Phishing Websites Classification Based on Classifier Ensemble

  • Tama, Bayu Adhi;Rhee, Kyung-Hyune
    • 한국멀티미디어학회논문지
    • /
    • 제21권5호
    • /
    • pp.617-625
    • /
    • 2018
  • Phishing website has become a crucial concern in cyber security applications. It is performed by fraudulently deceiving users with the aim of obtaining their sensitive information such as bank account information, credit card, username, and password. The threat has led to huge losses to online retailers, e-business platform, financial institutions, and to name but a few. One way to build anti-phishing detection mechanism is to construct classification algorithm based on machine learning techniques. The objective of this paper is to compare different classifier ensemble approaches, i.e. random forest, rotation forest, gradient boosted machine, and extreme gradient boosting against single classifiers, i.e. decision tree, classification and regression tree, and credal decision tree in the case of website phishing. Area under ROC curve (AUC) is employed as a performance metric, whilst statistical tests are used as baseline indicator of significance evaluation among classifiers. The paper contributes the existing literature on making a benchmark of classifier ensembles for web phishing detection.

A Comparative Study of Phishing Websites Classification Based on Classifier Ensembles

  • Tama, Bayu Adhi;Rhee, Kyung-Hyune
    • Journal of Multimedia Information System
    • /
    • 제5권2호
    • /
    • pp.99-104
    • /
    • 2018
  • Phishing website has become a crucial concern in cyber security applications. It is performed by fraudulently deceiving users with the aim of obtaining their sensitive information such as bank account information, credit card, username, and password. The threat has led to huge losses to online retailers, e-business platform, financial institutions, and to name but a few. One way to build anti-phishing detection mechanism is to construct classification algorithm based on machine learning techniques. The objective of this paper is to compare different classifier ensemble approaches, i.e. random forest, rotation forest, gradient boosted machine, and extreme gradient boosting against single classifiers, i.e. decision tree, classification and regression tree, and credal decision tree in the case of website phishing. Area under ROC curve (AUC) is employed as a performance metric, whilst statistical tests are used as baseline indicator of significance evaluation among classifiers. The paper contributes the existing literature on making a benchmark of classifier ensembles for web phishing detection.

A Detailed Analysis of Classifier Ensembles for Intrusion Detection in Wireless Network

  • Tama, Bayu Adhi;Rhee, Kyung-Hyune
    • Journal of Information Processing Systems
    • /
    • 제13권5호
    • /
    • pp.1203-1212
    • /
    • 2017
  • Intrusion detection systems (IDSs) are crucial in this overwhelming increase of attacks on the computing infrastructure. It intelligently detects malicious and predicts future attack patterns based on the classification analysis using machine learning and data mining techniques. This paper is devoted to thoroughly evaluate classifier ensembles for IDSs in IEEE 802.11 wireless network. Two ensemble techniques, i.e. voting and stacking are employed to combine the three base classifiers, i.e. decision tree (DT), random forest (RF), and support vector machine (SVM). We use area under ROC curve (AUC) value as a performance metric. Finally, we conduct two statistical significance tests to evaluate the performance differences among classifiers.

Measuring the Impact of Change Orders on Project Performances by Building Type

  • Juarez, Marcus;Kim, Joseph J.
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.179-187
    • /
    • 2022
  • The project performances can be measured in terms of meeting the project schedule, budget, and conformance to functional and technical specifications. Numerous studies have been conducted to examine the causes and effects of change orders for both vertical and horizontal construction, respectively. However, these studies mainly focus on a single project type, so this paper examines the impact of change order for cost growth and schedule overruns using four different building types to close the gap in the change order research area. A total of 211 building projects are collected from four building types: healthcare, residential, office, and education. Statistical analyses using ANOVA tests and linear regression models are used to examine the created metric $CO/day on the cost and schedule impacts. The results found that mean $CO/day values were not statistically different among building types, and that the sum of change orders is a statistically significant predictor of $CO/day. The results will help project stakeholders mitigate the negative change orders effects can be a challenge for project managers and researchers alike.

  • PDF

전국자연환경조사를 활용한 포유류 서식지 유형의 분류 (The Habitat Classification of mammals in Korea based on the National Ecosystem Survey)

  • 이화진;하정욱;차진열;이중효;윤희남;정철운;오홍식;배소연
    • 환경영향평가
    • /
    • 제26권2호
    • /
    • pp.160-170
    • /
    • 2017
  • 본 연구는 2006년부터 2012년까지 수행된 제3차 전국자연환경조사 포유류 데이터(70,562개)를 활용하여 국내에서 서식하는 포유류의 서식지 유형을 클러스터링하고 서식지 유형에 나타나는 종의 특징을 파악하고자 하였다. 제3차 전국자연환경조사의 야장에 기록된 서식지 유형 중에서 15개의 키워드를 뽑아 재분류하여 포유류 서식지유형을 통계 분석하였다. 서식지 유형 군집분석에서는 30회 이상 기록된 14개의 서식지 유형을 대상으로 비계층적 클러스터 분석(k 평균 클러스터 분석), 계층적 클러스터 분석, 비계량형 다차원척도법을 시행하였다. 2006년에서 2012년까지 전국에서 수집된 제3차 전국자연환경조사를 통해 확인된 포유류는 총 7목 16과 39종이었다. 서식지 유형에 대한 분류는 11개로 클러스터를 분류했을 때 단순구조지수가 가장 높았다(ssi = 0.07). 계층적 클러스터 분석으로 서식지 유형들 간의 유사성과 위계를 확인해 본 결과, 포유류에게는 주거지가 가장 차별된 서식지 유형이었고, 그 다음은 하천과 해안이 병합된 클러스터였다. 비계량형 다차원척도 분석 결과, 포유류에게 가장 차별된 서식지유형인 주거지의 경우 생쥐와 집쥐 두 종이 제한적으로 나타났으며, 해안과 하천의 경우 수달이 제한적으로 나타났다. 연구결과를 종합해보면, 포유류의 서식지 유형은 크게 산림을 주요 서식지와 이동경로로 이용하는 산림형과, 물을 주요 서식지로 이용하는 하천형, 주거지 인근에서 서식하는 주거형, 곡류나 씨앗을 주 먹이원으로 하는 저지대형 등 4가지로 구분할 수 있다.

농촌 및 자연지역의 경관 다양성 평가모형 개발 및 적용 (Development and Application of Landscape Diversity Evaluation Model on the Basis of Rural and Natural Area)

  • 나정화;이용은;조현주;구지나;권오성
    • 한국조경학회지
    • /
    • 제41권6호
    • /
    • pp.84-95
    • /
    • 2013
  • 최근 경관훼손 문제에 대응하기 위해 사전 예방적 차원에서 우수한 경관지역을 선정하려는 노력이 이루어지고 있다. 특히 경관 다양성은 경관 구성요소를 평가하기 위한 핵심적인 방법으로 보존가치가 높은 지역의 경관 질을 평가하는데 중요한 기준이 될 수 있다. 따라서 본 연구는 경관을 구성하고 있는 다양한 요소들을 고려한 경관 다양성 평가모형을 설정해 보고, 이를 연구대상지에 적용해 봄으로써 평가모형을 검증하는데 가장 큰 목적을 두었다. 국내 외 문헌 및 연구 자료를 분석한 결과, 경관 다양성 평가모형을 구축하기 위한 지표로서 지형, 식생, 토지이용형태, 특이경관 등 총 4개의 항목이 도출되었다. 지형의 다양성은 지표면 기복정도와 지표면 형태의 다양성을 세부지표로 선정하였으며, 식생의 다양성에서는 식물군락과 층위구조의 다양성을 세부지표로 선정하였다. 각 평가지표의 다양성을 정량적으로 평가하기 위하여 Shannon의 다양성 지수(SHDI)를 응용하였으며, 작성된 각 지표별 유형분류도면에 귀속되는 출현유형과 면적을 Fragstats 4.0에 대입하여 결과값을 산출하였다. 마지막으로 세부지표별 결과값의 표준화 및 합산과정을 거쳐 최종 경관 다양성 지수값을 산출하였다. 이러한 본 연구의 결과는 경관 다양성 평가의 초기 연구 단계로서 방향제시 및 가능성을 모색해 보는데 의의가 있었다. 또한 추후 연구를 통하여 경관 구성요소를 평가하는 핵심 방법으로서, 우수한 경관의 질을 평가하는 중요한 기준으로 활용될 가능성이 있을 것으로 사료된다. 그러나 본 연구에서 제시한 경관 다양성 평가모형은 4가지 지표를 종합적으로 고려하였던바, 우세성을 가지는 세부지표에 대한 고려가 반드시 필요할 것으로 사료된다. 더불어 각 평가지표의 결과값을 표준화하는 과정에서 차후 평가지표별 최대값에 대한 축척된 자료가 보완되어야 할 것으로 사료되며, 다양한 면적과 유형의 사례지들을 분석하여 객관성을 높여 나갈 필요가 있을 것으로 판단된다.

폐광산 지역의 유출수에 대한 이.화학적 수질특성 및 Enclosure 어류 노출시험 평가 (Physico-chemical Characteristics and In situ Fish Enclosure Bioassays on Wastewater Outflow in Abandoned Mine Watershed)

  • 안광국;배대열;한정호
    • 생태와환경
    • /
    • 제45권2호
    • /
    • pp.218-231
    • /
    • 2012
  • 본 연구는 2005~2007년까지 3년에 걸쳐 폐광산 수계의 유출수에 의해 직접적으로 영향 받는 하천 및 대조군(Control, $C_o$) 하천에서 이 화학적 수질특성, 수질 내성도 및 트로픽 길드 특성, 다변수 생태모형(Multimetric Health Model)을 이용한 생태 건강도 평가 및 물리적 건강도 평가 모형(QHEI model)을 이용한 생물 서식지 평가를 실시하였다. 또한, 폐광산의 유출수에 대한 생태독성 평가를 위해 버들치(Rhynchocypris oxycephalus)를 이용하여 현장 Enclosure 노출시험(In situ Enclosure Bioassay)을 실시하였고, 해부학적 장기 조직의 평가지수 모형(Necropy-based Health Assessment Index, $N_b$-HAI)을 이용하여 대조군($C_o$)과 처리군(T)의 광산폐수의 영향을 평가하였다. 이들에 대한 장기 조직의 영향평가는 각 Enclosure에 10 개체씩 투입하여 지라(Spleen), 신장(Kidney), 아가미(Gill), 간(Liver), 눈(Eyes), 지느러미(Fins)의 조직분석(Tissue analysis)을 실시하였다. 대조군과의 비교평가에 따르면, 폐광산의 유출수는 하천수를 pH 3.2까지 떨어뜨려 강한 산성폐수와 유사한 특성을 보였고, 급격한 수소이온 증가 및 총용존물질(Total Dissolved Solid, TDS)의 증가를 가져왔다. 서식지 평가의 QHEI 모델 값은 지점별 유의한 차이(p>0.05)를 보이지 않은 반면, 다변수 생태모형(Multimetric Health Model)을 이용한 생태 건강도는 3년 동안 대조군($C_o$)에서 $M_m$-EH 모델 값은 16~20, 처리군($M_w$)에서는 0으로 폐광 유출수의 영향을 받는 지점에서는 "악화상태(P)"로 나타났다. 또한, Enclosure 노출평가 따르면, $N_b$-HAI 모델값은 3년 기간 동안 대조군에서 0~3으로 나타나 "최적~양호상태" (Ex~G)로 나타난 반면, 폐광 유출수의 Enclosure에 포함된 처리군(Treatment)에서 모델값은 모두 100 이상(범위: 100~137)을 상회하여 "악화상태(P)"로 평가되었으며, 크게 손상된 장기조직은 간(Liver), 신장(Kidney), 아가미(Gill)로 나타나 향후 폐광산 유출지역의 수질 및 생태관리가 시급한 것으로 사료되었다.