• 제목/요약/키워드: model rank

검색결과 607건 처리시간 0.026초

선형 혼합 효과 모형을 이용한 순위 추적 확률 (Rank Tracking Probabilities using Linear Mixed Effect Models)

  • 곽민정
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.241-250
    • /
    • 2015
  • 경시적 자료 연구의 중요한 주제 중의 하나는 시간이 지남에 따라 개인의 건강 상태가 어떻게 변하는지를 추적하는 확률이다. 질병의 상태를 시간의 흐름에 따라 추적하는 것은 장기간에 걸친 임상적 관찰 연구의 계획과 분석, 그리고 질병의 예방과 치료에 중요한 의미를 지닌다. 본 논문에서는 두 다른 시점에서 각 개인의 건강 상태에 대한 조건부 확률을 추정해내는 순위 추적 확률에 대하여 연구하였다. 순위 추적 확률과 순위 추적 확률비를 추정하기 위하여 선형 혼합 효과 모형을 고려하였다. 본 논문의 방법은 아동을 대상으로 심혈관계 질환의 위험요인을 연구하는 역학 자료에 적용되었다.

Google Play Malware Detection based on Search Rank Fraud Approach

  • Fareena, N;Yogesh, C;Selvakumar, K;Sai Ramesh, L
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권11호
    • /
    • pp.3723-3737
    • /
    • 2022
  • Google Play is one of the largest Android phone app markets and it contains both free and paid apps. It provides a variety of categories for every target user who has different needs and purposes. The customer's rate every product based on their experience of apps and based on the average rating the position of an app in these arch varies. Fraudulent behaviors emerge in those apps which incorporate search rank maltreatment and malware proliferation. To distinguish the fraudulent behavior, a novel framework is structured that finds and uses follows left behind by fraudsters, to identify both malware and applications exposed to the search rank fraud method. This strategy correlates survey exercises and remarkably joins identified review relations with semantic and behavioral signals produced from Google Play application information, to distinguish dubious applications. The proposed model accomplishes 90% precision in grouping gathered informational indexes of malware, fakes, and authentic apps. It finds many fraudulent applications that right now avoid Google Bouncers recognition technology. It also helped the discovery of fake reviews using the reviewer relationship amount of reviews which are forced as positive reviews for each reviewed Google play the android app.

단어 동시출현관계로 구축한 계층적 그래프 모델을 활용한 자동 키워드 추출 방법 (Automatic Keyword Extraction using Hierarchical Graph Model Based on Word Co-occurrences)

  • 송광호;김유성
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.522-536
    • /
    • 2017
  • 키워드 추출은 주어진 문서로부터 문서의 주제나 내용에 관련된 단어들을 추출해내는 방법으로 대량의 문서를 다루는 텍스트마이닝 연구들이 전처리에서 공통적으로 거치는 대표 자질 추출에서 중요하게 활용될 수 있다. 본 논문에서는 하나의 문서의 주제에 적합한 키워드를 추출하기 위해 문서에 출현한 단어들 사이의 동시출현관계, 동시출현 단어 쌍 사이의 출현 종속 관계, 단어들 사이의 공통 부분단어 관계 등의 다양한 관계들을 특징으로 활용하여 구축한 계층적 그래프 모델을 제안하고, 그래프를 구성하는 정점(Vertex)들의 중요도를 평가할 때 입력 간선(Edge)에 의한 영향뿐만 아니라 출력 간선에 의한 영향도 고려한 새로운 중요도 산출 방법을 제안하며, 이를 토대로 점진적으로 키워드를 추출해내는 방안을 제안한다. 그리고 제안한 방법의 정확성과 주제적 포괄성 검증을 위해 다양한 분야의 주제를 가진 문서 데이터에 다양한 평가방법을 적용해 기존의 방법보다 전체적으로 더 나은 성능을 보임을 확인하였다.

금강 수계 백제보에서 어류의 종 특성 평가 및 생태평가모델 적용 (Fish Species Compositions and the Application of Ecological Assessment Models to Bekjae Weir, Keum-River Watershed)

  • 문성대;한정호;안광국
    • 한국환경과학회지
    • /
    • 제24권6호
    • /
    • pp.731-741
    • /
    • 2015
  • The objectives of study were to evaluate fish species compositions of trophic guilds and tolerance guilds and apply ecological fish assessment (EFA) models to Bekjae Weir, Keum-River Watershed. The EFA models were Stream Index of Biological Integrity (SIBI) used frequently for running water and Lentic Ecosystem Health Assessment (LEHA) used for assessments of stagnant water. The region of Bekjae Weir as a "four major river project" was originally a lotic ecosystem before the weir construction (2010, $B_{WC}$) but became more like lentic-lotic hybrid system after the construction (2011, $A_{WC}$). In the analysis of species composition and ecological bioindicator (fish), fish species with a preference of running water showed significant decreases (p < 0.05), whereas the species with a preference of stagnant water showed significant increases (p < 0.05). After the weir construction, relative abundances of tolerant species increased, and the proportion of insectivores decreased. This phenomenon indicated the changes of biotic compositions in the system by the weir construction. Applications of SIBI and LEHA models to the system showed that the two model values decreased at the same time after the weir construction ($A_{WC}$), and the region became more like lentic-lotic hybrid system, indicating the degradation of ecosystem health. The model values of SIBI were 19 and 16, respectively, in the BWC and AWC, and the health conditions were both "C-rank". In the mean time, the LEHA model analysis showed that the values was 28 in the BWC and 24 in the AWC, thus the health was turned to be "B-Rank" in the BWC and "C-Rank" in the AWC. indicating a degradation of ecological heath after the weir construction.

사영에 근거한 면접 점수의 통계적 모형 (A statistical model for interview score based on projection)

  • 박철용;김현욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권3호
    • /
    • pp.495-504
    • /
    • 2012
  • 이 연구에서는 면접 점수가 발생되는 통계적 모형을 사영에 근거하여 제시하였다. 이 모형은 피면접자의 개인별 참값과 이와 관련된 변수값이 2차원 평면의 X와 Y축의 값으로 주어졌을 때, 심사위원의 시각을 X축과의 각도로 생각하여 이 축에 사영된 값으로서 심사위원의 면접 점수의 평균으로 잡는 방법이다. 이 값에 개인적 편향과 관측 오차를 더해져 심사위원의 관측 면접 점수가 얻어지게 된다. 이 통계적 모형을 사용하여 흔히 사용되고 있는 면접 점수 표준화 방법인 절사평균법, 순위평균법, z-점수평균법을 비교하였다. 이 모의실험에서는 두 가지 면접 형태, 두 가지 면접자 수, 두 가지 면접자의 전문성 정도, 실제 점수와 관련된 변수 간의 분포 두 가지와 세 가지 상관계수가 고려되었다.

PageRank 특징을 활용한 RDP기반 내부전파경로 탐지 및 SHAP를 이용한 설명가능한 시스템 (RDP-based Lateral Movement Detection using PageRank and Interpretable System using SHAP)

  • 윤지영;김동욱;신건윤;김상수;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권4호
    • /
    • pp.1-11
    • /
    • 2021
  • 인터넷이 발달함에 따라 다양하고 복잡한 사이버공격들이 등장하기 시작했다. 공격들을 방어하기 위해 네트워크 외부에서 다양한 방식의 탐지 시스템들이 활용되었으나 내부에서 공격자를 탐지하는 시스템 및 연구는 현저히 드물어 내부에 들어온 공격자를 탐지하지 못해 큰 문제를 야기하기도 했다. 이를 해결하고자 공격자의 움직임을 추적하고 탐지하는 내부전파경로 탐지 시스템에 대한 연구가 등장하기 시작했다. 특히 그중에서도 Remote Desktop Protocol(RDP) 내 특징을 추출해 탐지하는 방식은 간편하면서도 매우 좋은 결과를 나타내었다. 하지만 그럼에도 불구하고 이전 연구들은 각 로그온 된 노드들 자체의 영향 및 관계성을 고려하지 않았으며, 제시된 특징 또한 일부 모델에서는 떨어지는 결과를 제공하기도 했다. 또한 왜 그렇게 판단했는지 판단에 대해 설명하지 못한다는 문제점도 존재했다. 이는 결과적으로 모델의 신뢰성 및 견고성 문제를 야기하게 된다. 이를 해결하기 위해 본 연구에서는 PageRank 특징을 활용한 RDP기반 내부전파경로 탐지 및 SHAP를 이용한 설명가능한 시스템을 제안한다. 페이지랭크 알고리즘과 여러 통계적인 기법을 활용해 여러 모델에서 활용 가능한 특징들을 생성하고 SHAP을 활용해 모델 예측에 대한 설명을 제공한다. 본 연구에서는 이전 연구에 비해 대부분의 모델에서 더 높은 성능을 보여주는 특징을 생성했고 이를 SHAP을 이용해 효과적으로 증명했다.

Recovering Incomplete Data using Tucker Model for Tensor with Low-n-rank

  • Thieu, Thao Nguyen;Yang, Hyung-Jeong;Vu, Tien Duong;Kim, Sun-Hee
    • International Journal of Contents
    • /
    • 제12권3호
    • /
    • pp.22-28
    • /
    • 2016
  • Tensor with missing or incomplete values is a ubiquitous problem in various fields such as biomedical signal processing, image processing, and social network analysis. In this paper, we considered how to reconstruct a dataset with missing values by using tensor form which is called tensor completion process. We applied Tucker factorization to solve tensor completion which was built base on optimization problem. We formulated the optimization objective function using components of Tucker model after decomposing. The weighted least square matric contained only known values of the tensor with low rank in its modes. A first order optimization method, namely Nonlinear Conjugated Gradient, was applied to solve the optimization problem. We demonstrated the effectiveness of the proposed method in EEG signals with about 70% missing entries compared to other algorithms. The relative error was proposed to compare the difference between original tensor and the process output.

Common Feature Analysis of Economic Time Series: An Overview and Recent Developments

  • Centoni, Marco;Cubadda, Gianluca
    • Communications for Statistical Applications and Methods
    • /
    • 제22권5호
    • /
    • pp.415-434
    • /
    • 2015
  • In this paper we overview the literature on common features analysis of economic time series. Starting from the seminal contributions by Engle and Kozicki (1993) and Vahid and Engle (1993), we present and discuss the various notions that have been proposed to detect and model common cyclical features in macroeconometrics. In particular, we analyze in details the link between common cyclical features and the reduced-rank regression model. We also illustrate similarities and differences between the common features methodology and other popular types of multivariate time series modelling. Finally, we discuss some recent developments in this area, such as the implications of common features for univariate time series models and the analysis of common autocorrelation in medium-large dimensional systems.

Quantile estimation using near optimal unbalanced ranked set sampling

  • Nautiyal, Raman;Tiwari, Neeraj;Chandra, Girish
    • Communications for Statistical Applications and Methods
    • /
    • 제28권6호
    • /
    • pp.643-653
    • /
    • 2021
  • Few studies are found in literature on estimation of population quantiles using the method of ranked set sampling (RSS). The optimal RSS strategy is to select observations with at most two fixed rank order statistics from different ranked sets. In this paper, a near optimal unbalanced RSS model for estimating pth(0 < p < 1) population quantile is proposed. Main advantage of this model is to use each rank order statistics and is distributionfree. The asymptotic relative efficiency (ARE) for balanced RSS, unbalanced optimal and proposed near-optimal methods are computed for different values of p. We also compared these AREs with respect to simple random sampling. The results show that proposed unbalanced RSS performs uniformly better than balanced RSS for all set sizes and is very close to the optimal RSS for large set sizes. For the practical utility, the near optimal unbalanced RSS is recommended for estimating the quantiles.

Variable Selection Theorems in General Linear Model

  • 박정수;윤상후
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.171-179
    • /
    • 2006
  • For the problem of variable selection in linear models, we consider the errors are correlated with V covariance matrix. Hocking's theorems on the effects of the overfitting and the underfitting in linear model are extended to the less than full rank and correlated error model, and to the ANCOVA model.

  • PDF