• 제목/요약/키워드: k-means clustering Algorithm

검색결과 545건 처리시간 0.025초

HCBKA를 이용한 Interval Type-2 퍼지 논리시스템 기반 예측 시스템 설계 (Prediction System Design based on An Interval Type-2 Fuzzy Logic System using HCBKA)

  • 방영근;이철희
    • 산업기술연구
    • /
    • 제30권A호
    • /
    • pp.111-117
    • /
    • 2010
  • To improve the performance of the prediction system, the system should reflect well the uncertainty of nonlinear data. Thus, this paper presents multiple prediction systems based on Type-2 fuzzy sets. To construct each prediction system, an Interval Type-2 TSK Fuzzy Logic System and difference data were used, because, in general, it has been known that the Type-2 Fuzzy Logic System can deal with the uncertainty of nonlinear data better than the Type-1 Fuzzy Logic System, and the difference data can provide more steady information than that of original data. Also, to improve each rule base of the fuzzy prediction systems, the HCBKA (Hierarchical Correlation Based K-means clustering Algorithm) was applied because it can consider correlationship and statistical characteristics between data at a time. Subsequently, to alleviate complexity of the proposed prediction system, a system selection method was used. Finally, this paper analyzed and compared the performances between the Type-1 prediction system and the Interval Type-2 prediction system using simulations of three typical time series examples.

  • PDF

EDGE: An Enticing Deceptive-content GEnerator as Defensive Deception

  • Li, Huanruo;Guo, Yunfei;Huo, Shumin;Ding, Yuehang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1891-1908
    • /
    • 2021
  • Cyber deception defense mitigates Advanced Persistent Threats (APTs) with deploying deceptive entities, such as the Honeyfile. The Honeyfile distracts attackers from valuable digital documents and attracts unauthorized access by deliberately exposing fake content. The effectiveness of distraction and trap lies in the enticement of fake content. However, existing studies on the Honeyfile focus less on this perspective. In this work, we seek to improve the enticement of fake text content through enhancing its readability, indistinguishability, and believability. Hence, an enticing deceptive-content generator, EDGE, is presented. The EDGE is constructed with three steps: extracting key concepts with a semantics-aware K-means clustering algorithm, searching for candidate deceptive concepts within the Word2Vec model, and generating deceptive text content under the Integrated Readability Index (IR). Furthermore, the readability and believability performance analyses are undertaken. The experimental results show that EDGE generates indistinguishable deceptive text content without decreasing readability. In all, EDGE proves effective to generate enticing deceptive text content as deception defense against APTs.

Method for Estimating Intramuscular Fat Percentage of Hanwoo(Korean Traditional Cattle) Using Convolutional Neural Networks in Ultrasound Images

  • Kim, Sang Hyun
    • International journal of advanced smart convergence
    • /
    • 제10권1호
    • /
    • pp.105-116
    • /
    • 2021
  • In order to preserve the seeds of excellent Hanwoo(Korean traditional cattle) and secure quality competitiveness in the infinite competition with foreign imported beef, production of high-quality Hanwoo beef is absolutely necessary. %IMF (Intramuscular Fat Percentage) is one of the most important factors in evaluating the value of high-quality meat, although standards vary according to food culture and industrial conditions by country. Therefore, it is required to develop a %IMF estimation algorithm suitable for Hanwoo. In this study, we proposed a method of estimating %IMF of Hanwoo using CNN in ultrasound images. First, the proposed method classified the chemically measured %IMF into 10 classes using k-means clustering method to apply CNN. Next, ROI images were obtained at regular intervals from each ultrasound image and used for CNN training and estimation. The proposed CNN model is composed of three stages of convolution layer and fully connected layer. As a result of the experiment, it was confirmed that the %IMF of Hanwoo was estimated with an accuracy of 98.2%. The correlation coefficient between the estimated %IMF and the real %IMF by the proposed method is 0.97, which is about 10% better than the 0.88 of the previous method.

AWS자료 기반 SVR과 뉴로-퍼지 알고리즘 구현 호우주의보 가이던스 연구 (A Study on Heavy Rainfall Guidance Realized with the Aid of Neuro-Fuzzy and SVR Algorithm Using AWS Data)

  • 임승준;오성권;김용혁;이용희
    • 전기학회논문지
    • /
    • 제63권4호
    • /
    • pp.526-533
    • /
    • 2014
  • In this study, we introduce design methodology to develop a guidance for issuing heavy rainfall warning by using both RBFNNs(Radial basis function neural networks) and SVR(Support vector regression) model, and then carry out the comparative studies between two pattern classifiers. Individual classifiers are designed as architecture realized with the aid of optimization and pre-processing algorithm. Because the predictive performance of the existing heavy rainfall forecast system is commonly affected from diverse processing techniques of meteorological data, under-sampling method as the pre-processing method of input data is used, and also data discretization and feature extraction method for SVR and FCM clustering and PSO method for RBFNNs are exploited respectively. The observed data, AWS(Automatic weather wtation), supplied from KMA(korea meteorological administration), is used for training and testing of the proposed classifiers. The proposed classifiers offer the related information to issue a heavy rain warning in advance before 1 to 3 hours by using the selected meteorological data and the cumulated precipitation amount accumulated for 1 to 12 hours from AWS data. For performance evaluation of each classifier, ETS(Equitable Threat Score) method is used as standard verification method for predictive ability. Through the comparative studies of two classifiers, neuro-fuzzy method is effectively used for improved performance and to show stable predictive result of guidance to issue heavy rainfall warning.

Opcode와 API의 빈도수와 상관계수를 활용한 Cerber형 랜섬웨어 탐지모델에 관한 연구 (A Study on the Cerber-Type Ransomware Detection Model Using Opcode and API Frequency and Correlation Coefficient)

  • 이계혁;황민채;현동엽;구영인;유동영
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권10호
    • /
    • pp.363-372
    • /
    • 2022
  • 최근 코로나 19 팬더믹 이후 원격근무의 확대와 더불어 랜섬웨어 팬더믹이 심화하고 있다. 현재 안티바이러스 백신 업체들이 랜섬웨어에 대응하고자 노력하고 있지만, 기존의 파일 시그니처 기반 정적 분석은 패킹의 다양화, 난독화, 변종 혹은 신종 랜섬웨어의 등장 앞에 무력화될 수 있다. 이러한 랜섬웨어 탐지를 위한 다양한 연구가 진행되고 있으며, 시그니처 기반 정적 분석의 탐지 방법과 행위기반의 동적 분석을 이용한 탐지 연구가 현재 주된 연구유형이라고 볼 수 있다. 본 논문에서는 단일 분석만을 이용하여 탐지모델에 적용하는 것이 아닌 ".text Section" Opcode와 실제 사용하는 Native API의 빈도수를 추출하고 K-means Clustering 알고리즘, 코사인 유사도, 피어슨 상관계수를 이용하여 선정한 특징정보들 사이의 연관성을 분석하였다. 또한, 타 악성코드 유형 중 웜과 Cerber형 랜섬웨어를 분류, 탐지하는 실험을 통해, 선정한 특징정보가 특정 랜섬웨어(Cerber)를 탐지하는 데 특화된 정보임을 검증하였다. 위와 같은 검증을 통해 최종 선정된 특징정보들을 결합하여 기계학습에 적용하여, 최적화 이후 정확도 93.3% 등의 탐지율을 나타내었다.

확장성을 갖는 클러스터 기반의 라우팅 프로토콜 (Scalable Cluster Overlay Source Routing Protocol)

  • 장광수;양효식
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.83-89
    • /
    • 2010
  • 확장성을 제공하는 라우팅 알고리즘은 대규모 MANETs를 운영하는데 중요한 요소 중 하나이다. 현재까지 개발된 라우팅 알고리즘의 성능은 네트워크내의 노드의 수에 종속적이거나 노드의 위치정보를 알아야 하는 등 여러 가지로 제한적이었다. 라우팅 알고리즘의 성능이 네트워크내의 노드의 수에 종속적이어서 노드의 밀도가 증가하는 경우 기존의 알고리즘들은 성능이 현저히 떨어지는 결과를 보인다. 본 논문에서는 확장성 제공을 위한 클러스터링 기반의 Dynamic Source Routing 알고리즘을 제안하고 컴퓨터 시뮬레이션을 이용하여 성능분석을 수행하여 기존의 DSR과 비교하였다. 단위 메시지 당 전송한 경로발견에 사용된 메시지의 수의 경우 DSR과 비교하여 90% 이상 향상된 성능개선을 보였다. 또한 네트워크내의 노드 밀도와 네트워크 사이즈를 변화하면서 성능분석을 수행한 결과 제안된 알고리즘은 동작이 단순하고, 목적지까지의 경로 획득에 있어서 메시지나 경로 획득 수행시간의 복잡도가 네트워크 내의 노드의 수가 증가하더라도 일정한 성능을 보인다.

다기간 자료포락분석을 이용한 전기차 충전소 효율성 변화 분석 (Analysis on the Efficiency Change in Electric Vehicle Charging Stations Using Multi-Period Data Envelopment Analysis)

  • 손동훈;강영수;김화중
    • 산업경영시스템학회지
    • /
    • 제44권2호
    • /
    • pp.1-14
    • /
    • 2021
  • It is highly challenging to measure the efficiency of electric vehicle charging stations (EVCSs) because factors affecting operational characteristics of EVCSs are time-varying in practice. For the efficiency measurement, environmental factors around the EVCSs can be considered because such factors affect charging behaviors of electric vehicle drivers, resulting in variations of accessibility and attractiveness for the EVCSs. Considering dynamics of the factors, this paper examines the technical efficiency of 622 electric vehicle charging stations in Seoul using data envelopment analysis (DEA). The DEA is formulated as a multi-period output-oriented constant return to scale model. Five inputs including floating population, number of nearby EVCSs, average distance of nearby EVCSs, traffic volume and traffic congestion are considered and the charging frequency of EVCSs is used as the output. The result of efficiency measurement shows that not many EVCSs has most of charging demand at certain periods of time, while the others are facing with anemic charging demand. Tobit regression analyses show that the traffic congestion negatively affects the efficiency of EVCSs, while the traffic volume and the number of nearby EVCSs are positive factors improving the efficiency around EVCSs. We draw some notable characteristics of efficient EVCSs by comparing means of the inputs related to the groups classified by K-means clustering algorithm. This analysis presents that efficient EVCSs can be generally characterized with the high number of nearby EVCSs and low level of the traffic congestion.

쇼핑 웹사이트 탐색 유형과 방문 패턴 분석 (Analysis of shopping website visit types and shopping pattern)

  • 최경빈;남기환
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.85-107
    • /
    • 2019
  • 온라인 소비자는 쇼핑 웹사이트에서 특정 제품군이나 브랜드에 속한 제품들을 둘러보고 구매를 진행할 수 있고, 혹은 단순히 넓은 범위의 탐색 반경을 보이며 여러 페이지들을 돌아보다 구매를 진행하지 않고 이탈할 수 있다. 이러한 온라인 소비자의 행동과 구매에 관련된 연구는 꾸준히 진행되어왔으며, 실무에서도 소비자들의 행동 데이터를 바탕으로 한 서비스 및 어플리케이션이 개발되고 있다. 최근에는 빅데이터 기술의 발달로 소비자 개인 단위의 맞춤화 전략 및 추천 시스템이 활용되고 있으며 사용자의 쇼핑 경험을 최적화하기 위한 시도가 진행되고 있다. 하지만 이와 같은 시도에도 온라인 소비자가 실제로 웹사이트를 방문해 제품 구매 단계까지 전환될 확률은 매우 낮은 실정이다. 이는 온라인 소비자들이 단지 제품 구매를 위해 웹사이트를 방문하는 것이 아니라 그들의 쇼핑 동기 및 목적에 따라 웹사이트를 다르게 활용하고 탐색하기 때문이다. 따라서 단지 구매가 진행되는 방문 외에도 다양한 방문 형태를 분석하는 것은 온라인 소비자들의 행동을 이해하는데 중요하다고 할 수 있다. 이러한 관점에서 본 연구에서는 온라인 소비자의 탐색 행동의 다양성과 복잡성을 설명하기 위해 실제 E-commerce 기업의 클릭스트림 데이터를 기반으로 세션 단위의 클러스터링 분석을 진행해 탐색 행동을 유형화하였다. 이를 통해 각 유형별로 상세 단위의 탐색 행동과 구매 여부가 차이가 있음을 확인하였다. 또한 소비자 개인이 여러 방문에 걸친 일련의 탐색 유형에 대한 패턴을 분석하기 위해 순차 패턴 마이닝 기법을 활용하였으며, 같은 기간 내에 제품 구매까지 완료한 소비자와 구매를 진행하지 않은 채 방문만 진행한 소비자들의 탐색패턴에 대한 차이를 확인할 수 있었다. 본 연구의 시사점은 대규모의 클릭스트림 데이터를 활용해 온라인 소비자의 탐색 유형을 분석하고 이에 대한 패턴을 분석해 구매 과정 상의 행동을 데이터 기반으로 설명하였다는 점에 있다. 또한 온라인 소매 기업은 다양한 형태의 탐색 유형에 맞는 마케팅 전략 및 추천을 통해 구매 전환 개선을 시도할 수 있으며, 소비자의 탐색 패턴의 변화를 통해 전략의 효과를 평가할 수 있을 것이다.

중소하천유역에서 Hybrid Neural Networks에 의한 수문학적 예측 (Hydrological Forecasting Based on Hybrid Neural Networks in a Small Watershed)

  • 김성원;이순탁;조정식
    • 한국수자원학회논문집
    • /
    • 제34권4호
    • /
    • pp.303-316
    • /
    • 2001
  • 본 연구에서는 중소하천수계에서 수문학적 예측을 위하여 Hybrid Neural Networks의 일종인 반경기초함수(RBF) 신경망모형이 적용되었다. RBF 신경망모형은 4종류의 매개변수로 구성되어 있으며, 지율 및 지도훈련과정으로 이루어져있다. 반경기초함수로서 가우스핵함수(GKF)가 이용되었으며, GKF의 매개변수인 중심과 폭은 K-Means 군집알고리즘에 의해 최적화 된다. 그리고 RBF 신경망모형의 매개변수인 중심, 폭, 연결강도와 편차벡터는 훈련을 통하여 최적 매개변수의 값이 결정되며, 이 매개변수들을 이용하여 모형의 검증과정이 이루어진다. RBF 신경망모형은 한국의 IHP 대표유역중 하나인 위천유역에 적용하였으며, 모형의 훈련과 검증을 위하여 10개의 강우사상을 선택하였다. 또한 RBF 신경망모형과 비교검토하기 위하여 엘만 신경망(ENN)모형을 이용하였으며, ENN 모형은 일단게 할선역전파(OSSBP) 및 탄성역전파(RBP)알고리즘으로 이루어져 있다. 모형의 훈련과 검증과정을 통하여 RBF 신경망모형이 ENN 모형보다 양호한 결과를 나타내는 것으로 분석되었다. RBF 신경망모형은 훈련시키는데 시간이 적게 들고, 이론적 배경이 부족한 수문학자들도 쉽게 사용할 수 있는 신경망모형이다.

  • PDF

(2D)2PCA 알고리즘을 이용한 pRBFNNs 패턴분류기 기반 얼굴인식 시스템 설계 (Design of pRBFNNs Pattern Classifier-based Face Recognition System Using 2-Directional 2-Dimensional PCA Algorithm)

  • 오성권;진용탁
    • 전자공학회논문지
    • /
    • 제51권1호
    • /
    • pp.195-201
    • /
    • 2014
  • 본 연구에서는 $(2D)^2PCA$ 알고리즘을 이용한 pRBFNNs 패턴분류기 기반 얼굴인식 시스템을 설계하였다. 기존의 1차원 PCA는 행과 열의 곱으로 표현한 이미지의 차원을 축소한다. 하지만 $(2D)^2PCA$(2-Directional 2-Dimensional Principal Components Analysis)는 이미지의 행과 열에서 각각 차원축소를 수행한다. 그 다음 제안된 지능형 패턴분류기로 축소된 이미지를 사용하여 성능을 평가한다. (pRBFNNs)로 성능 평가를 한다. 제안된 다항식 기반 RBFNNs은 조건부, 결론부, 추론부 세가지의 기능적 모듈로 구성되어 있고 조건는 퍼지 클러스터링을 사용하여 입력 공간을 분할하고, 결론부는 RBFNNs의 연결가중치로 일차 선형식으로 표현한다. 또한 차분진화 알고리즘을 이용하여 제안된 분류기의 파라미터, 즉 입력의 수, 퍼지 클러스터링의 퍼지화 계수를 최적화 한다. 얼굴인식에 많이 사용되는 Yale과 AT&T를 사용하여 인식률을 평가하였다. 실험 평가를 위해 IC&CI 연구실 데이터를 추가하여 실험하였다.