• Title/Summary/Keyword: spam detection

검색결과 58건 처리시간 0.021초

On the Performance of Cuckoo Search and Bat Algorithms Based Instance Selection Techniques for SVM Speed Optimization with Application to e-Fraud Detection

  • AKINYELU, Andronicus Ayobami;ADEWUMI, Aderemi Oluyinka
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권3호
    • /
    • pp.1348-1375
    • /
    • 2018
  • Support Vector Machine (SVM) is a well-known machine learning classification algorithm, which has been widely applied to many data mining problems, with good accuracy. However, SVM classification speed decreases with increase in dataset size. Some applications, like video surveillance and intrusion detection, requires a classifier to be trained very quickly, and on large datasets. Hence, this paper introduces two filter-based instance selection techniques for optimizing SVM training speed. Fast classification is often achieved at the expense of classification accuracy, and some applications, such as phishing and spam email classifiers, are very sensitive to slight drop in classification accuracy. Hence, this paper also introduces two wrapper-based instance selection techniques for improving SVM predictive accuracy and training speed. The wrapper and filter based techniques are inspired by Cuckoo Search Algorithm and Bat Algorithm. The proposed techniques are validated on three popular e-fraud types: credit card fraud, spam email and phishing email. In addition, the proposed techniques are validated on 20 other datasets provided by UCI data repository. Moreover, statistical analysis is performed and experimental results reveals that the filter-based and wrapper-based techniques significantly improved SVM classification speed. Also, results reveal that the wrapper-based techniques improved SVM predictive accuracy in most cases.

지지벡터기계를 이용한 스팸 블로그(Splog) 판별 시스템 (A Splog Detection System Using Support Vector Systems)

  • 이성욱
    • 한국정보통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.163-168
    • /
    • 2011
  • 블로그는 인터넷 공간에서 가장 손쉽게 정보 출간, 토론 참여, 커뮤니티 형성하는 수단이다. 그러나 최근에 광고를 유치하거나 페이지 순위를 올리기 위한 목적의 다양한 스팸 블로그가 범람하고 있다. 본 연구의 목적은 웹 환경에서 이러한 스팸 블로그(Splog)를 자동으로 판별하는 시스템을 개발하는 것이다. 먼저 블로그의 HTML을 제거한 후 품사를 부착하였다. 어휘/품사 쌍을 자질로 사용하였으며 카이제곱 통계량을 이용하여 유용한 자질을 선택하였다. 선택된 자질의 가중치를 벡터로 표현한 후, 지지벡터기계(Support Vector Machines)를 학습하여 자동으로 스팸 블로그를 판별하는 시스템을 제안하였으며, SPLOG 데이터 집합으로 실험한 결과 F1척도로 90.5%의 정확률을 얻었다.

포스트의 구조 유사성과 일일 발행수를 이용한 스플로그 탐지 (Splog Detection Using Post Structure Similarity and Daily Posting Count)

  • 백지현;조정식;김성권
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.137-147
    • /
    • 2010
  • 블로그는 웹과 로그의 합성어로, 개개인의 생각이나 관심사 등을 일기처럼 기록할 수 있는 웹 서비스이다. 블로그에는 문자 외에, 그림이나 비디오 파일 등 다양한 컨텐츠를 올릴 수 있다. 일반적으로 블로그의 포스트는 시간상의 역순으로 정렬되어 표현된다. 블로그 검색 엔진은 웹 검색 엔진처럼 블로그를 대상으로 사용자의 질의에 따라 정보를 찾아주는 서비스이다. 블로그 검색 엔진은 때때로 만족스럽지 못한 결과를 내곤 하는데, 이것은 스플로그라고 불리는 블로그 스팸에 의해 발생한다. 스플로그는 다른 블로그나 웹 페이지를 무단 도용하거나 자동으로 생성된 컨텐츠로 구성된 스팸 포스트를 가지고 있다. 스플로그는 검색 엔진의 검색 순위를 높이거나, 회원 가입 사이트로 보다 많은 사람들을 유치하기 위해 사용된다. 본 논문은 스플로그 탐지를 목적으로 한다. 본 논문에서 제안하는 스플로그 탐지 기법은 블로그 포스트의 구조 유사성과 일일 포스트 발행수에 따른 분석으로 토대로 이루어진다. 본 논문에서 제안하는 기법을 바탕으로 한 실험의 결과, 스플로그 탐지에 있어 90% 이상의 높은 정확도를 가지며, 만족할만한 수준을 보여준다.

VoIP 스팸 탐지 기술의 성능 평가를 위한 모델링 및 시물레이션 (Modeling and Simulation for Performance Evaluation of VoIP Spam Detection Mechanism)

  • 김지연;김형종;김명주;정종일
    • 정보보호학회논문지
    • /
    • 제19권3호
    • /
    • pp.95-105
    • /
    • 2009
  • 본 논문은 VoIP의 주요 보안 위협인 스팸에 대응하기 위한 목적으로 VoIP 스팸 탐지 기술의 성능평가를 위한 시뮬레이션 모델을 설계하고 있다. 성능평가 시뮬레이션 모델은 입력 데이터를 제공하는 기능과 출력 데이터를 분석하는 기능을 갖는다. 본 논문에서는 VoIP스팸 탐지 기술의 성능평가 입력 데이터를 위하여 VoIP 발신자 특성을 고려하여 네 종류의 Caller 모델을 개발하였고, 각 caller 모델은 결정된 패턴 내에서 call을 생성하게 된다. 성능평가는 SPIT (Spam over Internet Telephony) Level 결정 알고리즘을 대상으로 수행하고, 성능평가의 지표 도출을 통해 평가 알고리즘의 성능 지수를 산정한다. 성능평가 모델은 DEVS 형식론 기반으로 설계하였으며 DEVSJAVA$^{TM}$를 이용한 모델링 및 시뮬레이션을 통해 설계된 모델을 검증하였다.

무선 센서 네트워크 기반 지능형 화재 감지/경고 시스템 설계 (Design of intelligent fire detection / emergency based on wireless sensor network)

  • 김성호;육의수
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.310-315
    • /
    • 2007
  • 최근 여러 지역에서 발생되는 지하철 참사 및 대형화재 또는 대형 지하상가, 백화점, 지하공간, 대형쇼핑센터, 숙박업소, 공공건물등 대형 다중이용시설등에서 발생될 수 있는 예측 불가능한 인재, 천재지변에 안전하게 대피하기 위한 수단으로 비상등 및 여러 감지기들이 소방법 개정으로 의무설치 하고 있다. 현재 많이 사용되는 휴대용 비상등 및 감지기는 방음벽이나 격벽, 경고 거리의 제한으로 인해 비상시 경고 전파에 많은 어려움을 갖는다. 본 연구에서는 화재 감지/경고 시스템에 최근 다양하게 활용되는 유비쿼터스 센서 네트워크를 적용하여 화재 감지 및 가스누출을 조기 감지 및 경고하고 휴대용 조명등의 위치를 대피자들에게 알림으로써 신속히 대피할 수 있도록 하는 무선 화재 감지/경고 시스템을 제안하고자 한다.

A study on Countermeasures by Detecting Trojan-type Downloader/Dropper Malicious Code

  • Kim, Hee Wan
    • International Journal of Advanced Culture Technology
    • /
    • 제9권4호
    • /
    • pp.288-294
    • /
    • 2021
  • There are various ways to be infected with malicious code due to the increase in Internet use, such as the web, affiliate programs, P2P, illegal software, DNS alteration of routers, word processor vulnerabilities, spam mail, and storage media. In addition, malicious codes are produced more easily than before through automatic generation programs due to evasion technology according to the advancement of production technology. In the past, the propagation speed of malicious code was slow, the infection route was limited, and the propagation technology had a simple structure, so there was enough time to study countermeasures. However, current malicious codes have become very intelligent by absorbing technologies such as concealment technology and self-transformation, causing problems such as distributed denial of service attacks (DDoS), spam sending and personal information theft. The existing malware detection technique, which is a signature detection technique, cannot respond when it encounters a malicious code whose attack pattern has been changed or a new type of malicious code. In addition, it is difficult to perform static analysis on malicious code to which code obfuscation, encryption, and packing techniques are applied to make malicious code analysis difficult. Therefore, in this paper, a method to detect malicious code through dynamic analysis and static analysis using Trojan-type Downloader/Dropper malicious code was showed, and suggested to malicious code detection and countermeasures.

스팸메일 모의훈련 현장실험을 통한 기업의 인적 취약요인 연구 (A Study on Human Vulnerability Factors of Companies : Through Spam Mail Simulation Training Experiments)

  • 이준희;권헌영
    • 정보보호학회논문지
    • /
    • 제29권4호
    • /
    • pp.847-857
    • /
    • 2019
  • 최근 랜섬웨어, 스피어 피싱, APT공격 등 전자메일을 통한 다양한 수법의 사이버 위협이 커지고 있다. 이러한 공격의 특징은 과거 패턴기반탐지 등의 기술적 대책을 우회하기 때문에 개인의 보안인식 개선을 통한 관리적 대응이 중요하다는 점이다. 본 연구는 현장실험을 통해 이러한 스팸메일 공격에 취약한 임직원들의 인적요인을 연구하고 향후 개선방안을 수립하고자 하였다. 한 기업의 임직원을 대상으로 7차례에 걸쳐 훈련용 스팸메일을 발송하고 열람정보를 분석한 결과 훈련의 횟수와 수신자의 성별, 나이, 근무지 등의 인적요인이 열람율과 관계가 있음을 확인하였다. 이러한 분석 결과를 바탕으로 훈련개선 방안을 도출하여, 향후 각 기관의 실효성 있는 모의훈련 수행과 인식개선을 통한 대응능력 향상에 도움이 되고자 한다.

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

전자 상거래 사이트의 가짜 리뷰 판별 기법 조사 (Survey on Fake Review Detection of E-commerce Sites)

  • 지쳉장;장진홍;강대기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.79-81
    • /
    • 2014
  • 전자 상거래 리뷰 정보에 대한 소비자들의 의존도가 증가하고 있다. 제품 리뷰는 잠재적인 고객의 구매 결정에 있어 중요한 결정 요소이다. 제품 리뷰는 또한 상품 제조사들이 자신들의 제품에 대한 문제점을 발견하고 자신들의 경쟁자들에 대한 경쟁 정보를 수집할 수 있도록 해준다. 불행히도 많은 온라인 제품 정보들이 그 제품에 대한 진짜 고객들에 의해 만들어지지 않은 것이라는 것은 잘 알려진 사실이다. 리뷰를 쓰는 사람들은, 특정 제품의 평판을 떨어뜨리기 위해 가짜로 부정적인 리뷰를 쓰거나, 특정 제품에 대해 부당하게 긍정적인 리뷰를 써서 그 제품을 홍보하기도 한다. 이러한 리뷰들을 가짜 리뷰라고 한다. 가짜 리뷰 판별 기법은 가짜 리뷰를 판별하고 삭제하여 진실한 리뷰들만 독자에게 제공하기 위한 기법이다. 현재까지 이 문제에 대한 연구는 많이 발표되지 않았다. 본 논문에서, 우리는 관련 연구들을 조사하고 가짜 리뷰 판별 기법들에 대해 간단히 조망해 보고자 한다. 웹 스팸 및 이메일 스팸과 같은 가짜 리뷰 판별과 관련된 연구들을 소개한다. 그리고, 가짜 리뷰들을 판별하기 위한 방법들을 소개하고 요약한다. 마지막으로 가짜 리뷰 판별에 대한 연구 추세들로 결론을 맺는다.

  • PDF

디지털 영상 픽셀값의 경사도를 이용한 Downscaling Forgery 검출 (Downscaling Forgery Detection using Pixel Value's Gradients of Digital Image)

  • 이강현
    • 전자공학회논문지
    • /
    • 제53권2호
    • /
    • pp.47-52
    • /
    • 2016
  • 스마트 기기와 소형 디스플레이에 사용되는 디지털 영상은 다운스케일링 (Downscaling)된 영상이 사용된다. 본 논문에서는 영상 픽셀값의 경사도에 따른 특징벡터를 이용한 다운스케일링 포저리 (Forgery) 영상 검출 알고리즘을 제안한다. 제안된 알고리즘에서, 원영상의 픽셀값 경사도로부터 자기회귀 (AR: Autoregressive) 계수를 계산한다. 이는 다운스케일링 포저리 영상 검출기의 SVM (Support Vector Machine) 분류를 위한 학습에 사용된다. 제안된 다운스케일링 검출 알고리즘은 동일 10-Dim. 특징벡터의 MFR (Median Filter Residual) 스킴과 686-Dim.의 SPAM (Subtractive Pixel Adjacency Matrix) 스킴과 비교하여 다운스케일링 90% 영상 포저리에서 성능이 우수하며, 평균필터링 ($3{\times}3$) 영상과 미디언필터링 ($3{\times}3$) 영상에서 높은 검출율을 보여 주었다. 특히, 평균필터링과 미디언필터링 영상에서는 성능평가 전체 항목에서 민감도 (Sensitivity; TP: True Positive rate)와 1-특이도 (1-Specificity; FP: False Positive rate)의 AUC (Area Under Curve)가 모두 1에 수렴하여 'Excellent (A)' 등급임을 확인하였다.