• 제목/요약/키워드: 스패머

검색결과 21건 처리시간 0.026초

국내 웹 분석을 통한 웹 스팸의 특성 (Characterization of Web Spam through the Korean Web Analysis)

  • 최승진;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (D)
    • /
    • pp.333-338
    • /
    • 2007
  • 웹 스팸(Web Spam)은 스패머가 원하는 페이지를 검색 결과 상단에 올리는 기술이다. 이러한 웹 스팸에 의해 상위 랭크된 페이지는 사용자에게 올바른 정보를 전달해 주지 않는다. 해외에서는 웹 스팸의 심각성을 인식하고 이에 대한 연구 또한 활발히 진행되고 있다. 하지만 국내의 경우 아직 웹 스팸에 대하 연구가 미흡한 실정이다. 또한 해외에서 연구되고 있는 웹 스팸 탐지 기술들은 국내의 웹에 적용시키기 힘들다. 그래서 본 논문은 다양한 방식으로 국내 웹과 검색 사이트의 특성을 분석하고 해외와의 차이점에 대해 알아본다. 그리고 이 차이점을 통해 국내 웹에서 나타날 수 있는 웹 스팸과 앞으로의 연구 방향에 도움을 주고자 한다.

  • PDF

송신자 자가인증 기법을 적용한 스팸차단 서버와 안드로이드 애플리케이션 구현 (Implementation of Anti-Spam Server and Android Application Using Self-Authentication Mechanism)

  • 양인식;백전성;강경태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.35-36
    • /
    • 2017
  • 이메일 서비스 사용자들은 스패머가 무차별적으로 발송하는 스팸메일에 의한 정신적 경제적 피해를 입고 있다. 이러한 피해를 막기 위해 필터링, RBL (Real-time Blackhole List)과 같은 스팸차단 기법이 등장하였고 많은 메일서버에서 사용되고 있다. 그러나 이는 스팸메일의 근본적인 원인은 해결하지 못하며, 높은 차단율을 유지하기 위해서는 지속적인 관리 및 업데이트가 필요하다. 이러한 한계점을 극복하기 위한 기법으로 송신자 자가인증 기법이 있다. 본 논문에서는 송신자 자가인증 기법을 적용하여, 스팸메일을 근본적으로 차단하고 지속적인 업데이트가 필요 없는 스팸차단 서버 및 애플리케이션을 구현하였다.

  • PDF

스팸성 자질과 URL 자질을 이용한 최대엔트로피모델 기반 스팸메일 필터 시스템 (A Spam Filter System based on Maximum Entropy Model Using Spamness Features and URL Features)

  • 공미경;이경순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-219
    • /
    • 2006
  • 본 논문에서는 스팸메일에 나타나는 스팸성 자질과 URL 자질을 이용한 최대엔트로피모델 기반 스팸 필터 시스템을 제안한다. 스팸성 자질은 스패머들이 스팸메일에 인위적으로 넣는 강조 패턴이나 필터 시스템을 통과하기 위해 비정상적으로 변형시킨 단어들을 말한다. 스팸성 자질 외에 반복적으로 나타나는 URL과 비정상적인 Ink도 자질로 사용하였다. 메일 수신자에게 추가적인 정보 제공을 목적으로 하이퍼링크로 연결시키거나 메일에 직접 타이핑한 URL 중 필터 시스템을 피하기 위해 유효하지 알은 비정상적인 URL들이 스팸 메일을 걸러내는데 도움을 줄 수 있기 때문이다. 또한 스팸성 자질과 URL을 각각 적용한 두 분류기를 통합하였다. 분류기의 통합은 각 분류기에 이용된 자질을 독립적으로 사용할 수 있다는 장점을 가지고 있다. 실험 결과를 통해 스팸성 자질과 URL을 이용함으로써 스팸 필터 시스템의 성능을 향상시킬 수 있음을 확인할 수 있었다.

  • PDF

순위 조작 방지를 위한 소설 태깅 서비스 설계 (A Design of Social Tagging Services for Prevention of Manipulation of Ranking)

  • 정한영;최옥경;예홍진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제46차 하계학술발표논문집 20권2호
    • /
    • pp.101-104
    • /
    • 2012
  • 최근 소설 네트워크 서비스(Social Netwrok Services)를 활용한 소설 태깅 서비스에 대한 연구가 활발하게 진행 중이다. 특히 태그 기술을 이용한 협력적 태깅 시스템(collaborative tagging system)은 북마크, 문서, 사진, 동영상과 같은 웹 자원을 조직화하고 공유할 수 있는 수단으로 제공하고 있다. 그러나 광고 홍보 목적을 가진 스패머들은 콘텐츠와 관련 없는 태그를 달아 놓아 검색 키워드와 무관한 결과 값이 검색되어 웹 검색 서비스를 이용하는 사용자들에게 불편을 주고 있다. 따라서 본 연구에서는 콘텐츠와 태그의 연관성을 높이기 위해 태그에 일반 사용자가 유사도를 입력할 수 있는 추천 시스템을 적용하여 순위 조작 방지방법을 제안하였다.

  • PDF

크라우드소싱 기반 문장재구성 방법을 통한 의견 스팸 데이터셋 구축 및 평가 (A Crowdsourcing-Based Paraphrased Opinion Spam Dataset and Its Implication on Detection Performance)

  • 이성운;김성순;박동현;강재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.338-343
    • /
    • 2016
  • 웹이 정보 교환의 주된 수단으로 사용되면서, 온라인 리뷰의 중요도가 증가하는 동시에 사용자의 올바른 의사결정을 저해하는 의견 스팸 이슈가 부각되고 있으며, 관련 연구가 활발하게 진행되고 있다. 하지만 분석 및 학습에 필요한 기준 데이터셋의 부족함과 한계점들은 관련 연구의 발전을 더디게 하고 있다. 본 논문에서는 사실 리뷰를 모사한 새로운 형태의 Paraphrased Opinion Spam(POS) 데이터셋을 소개한다. 우리는 실제 스패머들이 스팸을 작성할 때 실제 리뷰를 참고한다는 경향에 착안하여, 실제 리뷰어들이 작성한 리뷰를 의역하는 과정을 통하여 본문에 포함되어 있는 사실 정보와 경험을 담은 스팸 데이터 셋을 생성하였다. 실험 결과, 새롭게 생성된 POS 데이터셋이 언어학적으로 실제 리뷰들과 유사하여 스팸 분류 모델을 이용하여 분류 시 기존의 데이터셋들보다 더 분류하기 힘들다는 것을 발견했다. 또한 데이터의 학습량에 따라서 스팸 리뷰의 분류 정확도가 비례적으로 증가하는 것을 확인함으로써, 데이터의 양이 스팸 분류 모델 성능에 중요한 요소로 작용한다는 것을 확인할 수 있었다.

확장 화이트리스트 기법을 이용한 SPIT 대응 프레임워크 (SPIT Prevention Framework using Expanded White List)

  • 배광용;채강석;김영범
    • 대한전자공학회논문지TC
    • /
    • 제47권2호
    • /
    • pp.95-102
    • /
    • 2010
  • 본 논문에서는 실시간 동작 환경인 VoIP에 적용 가능한 SPIT 대응 기법으로서 확장 화이트리스트 기법과 이를 적용한 SPIT 대응 프레임워크를 제안한다. SPIT을 차단하기 위한 연구가 다양하게 진행되고 있지만, SPIT 대응을 위한 기존 기법들은 스패머가 자신의 ID를 바꿔가면서 지속적으로 SPIT을 전송하는 공격에 취약하다. 또한 기존 SPIT 대응 프레임워크들은 프레임워크를 구성하고 있는 모든 SPIT 대응 기법들이 실시간으로 수행되어야 하기 때문에 콜 세션 설립 시간에 지연이 발생한다. 제안 기법은 화이트리스트를 이용한 사회망을 형성하여 화이트리스트의 범위를 확장하지만 전체 데이터베이스를 검색하지 않고 빠르게 그 통과 여부를 결정하는 방법이다. 제안하는 SPIT 대응 프레임워크는 3 단계 구성과 Fast Scoring 시스템을 이용하여 사용자의 직접적인 개입으로 인한 사용자의 불편성과 세션 설립 시간 지연을 최소화한다. 따라서 제안 기법 및 프레임워크는 실시간 동작을 요구하는 VoIP 환경에서 SPIT에 효과적으로 대응할 수 있다.

튜링 테스트 기반으로 한 VoIP 스팸방지 (Anti-Spam for VoIP based on Turing Test)

  • 김명원;곽후근;정규식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권3호
    • /
    • pp.261-265
    • /
    • 2008
  • ITSP(Internet Telephony Service Provider)를 이용한 VoIP 서비스의 사용자가 증가함에 따라 VoIP 스팸은 큰 문제로 대두되고 있다. 기존의 일반 전화 때부터 사용되던 스팸은 실시간적 음성 통신이라는 특성상 콘텐츠 필터링을 하기 어렵기 때문에 콜 행위 패턴 조사를 통해 스패머(Spammer)를 구분하고 있다. 그러나 잘못된 오판으로 인한 문제와 스팸으로 인식하는 임계값을 넘지 않는 한도의 스팸 전송, 그리고 여러 사용자가 하나의 번호를 공유하여 사용하는 경우에는 여전히 스팸의 위협이 남아 있다. 이에 본 논문에서는 튜링 테스트를 이용한 VoIP 스팸 방지를 제안한다. 제안된 방법은 송신자에게 튜링 테스트를 거치게 하고, 튜링 테스트를 통과한 사용자만 수신자와 연결이 되는 방식으로 동작한다. 또한 튜링 테스트를 통과한 정상적인 사용자에게는 티켓을 줌으로써 재발신시 거쳐야하는 튜링 테스트의 번거로움을 줄일 수 있다. 제안된 방법은 ASUS WL-500G 무선 공유기 및 Asterisk IP-PBX에서 구현되었고 실험을 통해 제안된 방법의 유효성을 검증하였다.

향상된 Multi Gray-Leveling을 통한 VoIP 스팸 탐지 기법 (A Scheme of VoIP Spam Detection Using Improved Multi Gray-Leveling)

  • 채강석;정수환
    • 한국통신학회논문지
    • /
    • 제37권8B호
    • /
    • pp.630-636
    • /
    • 2012
  • 본 논문은 VoIP 환경에서 Call 스팸 대응 방법으로 제안된 Multi Gray-Leveling 기법에서 존재하는 오류를 감소시킨 향상된 Multi Gray-Leveling 기법을 제안한다. 기존 Multi Gray-Leveling 기법은 두 개의 다른 시간 주기를 두고 송신자의 호 연결시간 간격을 체크하여 스팸 가능성을 판단함으로 공격자의 호 연결시간 간격 조절을 통한 탐지 회피 가능성을 제한하는 장점이 있으나, 긴 주기의 설정에 따라서 정상 사용자도 스패머로 오판하는 가능성이 존재한다. 본 논문에서는 이러한 오류를 방지하기 위해서 발신자의 행동 패턴뿐만 아니라 수신자의 행동 패턴까지 활용한 향상된 Multi Gray-Leveling 기법을 제안한다. 제안 기법은 사용자의 직접적인 개입이 필요하지 않고, VoIP 서비스 제공자 데이터베이스의 수신자 통화 정보를 이용하여 손쉽게 계산이 가능한 장점을 가지고 있기 때문에 실효성 있는 VoIP 스팸 탐지 방법으로 활용될 수 있다.

스팸성 자질과 URL 자질의 공동 학습을 이용한 최대 엔트로피 기반 스팸메일 필터 시스템 (A Spam Filter System Based on Maximum Entropy Model Using Co-training with Spamminess Features and URL Features)

  • 공미경;이경순
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.61-68
    • /
    • 2008
  • 본 논문에서는 스팸메일에 나타나는 스팸성 자질과 URL 자질의 공동 학습을 이용한 최대엔트로피모델 기반 스팸 필터 시스템을 제안한다. 스팸성 자질은 스패머들이 스팸메일에 인위적으로 넣는 강조 패턴이나 필터 시스템을 통과하기 위해 비정상적으로 변형시킨 단어들을 말한다. 스팸성 자질 외에 반복적으로 나타나는 URL과 비정상적인 URL도 자질로 사용하였다. 메일에 나타난 정상적인 URL과 필터 시스템을 피하기 위해 변형된 비정상적인 URL들이 스팸 메일을 걸러내는데 도움을 줄 수 있기 때문이다. 또한 스팸성 자질과 URL자질을 이용한 공동 학습을 하였다. 공동 학습은 학습 과정에서 두 자질을 독립적으로 이용한 비지도 학습 방법으로 정답을 모르는 문서를 이용할 수 있다는 장점을 갖는다. 실험을 통해 스팸성 자질과 URL을 이용함으로써 스팸 필터 시스템의 성능을 향상시킬 수 있음을 확인하였으며 두 자질 집합을 이용한 공동 학습이 필요한 학습 문서의 수를 감소시키면서, 정확도는 일괄 학습 정확도에 근접한다는 것을 확인하였다.

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.