DOI QR코드

DOI QR Code

The Online Game Coined Profanity Filtering System by using Semi-Global Alignment

반 전역 정렬을 이용한 온라인 게임 변형 욕설 필터링 시스템

  • 윤태진 (부산대학교 공과대학 정보컴퓨터공학부) ;
  • 조환규 (부산대학교 공과대학 정보컴퓨터공학부)
  • Received : 2009.07.17
  • Accepted : 2009.10.30
  • Published : 2009.12.28

Abstract

Currently the verbal abuse in text message over on-line game is so serious. However we do not have any effective policy or technical tools yet. Till now in order to cope with this problem, the online game service providers have accumulated a set of forbidden words and applied this list on the textual word used in on-line game, which is called 'Swear filter'. But young on-line game players easily avoid this filtering method by coining another words which is not kept in the list. Especially Korean is very easy to make new variations of a vulgar word. In this paper, we propose one smart filtering algorithm to identify newly coined profanities. Important features of our method include the canonical form transformation of coined profanities, semi-global alignment between in the level of consonant and vowel units. For experiment, we have collected more than 1000 newly coined vulgar words in on-line gaming sites and tested these word against our methods. where our system have successfully filtered more than 90% of those newly coined vulgar words.

온라인 게임에서의 언어폭력 문제는 매우 심각하지만 그에 대한 효과적인 정책이나 기술적인 방법은 부족한 상황이다. 온라인 게임 서비스 업체에서는 금칙어 리스트를 작성하여 Swear Filter를 이용한 고정된 형식의 문자열 검색 방식을 통해 문제를 해결하려고 하고 있으나 사용자들은 다양한 방법으로 욕설을 조합 또는 변형시켜 기존의 필터링을 회피하고 있다. 특히 한글은 욕설의 변형이 매우 쉬운 특성을 가지고 있다. 본 논문에는 한글에 기초한 변형 욕설을 효율적으로 탐색하여 걸러내는 알고리즘을 제시한다. 이 알고리즘의 주된 특징은 변형 욕설의 표준형 변환과 자소단위의 반 전체 정렬(semi-global alignment), 이다. 실험 결과 저자들이 다양한 인터넷 게임 환경에서 직접 수집한 다종의 욕설 단어들에 대하여 약 90%의 우수한 필터링 성능을 보였다.

Keywords

References

  1. 한국게임산업진흥원, 게임언어 건전화 지침서 연구, 2008.
  2. C. Lai "An empirical study of three machine learning methods for spam filtering," Know.-Based Syst, Vol.20, No.3, pp.249-254, 2007. https://doi.org/10.1016/j.knosys.2006.05.016
  3. 박교현, 이지형, "SVM을 이용한 온라인게임 비속어 필터링 시스템", 2006년도 한국정보과학회 가을 학술발표논문집, 제33권, 제2(B)호, pp.260-263, 2006.
  4. G. Kondrak, "Identifying cognates by phonetic and semantic similarity," In Second Meeting of the North American Chapter of the Association For Computational Linguistics on Language Technologies 2001, pp.1-8, 2001.
  5. A. Ramachandran, N. Feamster, and S. Vempala, "Filtering spam with behavioral blacklisting," In Proceedings of the 14th ACM Conference on Computer and Communications Security, pp.342-351, 2007.
  6. http://en.wikipedia.org/wiki/Scunthorpe_Problem
  7. http://www.khgames.co.kr/week_01/main_content.htm?mCode=1615871101284119&sCode=381101173848313&code=laboratory&idx=8
  8. http://en.wikipedia.org/wiki/Swear_filter
  9. D. Shekhar, "Designing a vulgarity filtering system," in Game Programming Gems 5. 2005, Charles River Media, 2005.
  10. (주)아이모션, "음절결합 정보를 이용한 음란/비속어 차단시스템", 특2001-0067853, 2001.