Abstract
To identify fraud clicks in the Internet advertisement, existing studies have considered keyword, visit time, and client IP as an independent variable for the standard. These methods have limitations in identifying the fraud clicks that utilize automation tools, for they are methods based on client IP and human activities on the Internet. This paper proposes that fingerprinting values of the variable combination should be used to identify fraud clicks. The proposed model is composed of 3 stages and the fingerprinting values are compared with the other input data at each stage; IP fingerprinting in the first stage, IP and session data fingerprinting in the second stage, and session data and keyword fingerprinting in the third stage. We showed that the proposed model of the fraud click identification is more correct than existing methods through experiments according to the proposed scheme.
인터넷 광고에서 부정 클릭을 식별하기 위해 제시된 모텔은 검색한 키워드, 광고 클릭 시간, 사이트 방문 시간, IP 등을 기준 변수로 한다. 이 방법은 클라이언트 IP를 기반으로 하고 사람이 부정 클릭을 행하는 것을 식별하는 것이기 때문에 자동화 도구 등을 이용하여 부정 클릭을 행하는 방법에 대한 식별 방법으로는 충분하지 않다. 본 논문에서는 자동화 도구를 이용한 부정 클릭을 보다 정확하게 식별하기 위해 각 정보의 조합을 핑거프린팅하여 그 값을 비교하는 방법을 제안하였다. 연구는 3단계로 나누어 진행되었다. 1단계에서는 IP 정보의 핑거프린팅, 2단계에서는 IP와 세션 정보의 핑거프린팅, 3단계에서는 세션 정보와 검색한 키워드의 핑거프린팅을 만든다. 결과 값을 통해 동일한 핑거프린팅 값을 갖는 것은 자동화 도구를 사용한 부정 클릭의 가능성이 높다고 판단한다. 본 연구에서 제시한 방법론은 부정 클릭 식별 모델을 만들기 위해 기존의 연구에서 사용하였던 개별 값의 비교에서 발전하여 DB에 저장된 각 로그의 값을 조합하여 사용함으로써 여러 가지 정보를 부정 클릭 식별을 위한 유의미한 값으로 사용할 수 있다는 점을 보여주고 있다.