DOI QR코드

DOI QR Code

GNN을 이용한 웹사이트 Hierarchy 유사도 분석 기반 해외 침해 사이트 분류 모델 연구

A Study on the Classification Model of Overseas Infringing Websites based on Web Hierarchy Similarity Analysis using GNN

  • 서주현 (호서대학교 정보보호학과) ;
  • 유선모 (호서대학교 정보보호학과) ;
  • 박종화 (성균관대학교 빅데이터학과) ;
  • 박진주 (아주대학교 사이버보안학과) ;
  • 이태진 (호서대학교 정보보호학과)
  • 투고 : 2023.06.05
  • 심사 : 2023.06.20
  • 발행 : 2023.06.30

초록

전 세계적으로 한류 콘텐츠가 유행하며 국내뿐만 아니라 해외에서도 국내 저작물의 저작권 침해 사례가 지속적으로 증가하고 있다. 이에 대응하기 위한 국내 불법 저작물 유통 사이트를 탐지하는 기술에 대한 연구가 활발하게 진행되고 있으며 최근 연구는 국내 불법 저작물 유통 사이트들이 광고 배너를 상당수 포함하고 있는 특징을 활용한 연구가 존재한다. 그러나 해외 불법 저작물 유통 사이트의 경우 광고 배너를 포함하지 않거나 국내 사이트에 비해 적은 양의 광고를 포함하고 있어 국내와 같은 탐지 기술의 적용이 제한적이다. 본 연구에서는 저작물 불법 공유 사이트가 게시물과 저작물의 이미지를 유사한 계층 구조로 포함하는 특징을 이용하여 링크 트리 및 텍스트 유사도 비교 기반의 탐지 기술을 제안한다. 대량의 링크로 작성된 대규모 트리의 정확한 유사도 비교를 위해 GNN(Graph Neural Network)를 활용한다. 본 연구의 실험에서 일반 사이트와 저작물 불법 유통 사이트를 분류에 95% 이상의 높은 정확도를 보였고 해당 알고리즘을 적용하여 불법 유통 사이트의 자동화된 탐지를 통해 신속한 저작권 침해 대응이 가능할 것으로 기대된다.

The global popularity of K-content(Korean Wave) has led to a continuous increase in copyright infringement cases involving domestic works, not only within the country but also overseas. In response to this trend, there is active research on technologies for detecting illegal distribution sites of domestic copyrighted materials, with recent studies utilizing the characteristics of domestic illegal distribution sites that often include a significant number of advertising banners. However, the application of detection techniques similar to those used domestically is limited for overseas illegal distribution sites. These sites may not include advertising banners or may have significantly fewer ads compared to domestic sites, making the application of detection technologies used domestically challenging. In this study, we propose a detection technique based on the similarity comparison of links and text trees, leveraging the characteristic of including illegal sharing posts and images of copyrighted materials in a similar hierarchical structure. Additionally, to accurately compare the similarity of large-scale trees composed of a massive number of links, we utilize Graph Neural Network (GNN). The experiments conducted in this study demonstrated a high accuracy rate of over 95% in classifying regular sites and sites involved in the illegal distribution of copyrighted materials. Applying this algorithm to automate the detection of illegal distribution sites is expected to enable swift responses to copyright infringements.

키워드

과제정보

본 연구는 2021년 국방과학연구소 주관 미래도전국방기술연구개발사업(UD210030TD)의 지원을 받아 연구되었음

참고문헌

  1. 한국저작권보호원, "해외 한류콘텐츠 침해 실태조사", 연구보고서, 2023.
  2. 한국저작권보호원, "해외 저작권 보호체계 효율화를 위한방안 연구", 연구보고서, 2022
  3. 김의진. "저작권 침해 의심 데이터 분석을 통한 저작권 침해사이트 탐지 기법." 국내석사학위논문 아주대학교, 2022.
  4. S. K. Choi and J. Kwak, "Feature Analysis and Detection Techniques for Piracy Sites", KSII Transactions on Internet and Information Systems, Vol. 14, No. 5, pp. 2204-2220, May, 2020.
  5. E. J. Kim and J. Kwak, "Intelligent Piracy Site Detection Technique with High Accuracy", KSII Transactions on Internet and Information Systems, Vol. 15, No. 1, pp.285-301, Jan. 2021. https://doi.org/10.3837/tiis.2021.01.016
  6. 이기룡과 이희조, "HTML 태그 순서를 이용한 불법 사이트 탐지 자동화 기술", 정보과학회논문지, vol. 43, no.10, pp 1173-1178, 10 2016. https://doi.org/10.5626/JOK.2016.43.10.1173
  7. M. Gori, G. Monfardini, and F. Scarselli, "A new model for learning in graph domains," in Proceedings. 2005 IEEE International Joint Conference on Neural Networks vol. 2. pp. 729-734, 2005.
  8. F. Scarselli, M. Gori, A. C. Tsoi, M. Hagenbuchner, and G. Monfardini, "The Graph Neural Network Model," IEEE Transactions on Neural Networks, vol. 20, no. 1, pp. 61-80, Jan. 2009. https://doi.org/10.1109/TNN.2008.2005605
  9. Y. Li, D. Tarlow, M. Brockschmidt, and R. Zemel, "Gated Graph Sequence Neural Networks." arXiv, Sep. 22, 2017.
  10. C. Gallicchio and A. Micheli, "Graph Echo State Networks," in The 2010 International Joint Conference on Neural Networks (IJCNN), pp. 1-8. Jul. 2010.
  11. C. Gallicchio and A. Micheli, "Graph Echo State Networks," in The 2010 International Joint Conference on Neural Networks (IJCNN),pp. 1-8. Jul. 2010.
  12. J. Atwood and D. Towsley, "Diffusion-Convolu tional Neural Networks." arXiv, Jul. 08, 2016.
  13. M. Niepert, M. Ahmed, and K. Kutzkov, "Learning Convolutional Neural Networks for Graphs." arXiv, Jun. 08, 2016.
  14. J. Gilmer, S. S. Schoenholz, P. F. Riley, O. Vinyals, and G. E. Dahl, "Neural Message Passing for Quantum Chemistry." arXiv, Jun. 12, 2017.
  15. J. Bruna, W. Zaremba, A. Szlam, and Y. LeCun, "Spectral Networks and Locally Connected Networks on Graphs." arXiv, May 21, 2014.
  16. M. Henaff, J. Bruna, and Y. LeCun, "Deep Convolutional Networks on Graph-Structured Data." arXiv, Jun. 16, 2015.
  17. M. Defferrard, X. Bresson, and P. Vandergheynst, "Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering." arXiv, Feb. 05, 2017.
  18. T. N. Kipf and M. Welling, "Semi-Supervised Classification with Graph Convolutional Networks." arXiv, Feb. 22, 2017.
  19. R. Levie, F. Monti, X. Bresson, and M. M. Bronstein, "CayleyNets: Graph Convolutional Neural Networks With Complex Rational Spectral Filters," IEEE Transactions on Signal Processing, vol. 67, no. 1, pp. 97-109, Jan. 2019. https://doi.org/10.1109/TSP.2018.2879624