DOI QR코드

DOI QR Code

다크웹 환경에서 산업기술 유출 탐지 시스템

Industrial Technology Leak Detection System on the Dark Web

  • 공영재 (중앙대학교 융합보안학과) ;
  • 장항배 (중앙대학교 산업보안학과)
  • 투고 : 2022.10.21
  • 심사 : 2022.12.01
  • 발행 : 2022.11.30

초록

오늘날 4차 산업 혁명과 대규모 R&D 지원으로 인해 국내 기업은 세계 기술력 수준의 산업기술을 보유하기 시작하였으며 중요한 자산으로 변모하였다. 국가는 기업의 중요한 산업기술을 보호하고자 국가핵심기술로 지정하였으며, 특히 원자력, 조선, 반도체와 같은 기술이 유출될 경우 해당 기업뿐만 아니라 국가 차원에서도 심각한 경쟁력 손실로 이어질 수 있다. 매년 내부자 유출, 랜섬웨어 그룹의 해킹공격, 산업스파이에 산업기술 탈취 시도가 증가하고 있으며, 탈취된 산업기술은 다크웹 환경에서의 은밀하게 거래가 이루어진다. 본 논문에서는 다크웹 환경에서 은밀하게 이루어지는 산업기술 유출을 탐지하는 시스템을 제안한다. 제안된 모델은 먼저 OSINT 환경에서 수집한 정보를 이용하여 다크웹 크롤링을 통한 데이터베이스를 구축한다. 이후 KeyBERT 모델을 이용한 산업기술 유출 키워드를 추출한 후 다크웹 환경에서의 산업기술 유출 징후를 정량적 수치로 제안한다. 마지막으로 식별된 다크웹 환경에서의 산업기술 유출 사이트를 기반으로 PageRank 알고리즘 통한 2차 유출 가능성을 탐지한다. 제안된 모델을 통해 27,317개의 중복 없는 다크웹 사이트를 수집하였으며, 100개의 원자력 특허에서 총 15,028개의 원자력 관련 키워드를 추출하였다. 가장 높은 원자력 유출 다크웹 사이트를 기반으로 2차 유출을 탐지한 결과 12개의 다크웹 사이트를 식별하였다.

Today, due to the 4th industrial revolution and extensive R&D funding, domestic companies have begun to possess world-class industrial technologies and have grown into important assets. The national government has designated it as a "national core technology" in order to protect companies' critical industrial technologies. Particularly, technology leaks in the shipbuilding, display, and semiconductor industries can result in a significant loss of competitiveness not only at the company level but also at the national level. Every year, there are more insider leaks, ransomware attacks, and attempts to steal industrial technology through industrial spy. The stolen industrial technology is then traded covertly on the dark web. In this paper, we propose a system for detecting industrial technology leaks in the dark web environment. The proposed model first builds a database through dark web crawling using information collected from the OSINT environment. Afterwards, keywords for industrial technology leakage are extracted using the KeyBERT model, and signs of industrial technology leakage in the dark web environment are proposed as quantitative figures. Finally, based on the identified industrial technology leakage sites in the dark web environment, the possibility of secondary leakage is detected through the PageRank algorithm. The proposed method accepted for the collection of 27,317 unique dark web domains and the extraction of 15,028 nuclear energy-related keywords from 100 nuclear power patents. 12 dark web sites identified as a result of detecting secondary leaks based on the highest nuclear leak dark web sites.

키워드

과제정보

이 논문은 2022년도 정부(산업통상자원부)의 재원으로 한국산업기술진흥원의 지원을 받아 수행된 연구임(P0008703, 2022년 산업혁신인재성장지원사업)

참고문헌

  1. D. Rathod, "Darknet forensics," Intenational Journal of Emerging Trends & Technology in Computer Science, Vol. 6, No. 4, pp. 77-79, Aug. 2017.
  2. 인터넷범죄 온상 된 '다크웹'...韓 접속자 하루 1만 6000명(2019). https://plus.hankyung.com/apps/newsinside.view?aid=2019072984951&category=NEWSPAPER (accessed Oct., 12, 2022).
  3. V. Ciancaglini, M. Balduzzi, R. McArdle and M. Rosler, "Below the Surface: Exploring the Deep Web," Trend Micro, Jun. 2015.
  4. Y. Xu, G. Chen, J. Wu, W. Xu, and Q. Liu, "Research on Dark Web Monitoring Crawler Based on TOR," 2021 IEEE 2nd International Conference on Information Technology, Big Data and Artificial Intelligence (ICIBA). Vol. 2, pp. 197-202, Chongqing, China, Dec. 2021.
  5. V3 onion services usage(2019), https://blog.torproject.org/v3-onion-services-usage/ (accessed Oct., 12, 2022).
  6. 장항배, "중소기업 산업기술 유출방지를 위한 정보보호 관리체계 설계," 멀티미디어학회논문지, 제13권, 제1호, 111-121쪽, 2010년 1월
  7. S. Trabelsi, "Monitoring Leaked Confidential Data," 2019 10th IFIP International Conference on New Technologies, Mobility and Security (NTMS). IEEE, Canary Islands, Spain, Jun. 2019.
  8. K. Godawatte, M. Raza, M. Murtaza, and A. Saeed, "Dark web along with the dark web marketing and surveillance," 2019 20th International Conference on Parallel and Distributed Com puting, Applications and Technologies (PDCAT), pp. 483-485, Gold Coast, QLD, Australia, Dec. 2019.
  9. INDFUSTRIAL SPY, http://spyarea23ttlty6qav3ecmbclpqym3p32lksanoypvrqm6j5onstsjad.onion/ (accessed Oct., 19, 2022).
  10. P. H. Meland, Y. F. F. Bayoumy, and G. Sindre, "The Ransomware-as-a-Service economy within the darknet," Computers & Security, Vol. 92, May, 2020.
  11. P. Sharma and Y. Li, "Self-supervised contextual keyword and keyphrase retrieval with self-labelling," Preprints 2019, Aug. 2019.
  12. WELCOM TO WOLF HACKER GROUP http://pyq7ko2zukszgrkpelewdkqtfj3iqvxqt7z3qimk7y4bcg4sq6kkveid.onion (accessed Oct, 19, 2022).
  13. 차준석, 김정인, 김판구, "단어 간 의미적 연관성을 고려한 어휘 체인 기반의 개선된 자동 문서요약 방법," 스마트미디어저널, 제6권, 제1호, 22-29쪽, 2017년 3월
  14. 김은희, 임명진, 신주현, "문장 정보량 기반 문서추출 요약의 효과성 제고," 스마트미디어저널, 제11권, 제3호, 31-38쪽, 2022년 04월
  15. 이정우, 이소연, "토픽 모델링을 활용한 메타버스 분야 국가 R&D 동향 분석," 스마트미디어저널, 제11권, 제8호, 9-20쪽, 2022년 09월