대용량 그래프에서의 삼각형 검색 연구: 알고리즘과 응용

  • Published : 2014.10.31

Abstract

본 고에서는 다양한 네트워크를 표현하는 그래프에서 삼각형을 검색하는 알고리즘과 그 응용을 다룬다. 삼각형은 그래프에서 서로가 연결된 세 정점의 집합을 의미한다. 삼각형 검색 문제는 폭 넓은 응용이 가능하기 때문에 데이터 마이닝, 네트워크 분석 등 다양한 분야에서 중요하고 기본적인 문제로서 인식되어왔다. 삼각형 검색 문제의 중요성이 널리 인식되면서 여러 알고리즘이 제안 되어 왔지만, 최근의 소셜 네트워크, 웹 등의 크기가 방대해 기존의 방법은 이러한 네트워크를 분석하기가 사실상 불가능하다. 최근 맵리듀스를 활용한 분산/병렬 처리를 통해 대용량 그래프에서 삼각형을 검색하는 알고리즘들이 여럿 제안되었다. 본 논문에서는 지금까지 제안된 알고리즘들을 설명하고 삼각형 검색의 응용에 대해서 소개한다.

Keywords

References

  1. D. J. Watts and S. H. Strogatz. Collective dynamics of 'small-world' networks. Nature, 393(6684):440-442, 1998. https://doi.org/10.1038/30918
  2. Z. Yang, C. Wilson, X. Wang, T. Gao, B. Y. Zhao, and Y. Dai. Uncovering social network sybils in the wild. In SIGCOMM, pages 259-268, 2011.
  3. L. Becchetti, P. Boldi, C. Castillo, and A. Gionis. Efficient semi-streaming algorithms for local triangle counting in massive graphs. In SIGKDD, pages 16-24. ACM, 2008.
  4. U Kang, B. Meeder, E. E. Papalexakis, and C. Faloutsos. Heigen: Spectral analysis for billion-scale graphs. TKDE, 26(2), 350-362, 2014.
  5. J. W. Berry, B. Hendrickson, R. A. LaViolette, and C. A. Phillips. Tolerating the community detection resolution limit with edge weighting. Physical Review E, 83:056119, 2011. https://doi.org/10.1103/PhysRevE.83.056119
  6. A. Itai and M. Rodeh. Finding a minimum circuit in a graph. SIAM Journal on Computing, 7(4):413-423, 1978. https://doi.org/10.1137/0207033
  7. M. Latapy. Main-memory triangle computations for very large (sparse (power-law)) graphs. Theoretical Computer Science, 407(1):458-473, 2008. https://doi.org/10.1016/j.tcs.2008.07.017
  8. T. Schank and D. Wagner. Finding, counting and listing all triangles in large graphs, an experimental study. In Experimental and Efficient Algorithms, pages 606-609. Springer, 2005.
  9. Jeffrey Dean and Sanjay Ghemawat. Mapreduce: Simplified data processing on large clusters. OSDI, 2004.
  10. Siddharth Suri and Sergei Vassilvitskii. Counting triangles and the curse of the last reducer. In WWW, pages 607-614, 2011.
  11. Shaikh Arifuzzaman, Maleq Khan, Madhav V. Marathe. PATRIC: a parallel algorithm for counting triangles in massive networks. In CIKM 2013, pages 529-538, 2013
  12. Jonathan Cohen. Graph twiddling in a mapreduce world. Computing in Science & Engineering, 11(4):29-41, 2009. https://doi.org/10.1109/MCSE.2009.120
  13. Ha-Myung Park, Chin-Wan Chung. An efficient MapReduce algorithm for counting triangles in a very large graph. In CIKM, pages 539-548, 2013
  14. Shumo Chu and James Cheng. Triangle listing in massive networks and its applications. In KDD, pages 672-680, 2011.
  15. Jean-Pierre Eckmann and Elisha Moses. Curvature of co-links uncovers hidden thematic layers in the world wide web. PNAS, 99(9):5825-5829, 2002. https://doi.org/10.1073/pnas.032093399
  16. Norishige Chiba and Takao Nishizeki. Arboricity and subgraph listing algorithms. SIAM J. Comput., 14(1):210-223, 1985. https://doi.org/10.1137/0214017
  17. Xiaocheng Hu, Yufei Tao, and Chin-Wan Chung. Massive graph triangulation. In SIGMOD, pages 325-336. ACM, 2013.
  18. Rasmus Pagh and Francesco Silvestri. The Input/Output complexity of triangle enumeration. In PODS, pages 224-233, 2014.
  19. Ha-Myung Park, Francesco Silvestri, U Kang, Rasmus Pagh. MapReduce Triangle Enumeration With Guarantees. In CIKM, pages to appear, 2014.