군집과 비음수 행렬 분해를 이용한 개인화된 문서 요약

Personalized Document Summarization Using NMF and Clustering

  • 박선 (호남대학교 컴퓨터공학과)
  • Park, Sun (Department of compuer Engineering, Honam University)
  • 투고 : 2008.12.02
  • 심사 : 2009.02.28
  • 발행 : 2009.02.28

초록

본 논문은 비음수 행렬 분해와 군집 방법을 이용하여 개인화된 문장을 추출하여 문서요약을 하는 새로운 방법을 제안한다. 제안된 방법은 검색 문서에 군집 방법을 이용하여 문서의 주제와 세부 주제를 반영한 문장을 추출하며, 비음수 행렬 분해에 의해 분해된 문서의 고유 의미 특징을 이용하여 사용자의 흥미가 잘 반영된 문장을 추출한다. 실험결과 제안방법이 유사도, 비음수행렬분해를 이용한 방법들에 비하여 좋은 성능을 보인다.

We proposes a new method using the non-negative matrix factorization (NMF) and clustering method to extract the sentences for personalized document summarization. The proposed method uses clustering method for retrieving documents to extract sentences which are well reflected topics and sub-topics in document. Beside it can extract sentences with respect to query which are well reflected user interesting by using the inherent semantic features in document by NMF. The experimental results shows that the proposed method achieves better performance than other methods use the similarity and the NMF.

키워드

참고문헌

  1. A., Diaz, P., Gservas, "User-model based personalized summarization", Information Processing and Management, 43, pp.1715-1734, 2007. https://doi.org/10.1016/j.ipm.2007.01.009
  2. I. Mani, M. T. Maybury, "dvances in Automatic Text," The MIT Press, 1999.
  3. M., Sanderson, "Accurate user directed summarization from existing tools", In proceeding of the international conference on information and knowledge management, pp.45-51, 1998.
  4. A., Tombros, M., Sanderson, "Advantages of Query Biased summaries in Information Retrieval", In proceeding of ACM SIGIR, 1998, pp.2-10.
  5. R., Varadarajan, V., Hristidis, "A System for Query Specific Document Summarization", in proceeding of the CIKM, pp.622-631, 2006.
  6. S. Park, J. W. Song, J. H. Lee, "Automatic Personalized Summarization using Non-negative Matrix Factorization and Relevance Measure" in proceeding of IWSCA'08, 2008.
  7. D. D. Lee, H. S. Seung, "Learning the parts of objects by non-negative matrix factorization," Nature, vol. 401, pp.788-791, 1999. https://doi.org/10.1038/44565
  8. D. D. Lee, H. S. Seung, "Algorithms for non-negative matrix factorization," In Advances in Neural Information Processing Systems. vol. 13, pp.556-562, 2001.
  9. J., Han, M., Kamber, "Data Mining Concepts and Techniques", Morgan Kaufmann, 2001.
  10. S. Chakrabarti, "Mining the Web : Discovering Knowledge from Hypertext Data," Morgan Kaufmann, 2003.
  11. W. B. Frankes, R. Baeza-Yaes, "Information Retrieval : Data Structure & Algorithms," Prentice-Hall, 1992.
  12. 박선, 이주홍, 안찬민, 박태수, 김재우, 김덕환, "비음수 행렬 인수분해를 이용한 일반적 문서 요약," 제25회 한국정보처리학회 춘계학술발표대회 논문집, 제13권, 제1호, 2006.
  13. 박선, "의미 특징 행렬과 의미 가변행렬을 이용한 질의 기반의 문서 요약", 한국항행학회 논문지, 제12권, 제4호, 2008.
  14. 박선, 이주홍, "비음수 행렬 분해와 K-means를 이용한 주제기반의 다중문서요약", 한국정보과학회논문지, 제35권, 제4호, 2008.