DOI QR코드

DOI QR Code

Analysis of Topics Related to Population Aging Using Natural Language Processing Techniques

자연어 처리 기술을 활용한 인구 고령화 관련 토픽 분석

  • Hyunjung Park ;
  • Taemin Lee ;
  • Heuiseok Lim
  • 박현정 (고려대학교 Human-inspired AI 연구소) ;
  • 이태민 (고려대학교 Human-inspired AI 연구소) ;
  • 임희석 (고려대학교 정보대학 컴퓨터학과)
  • Received : 2023.12.28
  • Accepted : 2024.02.10
  • Published : 2024.02.29

Abstract

Korea, which is expected to enter a super-aged society in 2025, is facing the most worrisome crisis worldwide. Efforts are urgently required to examine problems and countermeasures from various angles and to improve the shortcomings. In this regard, from a new viewpoint, we intend to derive useful implications by applying the recent natural language processing techniques to online articles. More specifically, we derive three research questions: First, what topics are being reported in the online media and what is the public's response to them? Second, what is the relationship between these aging-related topics and individual happiness factors? Third, what are the strategic directions and implications for benchmarking discussed to solve the problem of population aging? To find answers to these, we collect Naver portal articles related to population aging and their classification categories, comments, and number of comments, including other numerical data. From the data, we firstly derive 33 topics with a semi-supervised BERTopic by reflecting article classification information that was not used in previous studies, conducting sentiment analysis of comments on them with a current open-source large language model. We also examine the relationship between the derived topics and personal happiness factors extended to Alderfer's ERG dimension, carrying out additional 3~4-gram keyword frequency analysis, trend analysis, text network analysis based on 3~4-gram keywords, etc. Through this multifaceted approach, we present diverse fresh insights from practical and theoretical perspectives.

Keywords

Acknowledgement

이 논문 또는 저서는 2020년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임 (NRF-2020S1A5B5A16083616).

References

  1. 강미선, 정인혜, 윤도경, 주수산나, 김현경, "노년기 디지털 콘텐츠 제작 경험을 통하여 살펴본 능동적인 디지털에이징 과정", 한국노년학, 제43권, 제4호, 2023, 571-589.
  2. 국회예산정책처, "중장기 재정현안 분석: 인구위기 대응전략 - 2. 인구변화가 경제재정에 미치는 영향", 예산안분석시리즈 VII, 2023.
  3. 권혁창, 염동문, 조혜정, "일하는 노인은 행복한가?: 자아존중감의 종단적 매개효과", 인문사회21, 제11권, 제4호, 2020, 67-76.
  4. 김명소, 한영석, "한국인의 행복지수 공식 개발", 조사연구, 제7권, 제2호, 2006, 1-18.
  5. 김자영, "취업여부와 교육수준이 노인의 삶의 만족도에 미치는 영향", 노인복지연구 , 제72권, 제3호, 2017, 167-190.
  6. 나무위키, "초고령사회", 2023, https://namu.wiki/w/%EC%B4%88%EA%B3%A0%EB%A0%B9%EC%82%AC%ED%9A%8C (Acces sed on Nov. 17, 2023).
  7. 류영달, "우리나라 디지털에이징 정책의 현황과 과제", 한국노년학연구, 제27권, 제1호, 2018, 17-32.
  8. 문동지, 연다인, 김희웅, "토픽 모델링 기반 한국 노인의 행복과 불행 이슈 분석", 경영정보학연구, 제20권, 제2호, 2018, 139-161.
  9. 박정호, "고령화사회, 고령사회, 초고령사회", 2015, 클릭경제교육, KDI 경제정보센터, https://eiec.kdi.re.kr/material/clickView.do?click_yymm=201512&cidx=2292 (Accessed on Nov. 17, 2023).
  10. 박종범, 양영석, 김명숙, "액티브 시니어의 경력지향성과 창업교육 만족이 창업의지와 창업준비행동에 미치는 영향", 벤처창업연구, 제15권, 제1호, 2020, 285-301.
  11. 박현정, 임희석, "NLP 활용 사례 분석 및 도입에 관한 연구: 분석 프레임워크와 시사점", 한국IT서비스학회지, 제21권, 제2호, 2022, 61-84.
  12. 백준우, 정세환, 지석호, "LDA 및 BERTopic 기반 해외건설시장 뉴스 기사 토픽모델링 성능평가", 대한토목학회논문집, 제43권, 제5호, 2023, 811-819
  13. 브런치스토리, "뼈대잡고 신문기사 쓰는 법", 2020, https://brunch.co.kr/@sjraintree/123, (Accessed on Jan. 20, 2024).
  14. 오민정, "23년간(1996~2018) 국내학술연구의 '고령' 키워드로 살펴본 빅데이터 분석", 한국경영학회, 제48권, 제2호, 2019, 515-532.
  15. 유재남, "고령자의 활동적 노화가 삶의 만족도에 미치는 영향요인", 한국노년학, 제36권, 제4호, 2016, 1075-1088.
  16. 윤명숙, 이묘숙, "노인의 경제상태가 행복에 미치는 영향: 자아존중감의 매개효과", 한국노년학, 제32권, 제2호, 2012, 397-413.
  17. 이동우, 김유신, 신은정, "LDA 토픽 모델링을 이용한 액티브 시니어 콘텐츠 트렌드 분석", 한국인터넷정보학회, 제22권, 제5호, 2021, 35-45.
  18. 이종형, 강경희, 김용하, 임효남, 구진희, 김광환, "빅데이터 분석을 활용한 웰에이징 요인에 관한 연구 : 신문기사를 중심으로", 한국산학기술학회, 제22권, 제5호, 2021, 354-360.
  19. 인천시니어뉴스, "노인들 가장 오래일하면서 가장 가난한 나라 '대한민국", 2022, https://incheon-senior.com/issues/11569/ (Accessed on Nov. 17, 2023).
  20. 임희석, 고려대학교 자연어처리연구실, 자연어 처리 바이블, 휴먼 싸이언스, 2019.
  21. 지은정, "개인-직무적합의 관점에서 본 노인의 일과 삶의 만족도: 생애 주된 일자리와의 연계를 중심으로", 정부학연구, 제23권, 제2호, 2017, 189-224.
  22. 통계청a, "2022년 출생.사망통계(잠정)", 2022, https://kostat.go.kr/board.es?mid=a10301010000&bid=204&list_no=423833&act=view&mainXml=Y (Accessed on Nov. 17, 2023).
  23. 통계청b, "2023 고령자 통계", 2023, https://kostat.go.kr/board.es?mid=a10301010000&bid=10820&list_no=427252&act=view&mainXml=Y (Accessed on Nov. 17, 2023).
  24. 통계청c, "2023년 6월 인구동향", 2023, https://kostat.go.kr/board.es?mid=a10301010000&bid=204&list_no=426810&act=view&mainXml=Y (Accessed on Nov. 17, 2023).
  25. 팜뉴스, "초고령화 시대에서 주목 받는 '그랜드 제너레이션'과 약국의 미래", 2023, https://www.pharmnews.com/news/articleView.html?idxno=231161, (Accessed on Nov. 30, 2023).
  26. 한겨레, "스트레이트 기사는 두괄식", 2012, https://www.hani.co.kr/arti/society/schooling/530540.html, (Accessed on Jan. 20, 2024).
  27. 현은민, "고령사회 노인의 활동적 노화가 삶의 만족도에 미치는 영향", 인문사회 21, 제11권, 제4호, 2020, 1491-1506.
  28. 홍성용, "이벤트 PD의 직무만족에 영향을 미치는 요인에 관한 연구 : Alderfer의 ERG 이론을 중심으로", 연세대학교, 광고홍보전공, 석사학위논문, 2006.
  29. 황미구, 김은주, "노인 일자리 사업이 노인의 인지기능, 우울감, 자아존중감에 미치는 효과 및 노인의 개인적인 특성이 삶․직무․사회참여만족도에 미치는 영향", 진로교육연구, 제21권, 제3호, 2008, 137-156.
  30. Abuzayed, A. and H. Al-Khalifa, "BERT for Arabic topic modeling: An experimental study on BERTopic technique", Procedia Computer Science, Vol.189, 2021, 191-194.
  31. Angelov, D., "Top2vec: Distributed representa tions of topics", 2020, arXiv:2008.09470 [cs.CL].
  32. Alderfer, C.P., "An empirical test of a new theory of human needs", Organizational Behavior and Human Performance, Vol.4, No.2, 1969, 142-175.
  33. Blei, D.M. and J.D. Lafferty, "Dynamic topic models", Proceedings of the 23rd International Conference on Machine Learning, 2006, 113-120.
  34. Devlin, J., M. Chang, K. Lee, and K. Toutanova, "Bert: Pre-training of deep bidirectional transformers for language understanding", 2018, arXiv:1810.04805 [cs.CL].
  35. Fevotte, C. and J. Idier, "Algorithms for nonnegative matrix factorization with the β-divergence", Neural Computation, Vol.23, No.9, 2011, 2421-2456.
  36. Grootendorst, M., "BERTopic: Neural topic modeling with a class-based TF-IDF procedure", 2022, arXiv:2203.05794 [cs.CL].
  37. Hendry, D., F. Darari, R. Nurfadillah, G. Khanna, M. Sun, P.C. Condylis, and N. Taufik, "Topic Modeling for Customer Service Chats", 2021 International Conference on Advanced Computer Science and Information Systems (ICACSIS), 2021, 1-6.
  38. Kang, Y., Z. Cai, C. Tan, Q. Huang, and H. Liu, "Natural language processing (NLP) in management research: A literature review", Journal of Management Analytics, Vol.7, No.2, 2020, 139-172.
  39. Lan, Z., M. Chen, S. Goodman, K. Gimpel, P. Sharma, and R. Soricut, "Albert: A lite bert for self-supervised learning of language representations", 2019, arXiv:1909.11942 [cs.CL].
  40. Lee, J., W. Yoon, S. Kim, D. Kim, S. Kim, C.H. So, and J. Kang, "Biobert: a pre-trained biomedical language representation model for biomedical text mining", Bioinformatics, Vol.36, No.4, 2020, 1234-1240.
  41. Liu, Y., M. Ott, N. Goyal, J. Du, M. Joshi, D. Chen, O. Levy, M. Lewis, L. Zettlemoyer, and V. Stoyanov, "Roberta: A robustly optimized bert pretraining approach", 2019, arXiv:1907.11692 [cs.CL].
  42. Manning, C.D., C.D. Manning, and H. Schtze, Foundations of Statistical Natural Language Processing, MIT Press, 1999.
  43. McInnes, L. and J. Healy, "Accelerated hierarchical density based clustering", IEEE International Conference on Data Mining Workshops (ICDMW), 2017, 33-42.
  44. McInnes, L., J. Healy, N. Saul, and L. Grossberger, "Umap: Uniform manifold approximation and projection", The Journal of Open Source Software, Vol.3, No.29, 2018, 861.
  45. Roh, M. and S. Weon, "Living arrangement and life satisfaction of the elderly in South Korea", Social Indicators Research, Vol.160, 2022, 717-734.
  46. Segev, E., "Textual network analysis: Detecting prevailing themes and biases in international news and social media", Sociology Compass, Vol.14, No.4, 2020, 1-14.
  47. Sia, S., A. Dalmia, and S.J. Mielke, "Tired of topic models? Clusters of pretrained word embeddings make for fast and good topics too!", Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2020, 1728-1736.
  48. Tian, H. and J. Chen, "Study on Life Satisfaction of the Elderly Based on Healthy Aging", Journal of Healthcare Engineering, Vol.2022, ID.8343452, 2022, 1-7.
  49. WHO, "Healthy Ageing and Functional Ability", 2020, https://www.who.int/news-room/questions-and-answers/item/healthy-ageing-and-functional-ability (Accessed on Nov. 30, 2023).