DOI QR코드

DOI QR Code

Development of Classification Model for Healthcare Contents on the Online Community

온라인 커뮤니티에서의 건강 관련 콘텐츠 분류 모형 개발

  • 김태윤 (충북대학교 경영정보학과) ;
  • 김유신 (서울시립대학교 빅데이터분석학과) ;
  • 최상현 (충북대학교 경영정보학과) ;
  • 김도훈 (충북대학교 의과대학) ;
  • 장유진 (인제대학교 의과대학)
  • Received : 2017.10.10
  • Accepted : 2017.11.28
  • Published : 2017.12.31

Abstract

Purpose In this paper we verified the reliabilities of healthcare-related information provided by various users on the site of Naver Jisikin, a Korean typical search platform. Based on Q&A contents we validated answers' reliabilities to the asked questions about a lung cancer with the help of professors at a medical school. Design/methodology/approach The content analysis includes that the types of questions are classified into symptom/diagnosis, therapy, prognosis, after-management and so on. The answers contains advice, advertisement, oriental medicine, and religion as well as the above 5 question categories. The validation results of medical evidence about each answer show that only 49% among all answers have medical grounds. Findings We classified the medical grounded answers into three levels; high, medium and low. Among all answers we need to find out the answers including advertisement because the answers can be harmful to patients. We found the method to select the answers containing advertisement contents with the help of text mining research. The selection model presents high performance as 84% classification accuracy.

Keywords

References

  1. 김달숙, 박아현, 강남준, "컴퓨터 분석프로그램을 적용한 암환자의 투병수기 분석", 대한간호학회지, 제44권, 3호, 2014, pp.328-338. https://doi.org/10.4040/jkan.2014.44.3.328
  2. 김덕주, 박건우, 이상훈, "QualityRank : 소셜 네트워크 분석을 통한 Q&A 커뮤니티에서 답변의 신뢰 수준 측정",정보과학회, 제37권, 6호, 2010, pp.343-350.
  3. 김태원, 김상욱, "집단지성 플랫폼으로서의 소셜미디어:커뮤니케이션 유형별 실험 분석", 한국IT서비스학회, 제12권, 3호, 2013, pp.127-149. https://doi.org/10.9716/KITS.2013.12.3.127
  4. 김현준, 정재은, 조근식, "가중치가 부여된 베이지안 분류자를 이용한 스팸 메일 필터링 시스템", 정보과학회, 제31권, 8호, 2004, pp.1092-1100.
  5. 송태민, "국내 건강정보 웹 사이트 현황 분석", 보건복지포럼, 2006, pp.61-76.
  6. 연종흠, 심준호, 이상구, "확장된 나이브 베이즈 분류기를 활용한 질문-답변 커뮤니티의 질문 분류", 정보과학회, 제16권, 1호, 2010, pp.95-99.
  7. 이종철, 오진아, "인터넷 지식검색 프로그램상 사회.역사 관련 지식 정보의 정확도에 관한 분석적 고찰 네이버(NAVER) 지식iN과 다음(DAUM) 지식의 실태를 중심으로", 조사연구, 제15권, 2호, 2014, pp.149-186.
  8. 이태원, 홍태호,"Support Vector Machine을 이용한 온라인 리뷰의 용어기반 감성분류 모형",Information Systems Review, 제17권, 1호, 2015, pp.49-64. https://doi.org/10.14329/isr.2015.17.1.049
  9. 장종인, "지식 생산 및 전달 양식의 변화: NAVER 지식검색 서비스에서 찾아본 건강지식 사례분석", 정보통신정책, 제18권, 16호, 2006, pp.1-18.
  10. 조수영, "인터넷 건강 정보의 정보원 유형과 상업 링크 유무, 질병의 심각성에 따른 설득 효과 차이", 한국언론학보, 제55권, 3호, 2011, pp.123-152.
  11. 최항섭, "레비의 집단지성 : 대중지성을 넘어 전문가지성의 가능성 모색", 사이버커뮤니케이션 학보, 제26권, 3호, 2009, pp.287-322.
  12. Adams, S. A., "Revisiting the online health information reliability debate in the wake of "web 2.0": An interdisciplinary literature and website review", International Journal of Medical Informatics, Vol.79, 2010, pp.391-400. https://doi.org/10.1016/j.ijmedinf.2010.01.006
  13. Delany, S. J., Buckley, M., & Greene, D., "SMS spam filtering: Method and data", Expert Systems with Applications, Vol.39, 2012, pp.9899-9908. https://doi.org/10.1016/j.eswa.2012.02.053
  14. Fichman, P., "A comparative assessment of answer quality on four question answering sites", Journal of Information Science, Vol.37, No.5, pp.476-486. https://doi.org/10.1177/0165551511415584
  15. Gao, Q., Tian, Y., and Tu, M., "Exploring factors influencing Chinese user's perceived credibility of health and safety information on Weibo, Computer in Human Behavior, Vol.45, 2015, pp.21- 31. https://doi.org/10.1016/j.chb.2014.11.071
  16. Joo, J., and Normatov, I. R., "Relationships between Collective Intelligence Quality, Its Determinants, and Usefulness: A Comparative Study between Wiki Service and Q&A Service in Perspective of Korean Users", Asia Pacific Journal of Information System, Vol.22, No.4, 2012, pp.75-99.
  17. Lee, Y. M., and Moon, S. J., "Communication Technology and Network Information in food and Nutrition",The Korean Journal of Nutrition, Vol.30, No.7, 1997, pp.870-878.
  18. Pang, B., Lee, L., and Vaithyanathan, S., "Thumbs up? Sentiment Classification using Machine Learning Techniques",In Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2002, pp.79-86.
  19. Savolainen, R., "Judging the Quality and Credibility of Information in Internet Discussion Forums", Journal of the American Society for Information Science and Technology, 2011, pp.1-14.
  20. Sohn, D. N., Lee, J. T., and Rim, H. C., "The contribution of stylistic information to content-based mobile spam filtering", In Proceedings of the ACL/AFNLP 2009 conference short papers, pp.321-324.
  21. Vapnik, V., The Nature of Statistical Learning Theory, Springer, 1995.