DOI QR코드

DOI QR Code

Ontology-based Cohort DB Search Simulation

온톨로지 기반 대용량 코호트 DB 검색 시뮬레이션

  • Received : 2016.01.16
  • Accepted : 2016.02.26
  • Published : 2016.03.31

Abstract

Many researchers have used cohort DB (database) to predict the occurrence of disease or to keep track of disease spread. Cohort DB is Big Data which has simply stored disease and health information as separated DB table sets. To measure the relations between health information, It is necessary to reconstruct cohort DB which follows research purpose. In this paper, XML descriptor, editor has been used to construct ontology-based Big Data cohort DB. Also, we have developed ontology based cohort DB search system to check results of relations between health information. XML editor has used 7 layered Ontology development 101 and OWL API to change cohort DB into ontology-based. Ontology-based cohort DB system can measure the relation of disease and health information and can be used effectively when semantic relations are found. We have developed ontology-based cohort DB search system which can measure the relations between disease and health information. And it is very effective when searched results are semantic relations.

코호트 DB(DataBase)를 이용하여 질병 발생 예측 및 확산을 추적하는 많은 연구가 진행되고 있다. 코호트 DB는 대용량의 질병 및 건강정보가 단순한 개별적인 DB 테이블의 집합으로 구성되어있어 연관관계 검색을 위해서는 코호트 DB를 연구 목적에 맞게 재구성하는 작업이 필요하다. 본 논문에서는 대용량 코호트 DB를 온톨로지 기반으로 구축하기 위해 XML descriptor, editor를 이용하였다. 또한, 원활한 연관관계 검색결과 확인을 위해 온톨로지 기반의 코호트 DB 검색 시스템과 UI를 개발하였다. XML editor에서는 코호트 DB를 온톨로지로 구성하기 위해 7단계로 구성된 Ontology development 101 방법론과 OWL(Ontology Web Language) API를 이용하였다. 이와 같은 온톨로지 기반 코호트 DB 검색 시스템은 질병 및 건강정보의 연관성을 측정하고 의미적인 연관관계를 검색 시 효과적으로 활용 가능하다.

Keywords

References

  1. Wan, Joy, et al. "Risk of moderate to advanced kidney disease in patients with psoriasis: population based cohort study." BMJ 347 (2013).
  2. 노창현, 장성호, 김태영, and 이종식. "시멘틱 컴퓨팅 기반의 동적작업 스케줄링 모델 및 시뮬레이션." 한국시뮬레이션학회논문지 18.2, (2009): 29-38.
  3. 조대웅, 최지웅, and 김명호. "비정형 문서의 정보추출을 통한 OWL 온톨로지 구축 시스템의 설계 및 구현" 한국컴퓨터정보학회논문지 19.10 (2014): 23-33. https://doi.org/10.9708/jksci.2014.19.10.023
  4. Aljumah, Abdullah A., Mohammed Gulam Ahamad, and Mohammad Khubeb Siddiqui. "Application of data mining: Diabetes health care in young and old patients." Journal of King Saud University-Computer and Information Sciences 25.2 (2013): 127-136. https://doi.org/10.1016/j.jksuci.2012.10.003
  5. Ong, Ken KL, et al. "Association between postnatal catch-up growth and obesity in childhood: prospective cohort study." Bmj 320.7240 (2000): 967-971. https://doi.org/10.1136/bmj.320.7240.967
  6. 박유성, 박혜민, and 권태연. "국민건강보험 표본코호트 DB를 이용한 건강보험 재정추계." 응용통계연구 28.4 (2015): 663-683. https://doi.org/10.5351/KJAS.2015.28.4.663
  7. 배현주. "코호트 자료를 이용한 대기오염의 만성건강영향 평가체계 구축." 기본연구보고서 2014.단일호 (2014): 1-103.
  8. Yoo, Illhoi, et al. "Data mining in healthcare and biomedicine: a survey of the literature." Journal of medical systems 36.4 (2012): 2431-2448. https://doi.org/10.1007/s10916-011-9710-5
  9. Herland, Matthew, Taghi M. Khoshgoftaar, and Randall Wald. "Survey of Clinical Data Mining Applications on Big Data in Health Informatics." Machine Learning and Applications (ICMLA), 2013 12th International Conference on. Vol. 2. IEEE, 2013.
  10. 강윤정, 이재일, 배진호, and 이종현. "복소수 SVM을 이용한 목표물 식별 알고리즘." 전자공학회논문지 50.4 (2013): 182-188. https://doi.org/10.5573/ieek.2013.50.4.182
  11. 박유성, 장선화, and 김성용. "연구논문: 사망률 추계를 위한 오차수정 LC 모형." 조사연구 14.2 (2013): 19-47.
  12. 박주환, 김상구. "다중선형 회귀분석을 이용한 고속도로 터널구간의 교통사고 예측모형 개발." 한국ITS학회논문지 11.6 (2012): 145-154.
  13. 이승천, 허문열. "독립성검정에 의한 연관성의 측정." 통계연구 10.0 (2002): 133-152.