• 제목/요약/키워드: JupyterLab

검색결과 2건 처리시간 0.018초

CANVAS: A Cloud-based Research Data Analytics Environment and System

  • Kim, Seongchan;Song, Sa-kwang
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.117-124
    • /
    • 2021
  • 이 논문에서 우리는 국가연구데이터플랫폼 (DataON)의 분석서비스인 CANVAS (Creative ANalytics enVironment And System)를 제안한다. CANVAS는 연구데이터 분석 자원과 도구가 필요한 연구자들을 위한 개인화된 분석 클라우드 서비스이다. CANVAS는 마이크로서비스 아키텍쳐 기반으로 확장성을 고려하여 설계하였으며 전자정부프레임워크인 Spring 프레임워크, Kubernetes, JupyterLab 등의 오픈소스 소프트웨어를 이용하여 구축하였다. 구축된 시스템은 여러 사용자에게 개인화된 분석환경을 제공하며 고성능 클라우드 인프라 (CPU·GPU)를 활용하여 고속의 대용량 데이터 분석이 가능하다. 구체적으로 JupyterLab 이나 GUI 워크플로우 환경에서 데이터 모델링 및 처리가 가능하다. CANVAS는 DataON과 데이터가 공유되므로 사용자가 등록하거나 다운로드 받은 연구데이터는 CANVAS에서 바로 분석을 수행할 수 있다. 이로서 CANVAS는 DataON 사용자의 데이터 분석 편의성을 높이고 연구데이터 공유·활용 활성화에 기여한다.

데이터통합과 메타분석을 위한 그래프 통계량 추출과 검증 (Statistical Data Extraction and Validation from Graph for Data Integration and Meta-analysis)

  • 심성률;임요환;홍명희;송규선;한현욱
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.61-70
    • /
    • 2021
  • 본 연구의 목적은 개별연구들이 정확한 통계량을 제시하지 않고 그래프로만 나타내었을 경우 그래프로부터 통계량을 추출해내는 구체적인 방법을 기술한 것으로서 데이터통합과 정량적합성을 위한 메타분석을 가능하게 한다. 특히 메타분석(meta-analysis)은 체계적·객관적으로 대상문헌을 선택한 후 개별 연구들의 결과를 계량화하여 이를 통합된 효과크기(effect size)로 제시함으로써 근거중심의학(evidence based medicine)를 위한 올바른 의사결정을 할 수 있게 하는 중요한 분석도구이다. 데이터통합과 메타분석을 위해서 그래프로부터 정확한 통계수치를 추출하는 전산도구인 Adobe Acrobat Reader 와 Python기반의 JupyterLab 소프트웨어의 소개와 적용에 대한 주요사항을 알아보았다. 사용된 예제자료는 선행연구를 통해서 통계결과가 검증되어졌고 ClinicalTrials.gov에서 원자료 확보가 가능한 것을 사용하였다. 원자료와 각 전산도구들의 측정값을 각각 메타분석한 결과 통계적으로 유의한 차이는 없었다. 또한 연구자들간의 측정 신뢰도를 확인하였으며 높은 일치도를 나타내었다. 만약 그래프로부터 통게수치를 추출해야만 할 경우 연구의 완결성 유지를 위해서 전통적 사용 방법들보다는 전산 도구를 이용한 측정이 권고된다.