• 제목/요약/키워드: 과학데이터관리

검색결과 1,081건 처리시간 0.029초

국가연구데이터커먼즈 서비스를 위한 데이터모델 연구 (Data Model Study for National Research Data Commons Service)

  • 조민희;이미경;송사광;임형준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.436-438
    • /
    • 2022
  • 국가연구데이터커먼즈는 연구데이터 활용 극대화를 위해 컴퓨팅 인프라, 데이터 분석을 위해 사용되는 SW, Toolkit, API, 서비스 등과 같은 분석리소스를 연구데이터와 함께 배치하여 연합 활용될 수 있는 체계를 구축하는 것을 목표로 한다. R&D 과정에서 연구 출판물, 연구데이터에 대한 공유·활용 체계는 이미 잘 알려져 있다. 하지만 데이터와 밀결합된 소프트웨어, 컴퓨팅 인프라들을 공유하고, 활용할 수 있는 환경은 미미하고, 관리체계가 없는 실정이다. 본 연구에서는 데이터 중심의 R&D 연구 과정에서 필요한 디지털 연구 자원 정보를 체계적으로 관리하기 위하여 데이터모델을 설계한다. 이는 국가연구데이터커먼즈 서비스에서 디지털 연구 자원 정보들을 등록하고 관리하는데 활용될 예정이다.

  • PDF

전자자원 라이선스 관련 메타데이터 설정에 관한 연구 (A Study on the Establishment of Metadata for Licensed Electronic Resources)

  • 이두영;강순희
    • 정보관리연구
    • /
    • 제35권4호
    • /
    • pp.57-80
    • /
    • 2004
  • 오늘날 대부분의 도서관 전자자원 이용은 라이선스 계약에 의해 이루어지고 있다. 이용자의 전자자원 접속 및 이용은 라이선스 조건 범위 내에서 허용된다. 따라서 전자자원을 효율적으로 관리하고 적절한 서비스를 제공하기 위해서는 라이선스 관련 데이터요소를 체계적으로 관리할 필요가 있다. 이에 본 연구는 전자자원 관리를 위한 라이선스 관련 메타데이터를 설정하는데 그 목적이 있다. 본 연구방법으로 전자자원 메타데이터 스키마, 저작권 권리표현언어의 분석과 외국 대학도서관 전자자원 관리시스템의 라이선스 관련 데이터요소의 비교분석을 하였다. 이를 종합하여 최종적으로 전자자원 라이선스 관련 핵심요소와 선택요소로 구분하여 라이선스 관련 메타데이터를 설정하였다.

와이파이 핑거프린트 기반 데이터 수집 방법 및 가공 연구 (Wi-Fi Fingerprint-based Data Collection Method and Processing Research)

  • 김성현;윤창표
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.319-322
    • /
    • 2019
  • 실내 환경에서 사용자의 위치를 측위하는 다양한 기법들이 있다. 그중 와이파이 핑거프린트 기법은 데이터 수집 단계와 측위 단계로 구분된다. 데이터 수집 단계에서는 해당 위치 주변의 모든 와이파이 신호를 수집하여 리스트 형태로 관리한다. 수집된 데이터가 많을수록 실내측위 정확도가 향상된다. 기존 고품질 데이터 수집 및 관리 방법은 많은 시간과 비용이 소모되고, 기계학습에 필요한 데이터를 추출해 생성할 때 많은 연산이 필요하다. 따라서 한정된 자원 안에서 많은 데이터를 수집 및 관리할 수 있는 방법을 연구한다. 본 논문은 효율적인 데이터 수집 기법과 기계학습에 필요한 학습 데이터 관리 및 생성 기법을 제안한다.

  • PDF

행정정보 데이터세트의 기록관리 방안 (Managing Data Set in Administrative Information Systems as Records)

  • 오세라;이해영
    • 한국기록관리학회지
    • /
    • 제19권2호
    • /
    • pp.51-76
    • /
    • 2019
  • 기록관리 전문가와 학자들은 행정정보 데이터세트 기록의 관리 필요성과 그 시급성을 역설하여 왔으나 실제 현장에서 데이터세트의 관리는 시행하지 못 하고 있는 실정이다. 데이터세트는 기술 종속적인 특성과 방대한 규모는 물론 시스템별 다양한 운영 환경으로 인해 현행 종이기록 중심의 표준 기록관리 지침과 절차를 적용하기 어렵다. 무엇보다 데이터세트 자체의 고유한 특성을 수용하는 관리체계가 필요하며, 그 관리 방안은 업무 현장에서 적용할 수 있어야 한다. 이 연구는 공공기관에서 실제 운영 중인 행정정보시스템의 데이터세트의 현황을 조사한 분석 결과에 기반하여 데이터세트 관리 방안과 절차를 개발하여 제시하였다.

연구데이터 품질관리를 위한 프로세스 모델 제안 (Proposal of Process Model for Research Data Quality Management)

  • 한나은
    • 정보관리학회지
    • /
    • 제40권1호
    • /
    • pp.51-71
    • /
    • 2023
  • 본 연구는 공공데이터 품질관리 모델, 빅데이터 품질관리 모델, 그리고 연구데이터 관리를 위한 데이터 생애주기 모델을 분석하여 각 품질관리 모델에서 공통적으로 나타나는 구성 요인을 분석하였다. 품질관리 모델은 품질관리를 수행하는 객체인 대상 데이터의 특성에 따라 생애주기에 맞추어 혹은 PDCA 모델을 바탕으로 구축되고 제안되는데 공통적으로 계획, 수집 및 구축, 운영 및 활용, 보존 및 폐기의 구성요소가 포함된다. 이를 바탕으로 본 연구는 연구데이터를 대상으로 한 품질관리 프로세스 모델을 제안하였는데, 특히 연구데이터를 대상 데이터로 하여 서비스를 제공하는 연구데이터 서비스 플랫폼에서 데이터를 수집하여 서비스하는 일련의 과정에서 수행해야하는 품질관리에 대해 계획, 구축 및 운영, 활용단계로 나누어 논의하였다. 본 연구는 연구데이터 품질관리 수행 방안을 위한 지식 기반을 제공하는데 의의를 갖는다.

TCP/IP 소켓을 이용한 원격 측정 장치의 실험 데이터 통합 관리 시스템 개발 (Management System for Experimental Data In Remote Measurement Device Using TCP/IP Socket)

  • 김선영;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.397-400
    • /
    • 2010
  • 최근의 과학 실험은 그 규모나 내용에 있어서 점차 대형화되는 동시에 복잡해지고 있다. 이로 인하여 다양한 측정 장비로부터 도출된 실험 결과를 효율적으로 분석, 관리, 종합하는 도구의 필요성이 커지고 있다. 본 논문에서는 원격 측정 장치로부터 서로 다른 포맷의 실험 데이터를 자동 수집한 후 이중 정제한 데이터들만 추출하여 웹에서 시각화하는 실험 데이터 통합 관리 시스템을 제안한다. 먼저 원격 측정 장치의 데이터를 자동으로 수집하기 위해 폴링 서버를 설계하여 장치마다 폴링 에이전트를 도입하였다. 이를 통해 관리자가 각 측정 장치에 직접 접근하지 않고도 데이터를 수집할 수 있다. 폴링으로 확보한 데이터는 파싱을 통해 정제하고, 이들 데이터로 데이터베이스를 구축한다. 정제한 데이터는 시각화하여 사용자가 웹에서 쉽게 파악할 수 있다. 데이터 폴링은 TCP/IP Socket을 통해 수행하므로 보편적으로 사용하는 FTP 방식에 비해 데이터 확보 시 신뢰성을 높일 수 있으며, 폴링 여부 판단 시에는 동기식, 실제 폴링 시에는 비동기식 통신 방법을 사용하여 폴링의 효율을 높였다. 본 시스템을 활용하여 사용자의 임의적인 데이터 접근을 최소화하였고 데이터의 전송, 저장, 관리를 자동화함으로써 편의성을 높였다. 본 시스템을 활용하여 원격 실험 장치로부터 데이터를 확보할 때의 정확성과 폴링 및 파싱 속도를 실험을 통해 측정하였고, 그 결과 폴링 시 100%의 정확도와 정상 포맷의 데이터에 대해서 100%의 파싱 결과를 보임으로써 본 시스템이 원격 장치의 실험 데이터를 통합 관리할 때 적합함을 알 수 있었다. 추후 데이터의 속성에 따라 클러스터링 할 예정이며 클러스터링에 따른 시각화 서비스를 제공할 계획이다.

  • PDF

ScienceDMZ 기반 초고속 빅데이터 전송을 위한 시스템과 네트워크 통합 성능 모니터링 환경 개발 (Developing an integrated System and Network performance monitoring environment for High-speed Big data transfer on ScienceDMZ technology)

  • 김동학;문정훈;이상권;박종선;김병서
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.110-113
    • /
    • 2018
  • 본 논문은 최근 데이터 집약형과학분야 연구개발의 비약적인 발전과 관측, 실험, 분석 장비들의 고도화에 따라 생산되는 과학데이터의 빅데이터화, 고부가가치화 등으로 연구 패러다임의 변화가 빅데이터 중심으로 가속되고 있다. 이러한 과학 빅데이터는 ExaByte 급의 대용량으로서 한 곳에서 관리되기보다는 전 세계적으로 분산되어 관리 운영되고 있다. 응용연구자들은 이러한 과학 빅데이터에 대한 초고속 전송/저장/공유에 대한 요구가 높아지고 있으며, 이러한 문제의 해결을 위해 ScienceDMZ 기반의 다양한 고속전송환경이 구축 개발되고 있다. 따라서 본 논문에서는 장러기 빅데이터 전송을 위한 ScienceDMZ의 핵심 기술인 DTN(Data Transfer Node)을 통한 빅데이터의 장거리 전송 시 고대역 네트워크 환경과 시스템 성능에 대한 통합 모니터링 환경을 구축 개발하였다.

EEG, MRI와 조현병의 상관관계를 이용한 진단 시스템 연구 (Study on a Diagnosis System using Correlation between Schizophrenia and EEG, MRI data)

  • 성지현;김도연;김지은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.464-467
    • /
    • 2020
  • 조현병(정신분열증)은 사고, 감정, 지각, 행동 등 인격의 여러 측면에 걸쳐 광범위한 임상적 이상 증상을 일으키는 정신 질환이다. 심각한 정신 질환임에도 불구하고 여전히 과학적 진단 체계가 갖춰져 있지 않아 진단의 많은 부분을 환자의 진술에 의존하고 있으며, 이로 인해 조현병이라는 진단을 받고 치료방법을 찾는데 까지 오랜 시간이 걸린다. 이에 본 연구는 EEG, MRI 데이터와 조현병의 상관관계를 이용한 조현병 진단 시스템을 제안하고자 한다. 본 시스템은 MRI 데이터와 머신러닝 알고리즘을 통한 조현병의 확률적 진단과 함께, EEG 데이터의 시각화 기능을 제공하는 소프트웨어를 개발함으로써 조현병 진단의 과학적 근거를 의사에게 제공하여 정확한 병의 진단을 목표로 한다. 진단 후에는 환자 데이터의 체계적 관리를 통해 머신러닝 알고리즘의 학습 데이터 확보 및 환자의 상태를 지속적으로 관리·관찰 할 수 있도록 하여 의료 소프트웨어로서 조현병의 체계적 진단 및 관리 시스템을 구축한다.

사이언스 빅 데이터(Science Big Data) 처리 기술 동향

  • 김희재;주경노;윤찬현
    • 정보와 통신
    • /
    • 제29권11호
    • /
    • pp.11-23
    • /
    • 2012
  • 본 고에서는 과학 분야에서의 대용량 데이터 처리를 위한 기술인 사이언스 빅데이터의 처리 기술 동향에 대하여 기술한다. 서론에서 사이언스 빅데이터의 정의 및 필요성을 다루고, 본론에서는 데이터 중심 과학 패러다임의 등장과 그로 인한 사이언스 빅데이터 요구사항, 사이언스 빅데이터 소스 수집 및 정제, 저장 및 관리, 처리, 분석 등으로 이루어지는 사이언스 빅데이터 처리 기법에 대하여 기술한다. 또한 현재 다양한 기관에서 연구하고 있는 사이언스 빅데이터 플랫폼, 맵리듀스 등을 이용한 워크플로우 제어 기반의 사이언스 빅데이터 처리 기법을 예시로 소개한다.