• 제목/요약/키워드: 과학데이터관리

검색결과 1,065건 처리시간 0.03초

사회과학분야 학술 연구자의 연구데이터 재이용 영향요인 연구 (A Study on Factors Affecting the Reuse of Research Data by Academic Researchers in the Social Sciences)

  • 박지원;장우권
    • 정보관리학회지
    • /
    • 제38권4호
    • /
    • pp.199-230
    • /
    • 2021
  • 이 연구는 연구데이터 재이용에 대한 연구자 및 재이용 데이터를 조사를 통해 연구데이터 재이용 영향에 대한 분석 및 활성화 방안을 제시하는데 있다. 이를 위해 연구데이터를 재이용하여 뉴 연구결과물을 산출한 경험이 있는 국내 사회과학분야 학술 연구자를 대상으로 설문배포와 회수를 토대로 178부를 분석하였다. 그 결과, 1) 대부분의 연구자들은 데이터 리포지터리, 데이터관리시스템, 연구데이터 DB와 같은 시스템을 통해 재이용 데이터를 획득하고, 실험 및 관찰을 통해 생산된 분석데이터를 주로 재이용하는 것으로 나타났다. 또한 성공적으로 연구데이터를 재이용한 연구자임에도 불구하고 연구데이터 공유에 대한 인식이 낮을뿐더러 다양한 문제에 직면하여 공유를 하지 않았다. 2) 문헌 검토와 요인 분석을 통해 도출한 10가지 요인(학문적 유용성, 연구의 효율성, 연구자의 우려사항, 데이터 취약성, 직접적 노력, 간접적 노력, 재이용 적합성, 데이터 완전성, 데이터 유용성, 사회적 조건)의 신뢰성과 타당성을 검증하였다. 3) 상관 분석결과 연구 효율성, 사회적 조건은 연구데이터 재이용 의도와 양적 상관관계가, 연구자의 우려사항, 데이터 취약성, 직접적 노력은 연구데이터 재이용 의도와 음적 상관관계가 나타났다. 회귀 분석 결과 이 요인들은 모두 연구데이터 재이용 의도에 유의미한 영향을 미치는 것으로 나타났으며, 연구의 효율성, 사회적 조건, 직접적 노력, 연구자의 우려사항, 데이터 취약성 순서로 연구데이터 재이용 의도에 영향을 미치는 것으로 나타났다. 이를 토대로 연구데이터 재이용 활성화 방안을 제시하였다.

네트워크자원과 메타데이터 (Network Resources and Metadata)

  • 김태수
    • 정보관리연구
    • /
    • 제30권3호
    • /
    • pp.1-26
    • /
    • 1999
  • 네트워크 자원의 기술과 접근을 위한 더블린 코어는 표준형식의 메타데이터로 평가되고 있다. 이 논문은 더블린 코어의 기본 데이터 요소와 기술방법, 아울러 다양한 메타데이터간의 연계구조로 제안된 자원기술구조의 기능을 분석하였다.

  • PDF

데이터의 의미적 상호운용성 확보를 위한 데이터 모델링 프로세스 : EDM 가공에의 적용 (Data Modeling Process to Ensure Semantic Interoperability of Data : An Application to EDM Machining)

  • 서태설
    • 정보관리연구
    • /
    • 제38권1호
    • /
    • pp.59-73
    • /
    • 2007
  • 재사용 및 의미공유가 가능한 가공 데이터베이스를 구축하기 위해서는 의미적 메타데이터 관리가 요구된다. 이 연구에서는 가공 데이터를 위한 의미적 데이터 모델링 프로세스를 개발하였다. 이것은 기존의 데이터 모델들과 메타데이터 레지스트리를 다루는 ISO/IEC 11179 표준을 복합한 것이다. 데이터의 의미적 상호운용성을 확보하기 위해서 데이터 요소 이름을 구성하는 객체 클래스 이름과 특성 이름들은 기존의 데이터 모델을 이용해서 식별하고, 데이터 요소의 명명과 명세는 ISO/IEC 11179에 근거해서 이루어진다. 방전가공이라는 기계가공에 실험적으로 적용함으로써 방법론을 설명하였다.

과학 빅데이터를 위한 엔디엔 테스트베드 분석: 현황, 응용, 특징, 그리고 이슈 (Analysis on NDN Testbeds for Large-scale Scientific Data: Status, Applications, Features, and Issues)

  • 임헌국;신광천
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.904-913
    • /
    • 2020
  • 데이터 볼륨과 복잡도가 빠르게 증가함에 따라 과학 빅데이터를 다루는 데이터 집적 과학은 네트워크를 통해 보다 효과적인 데이터 저장 및 분배를 위한 새로운 기술을 발견하는 것을 필요로 한다. 최근 네임드 데이터 네트워킹 커뮤니티와 데이터 집적 과학 커뮤니티는 함께 과학 실험 빅데이터의 분배 및 관리에 있어서 혁신적인 변화를 꾀하였다. 본 논문 에서는 기후과학 및 고에너지물리 데이터 등과 같은 과학 빅데이터를 위한 현존하는 엔디엔 테스트베드들에 대한 분석이 처음으로 이루어진다. 과학 빅데이터를 위한 엔디엔 테스트베드들을 현황, 엔디엔 기반 응용, 특징 측면에서 묘사하고 토의한다. 마지막으로 과학 빅데이터를 위한 엔디엔 테스트베드 네트워크를 확립함에 있어서, 함정에 빠질 수 있는 다양한 이슈들을 엔디엔 테스트베드들에 대한 묘사 그리고 특징들로 부터 도출하여, 분석 제시한다.

해외 과학기술 학술논문 메타데이터의 비교 분석 (Comparison and Analysis of Science and Technology Journal Metadata)

  • 이민호;이원구;윤화묵;신성호;류재철
    • 한국콘텐츠학회논문지
    • /
    • 제11권9호
    • /
    • pp.515-523
    • /
    • 2011
  • 글로벌 연구동향 파악, 이머징 시그널 탐지, 선도연구자 파악과 같은 최근의 정보서비스를 지원하기 위해서는 다양한 정보원으로부터 수집되는 대량의 정보를 통합 관리하는 것이 중요하다. 통합 관리를 위해서는 통합 메타데이터 스키마의 정의, 데이터 변환, 스키마 매칭 등의 노력이 필요한데 그 중에서 가장 먼저 수행되어야 하는 통합 메타데이터 스키마를 정의하기 위해서는 현존하는 다양한 메타데이터의 분석이 필요하다. 본 논문에서는 다양한 과학기술 학술논문 메타데이터를 메타데이터의 의미구조, 내용규칙, 구문 등으로 나누어 분석하고 통합 스키마를 만들거나 데이터 변환을 하기위해 고려하여야 할 점을 간략하게 살펴보았다. 일반적으로 구문형태는 편리성과 다양한 사용 환경을 지원하는 XML을 사용함을 알 수 있었으며, 의미구조에서는 공통적으로 사용하는 요소들과 구조화, 계층화한 이름 부여가 필요함을 알 수 있었다. 또한 요소들 중 다양한 내용규칙을 갖는 것들과 관련 표준을 살펴보았다. 분석된 자료는 메타데이터의 통합 관리, 데이터 변환, 상호운영을 위한 스키마 매칭 등의 연구에 기초자료로 사용되기를 기대한다.

데이터 통합검색을 위한 XMDR기반의 OGSA-DAI 시스템 설계 및 구현 (Design and Implementation of XMDR based on OGSA-DAI System for Data Integration retrieval)

  • 마진;문석재;정계동;최영근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.173-174
    • /
    • 2009
  • 기업이 관리하고 있는 중요한 정보자원들은 대부분이 여러 레거시 시스템에 분산 저장되어 있다. 그리고 저장되어 있는 정보 자원들 또한 서로 호환되지 않는 다양한 형태로 존재하고 있다. 이러한 문제를 해결하기 위해 분산된 데이터의 통합과 지식 공유를 위한 시스템이 필요하다. 데이터 통합의 목적은 기업의 조직과 주요 업무, 핵심 어플리케이션으로부터 발생하는 데이터 소스들의 표준 규칙과 메타 데이터를 이용하여 중복성을 제거하고, 오직 단일 데이터를 제공하는데 있다. 본 논문에서는 XMDR 기반의 OGSA-DAI를 이용하여 통합 검색 시스템을 설계 및 구현하였고, 분산되어 있는 레거시 시스템간의 데이터 통합검색이 가능한 시스템을 제안한다. 제안한 시스템은 분산된 레거시 데이터베이스간의 협업 환경 구성에 적합하며, 실시간 기업환경에서 빠른 정보 전달과 업무 지원 환경에 적절한 시스템이다.

GAN 데이터 기반의 머신러닝 모델을 통한 미계측 하천에서의 수생태계 건강성 등급 예측 방안 연구 (A study on the prediction of aquatic ecosystem health grade in ungauged rivers through the machine learning model based on GAN data)

  • 이서로;이지민;이관재;김종건;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.448-448
    • /
    • 2021
  • 최근 급격한 기후변화와 도시화 및 산업화로 인한 지류하천에서의 수량과 수질의 변동은 생물 다양성 감소와 수생태계 건강성 저하에 큰 영향을 미치고 있다. 효율적인 수생태 관리를 위해서는 지속적인 유량, 수질, 그리고 수생태 모니터링을 통한 데이터 축적과 더불어 면밀한 상관 분석을 통해 수생태계 건강성의 악화 원인을 규명해야 할 필요가 있다. 그러나 수많은 지류하천을 대상으로 한 지속적인 모니터링은 현실적으로 어려움이 있으며, 수생태계의 특성 상 단일 영향 인자만으로 수생태계의 건강성 변화와의 관계를 정확히 파악하는데 한계가 있다. 따라서 지류하천에서의 유량 및 수질의 시공간적인 변동성과 다양한 영향 인자를 고려하여 수생태계의 건강성을 효율적으로 예측할 수 있는 기술이 필요하다. 이에 본 연구에서는 경험적 데이터 기반의 머신러닝 모델 구축을 통해 미계측 하천에서의 수생태계 건강성 지수(BMI, TDI, FAI)의 등급(A to E)을 예측하고자 하였다. 머신러닝 모델은 학습 데이터셋의 양과 질에 따라 성능이 크게 달라질 수 있으며, 학습 데이터셋의 분포가 불균형적일 경우 과적합 또는 과소적합 문제가 발생할 수 있다. 이를 보완하고자 본 연구에서는 실제 측정망 데이터셋을 바탕으로 생성적 적대 신경망 GAN(Generative Adversarial Network) 알고리즘을 통해 머신러닝 모델 학습에 필요한 추가 데이터셋(유량, 수질, 기상, 수생태 등급)을 확보하였다. 머신러닝 모델의 성능은 5차 교차검증 과정을 통해 평가하였으며, GAN 데이터셋의 정확도는 실제 측정망 데이터셋의 정규분포와의 비교 분석을 통해 평가하였다. 최종적으로 SWAT(Soil and Water Assessment Tool) 모형을 통해 예측 된 미계측 하천에서의 데이터셋을 머신러닝 모델의 검증 자료로 사용하여 수생태계 건강성 등급 예측 정확도를 평가하였다. 본 연구에서의 GAN에 의해 강화된 머신러닝 모델은 수질 및 수생태 관리가 필요한 우심 지류하천 선정과 구조적/비구조적 최적관리기법에 따른 수생태계 건강성 개선 효과를 평가하는데 활용될 수 있을 것이다. 또한 이를 통해 예측된 미계측 하천에서의 수생태계 건강성 등급 자료는 수량-수질-수생태를 유기적으로 연계한 통합 물관리 정책을 수립하는데 기초자료로 활용될 수 있을 것이라 사료된다.

  • PDF

재난안전데이터 공유 플랫폼 기반 위기경보시스템 구현 (Implementation of Crisis Alert System based on Disaster and Safety Data Sharing Platform)

  • 심형섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.303-304
    • /
    • 2022
  • 본 논문에서는 재난위기경보관리시스템 구축을 위해 행정안전부가 구축중인 재난안전데이터 공유 플랫폼의 데이터를 연동하기 위한 기반 및 기술을 제안한다. 국가 R&D로 수행중인 재난위기경보관리시스템은 위기경보 수준을 판단하기 위해 필요한 데이터를 수집, 위기경보 수준 자동분석, 위기경보 수준 판단 및 표출하는 기능을 구현하였다. 그러나 실제 운영하기 위해서는 국가재난정보관리시스템(NDMS)내에서 운영할 수 있도록 재난안전데이터 공유 플랫폼의 데이터 연동을 위한 방안에 대해 연구하였다.

  • PDF

도서관 빅데이터 서비스 모형 개발에 관한 연구 - 도서관 서비스 수요 분석을 중심으로 - (A Study on the Library Big Data Service Model)

  • 이은지;김완종
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.131-134
    • /
    • 2014
  • 전 세계적으로 다양한 영역에서 빅데이터 활용 성공 사례가 증가하게 되면서 도서관 분야에서도 빅데이터를 활용한 신규 서비스 개발 필요성이 제기 되고 있다. 본 연구는 공공도서관의 정보서비스 제공 및 도서관 운영 실태, 이용자 특성 등을 분석하였고, 이를 바탕으로 새로운 도서관 패러다임을 이끄는 도서관 빅데이터 서비스 모형을 개발하고자 한다. 먼저, 설문 대상을 사서 집단과 이용자 집단으로 나누어 공공도서관 이용현황을 파악하였고, 대표적인 공공도서관 서비스인 장서개발 및 열람봉사, 이용자 맞춤형 추천서비스에 대한 수요도를 분석하였다. 추가적으로 응답에 대한 집단 간 차이에 대해 살펴보았다. 분석결과를 토대로 관련 서비스 개발을 위한 방향성을 도출하였고, 향후 활용 가능한 도서관 빅데이터 서비스 정립을 위한 기초 방안을 제시하였다.

  • PDF

국가과학기술표준분류체계 용어 관리를 위한 SKOS 기반 메타데이터 요소 개발 연구 (A Study on Development of SKOS-based Metadata Elements for Managing Keywords in the National Science and Technology Standard Classification System)

  • 송민선;박진호
    • 한국비블리아학회지
    • /
    • 제32권4호
    • /
    • pp.67-88
    • /
    • 2021
  • 국가과학기술표준분류는 과학기술 관련 정보, 인력, 연구개발사업 등을 효율적으로 관리하기 위한 목적으로 제정 및 운영되고 있으며 개정주기는 5년이다. 2022년은 차기 개정 절차의 첫 해로 현재의 대, 중, 소분류체계 중 소분류체계를 기술키워드화 하는 것이 주 목적이다. 이는 현재의 경직된 구조로 인해 발생하는 유관 분류체계와의 연계 어려움과 최신 용어에 대한 미반영 문제를 해결하기 위한 것이다. 본 연구에서는 이 문제 해결을 위해 기존의 분류체계 관리를 용어관리체계로 변화시켜 용어의 품질과 활용성을 높일 수 있는 방법을 제안하였다. 이를 위해 표준용어관리체계인 SKOS와 ISO/IEC 11179 표준을 기본 모델로 설정하였다. 또 해외 과학기술용어집에서 활용하고 있는 용어관리 메타데이터 표준을 조사하여 현 국가과학기술표준분류체계와 비교한 후 용어관리관점에서 즉시 활용할 수 있는 메타데이터들을 도출하였다. 그 결과 현 관리체계에서 즉시 변형하여 적용할 수 있는 11개 표준 요소를 발굴 제안하였으며, 차후 분류체계 개정 작업을 거친 후 적용할 수 있는 5개 요소를 발굴하여 제안하였다.