• Title/Summary/Keyword: 과학기술 데이터

Search Result 2,575, Processing Time 0.037 seconds

A Study on the analysis of Research Data Management and Sharing of Science & Technology Government-funded Research Institutes (과학기술분야 출연연구기관 연구데이터 관리 및 공유 사례 분석 연구)

  • Park, Miyoung;Ahn, Inja;Nam, Seungjoo
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.29 no.4
    • /
    • pp.319-344
    • /
    • 2018
  • As a part of the open science policy, this study compared the perception of research data sharing and utilization by academic field. Based on this, in - depth interviews were conducted with semistructured questions to the data task managers of 27 government - funded research institutes in science and technology. Among them, nine excellent organizations were selected from the viewpoint of data management and cases of research data collection and management were specifically presented. The State of the collection and management of research data by the participating research institutes is generally a pilot project stage, and the level of collection and establishment of data also differs by institution. In terms of institutions, they are divided into three levels: the level of collection and establishment of data(KIOM), the advanced level of it (KIST), And level of steps to start sharing (KRIBB, KRICT).

Research SW Development Integrated Framework to Support AI Model Research Environments (인공지능 모델 연구 환경 지원을 위한 연구소프트웨어 개발 통합 프레임워크)

  • Minhee Cho;Dasol Kim;Sa-kwang Song;Sang-Baek Lee;Mikyoung Lee;Hyung-Jun Yim
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.97-99
    • /
    • 2023
  • 소프트웨어를 개발하거나 실행하는 환경은 매우 다양하다. 최근에 혁신을 이끌고 있는 인공지능 모델은 오픈소스 프로젝트룰 통해 공개되는 코드나 라이브러리를 활용하여 구현하는 경우가 많다. 하지만 실행을 위한 환경 설치 과정이 쉽지 않고, 데이터 혹은 기학습된 모델 사이즈가 대용량일 경우에는 로컬 컴퓨터에서 실행하는 것이 불가능한 경우도 발생하고, 동료와 작업을 공유하거나 수동 배포의 어려움 등 다양한 문제에 직면한다. 이러한 문제를 해결하기 위하여, 소프트웨어가 유연하게 동작할 수 있도록 효율적인 리소스를 관리할 수 있는 컨테이너 기술을 많이 활용한다. 이 기술을 활용하는 이유는 AI 모델이 시스템에 관계없이 정확히 동일하게 재현될 수 있도록 하기 위함이다. 본 연구에서는 인공지능 모델 개발과 관련하여 코드가 실행되는 환경을 편리하게 관리하기 위하여 소프트웨어를 컨테이너화하여 배포할 수 있는 기능을 제공하는 연구소프트웨어 개발 통합 프레임워크를 제안한다.

A Study to Improve the Trustworthiness of Data Repositories by Obtaining CoreTrustSeal Certification (CoreTrustSeal 인증 획득을 통한 데이터 리포지토리의 신뢰성 향상을 위한 연구)

  • Hea Lim Rhee;Jung-Ho Um;Youngho Shin;Hyung-jun Yim;Na-eun Han
    • Journal of the Korean Society for information Management
    • /
    • v.41 no.2
    • /
    • pp.245-268
    • /
    • 2024
  • As the recognition of data's value increases, the role of data repositories in managing, preserving, and utilizing data is becoming increasingly important. This study investigates ways to enhance the trustworthiness of data repositories through obtaining CoreTrustSeal (CTS) certification. Trust in data repositories is critical not only for data protection but also for building and maintaining trust between the repository and stakeholders, which in turn affects researchers' decisions on depositing and utilizing data. The study examines the CoreTrustSeal, an international certification for trustworthy data repositories, analyzing its impact on the trustworthiness and efficiency of repositories. Using the example of DataON, Korea's first CTS-certified repository operated by the Korea Institute of Science and Technology Information (KISTI), the study compares and analyzes four repositories that have obtained CTS certification. These include DataON, the Physical Oceanography Distributed Active Archive Center (PO.DAAC) from NASA, Yareta from the University of Geneva, and the DARIAH-DE repository from Germany. The research assesses how these repositories meet the mandatory requirements set by CTS and proposes strategies for improving the trustworthiness of data repositories. Key findings indicate that obtaining CTS certification involves rigorous evaluation of organizational infrastructure, digital object management, and technological aspects. The study highlights the importance of transparent data processes, robust data quality assurance, enhanced accessibility and usability, sustainability, security measures, and compliance with legal and ethical standards. By implementing these strategies, data repositories can enhance their reliability and efficiency, ultimately promoting wider data sharing and utilization in the scientific community.

A Study on Legal Remedies for Intellectual Property Rights Infringements as Coming the Era of Big Data (빅데이터 시대의 도래로 인한 지식재산권 침해 및 이에 대한 법적 구제수단의 고찰)

  • Kim, Kyunghwan;Park, Namje
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1635-1638
    • /
    • 2013
  • 바야흐로 디지털 데이터의 빅뱅 시대로 진입하고 있다. 정보통신기술의 급속한 발전으로 인해 인터넷은 사회 전 분야를 변화시키고 있으며, 스마트 단말기, 사물인터넷, 소셜네트워크, 실시간 데이터 수집 장치, 지리정보시스템 등의 등장과 기타 여러 가지 새로운 형태의 데이터 소스가 출현하였다. 이에 따라 데이터 량이 폭발적으로 증가하고 있으며, 한 번에 처리해야 할 디지털 정보량이 수십 테라바이트에서 제타바이트에서 이르는 이른바 빅데이터 시대가 도래한 것이다. 그러나 빅데이터 기술의 빠른 성장에 비해 빅데이터 생태계의 근간이 되는 기술의 보호나 지식재산권의 침해로부터 관련 기술을 보호하기 위한 법적 구제수단은 미비한 형편이다. 이에 본 논문에서는 빅데이터 시대의 지식재산권 침해 유형을 분류하고, 현행법 하에서의 법적 구제수단에 대해 알아본다.

A Study on Performance Analysis Data Collection Method Using Batch-job Scheduler onLarge-Scale Cluster System (대규모 클러스터 시스템에서 배치작업 스케줄러를 활용한 성능 분석 데이터 수집 방법 연구)

  • Jae-Kook Lee;Min-Woo Kwon;Do-Sik An;Taeyoung Hong
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.37-39
    • /
    • 2023
  • 사용자 응용 프로그램의 특징을 분석하고 효율적인 시스템 운영을 통하여 사용자 프로그램 최적화를 지원하기 위하여 소프트웨어 프로파일링을 수행한다. 특히 국가 슈퍼컴퓨터인 누리온과 같이 8,400대가 넘는 계산노드로 구성된 클러스터 시스템에서 응용 프로그램의 프로파일링 데이터를 사용자의 개입없이 수집하고 데이터를 분석하는 것에는 한계가 있다. 본 연구에서는 배치작업 스케줄러를 활용하여 사용자의 개입 없이 응용 프로그램의 프로파일링 데이터를 수집하기 위한 방법을 제안한다. 그리고 제안한 방법을 누리온에서 구현하고 사용자 응용 프로그램이 실행될 때 프로파일링 데이터가 수집되는 것을 확인한다.

자율운항선박 입출항 계획 지원을 위한 울산항 항로의 혼잡도 분석

  • 김동함;윤상웅;김혜진
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2023.05a
    • /
    • pp.77-78
    • /
    • 2023
  • 자율운항선박의 항계 내 입출항 계획 수립을 지원하기 위한 기술 개발의 일환으로 과거 AIS 데이터를 활용하여 울산항 항로의 교통 혼잡도를 분석하였다. 울산항 AIS 데이터를 이용하여 항로 통항 선박의 수를 산출하고 항만, 기상 데이터와 비교하여 교통 혼잡도를 분석한다.

  • PDF

Numerical Reasoning Dataset Augmentation Using Large Language Model and In-Context Learning (대규모 언어 모델 및 인컨텍스트 러닝을 활용한 수치 추론 데이터셋 증강)

  • Yechan Hwang;Jinsu Lim;Young-Jun Lee;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.203-208
    • /
    • 2023
  • 본 논문에서는 대규모 언어 모델의 인컨텍스트 러닝과 프롬프팅을 활용하여 수치 추론 태스크 데이터셋을 효과적으로 증강시킬 수 있는 방법론을 제안한다. 또한 모델로 하여금 수치 추론 데이터의 이해를 도울 수 있는 전처리와 요구사항을 만족하지 못하는 결과물을 필터링 하는 검증 단계를 추가하여 생성되는 데이터의 퀄리티를 보장하고자 하였다. 이렇게 얻어진 증강 절차를 거쳐 증강을 진행한 뒤 추론용 모델 학습을 통해 다른 증강 방법론보다 우리의 방법론으로 증강된 데이터셋으로 학습된 모델이 더 높은 성능을 낼 수 있음을 보였다. 실험 결과 우리의 증강 데이터로 학습된 모델은 원본 데이터로 학습된 모델보다 모든 지표에서 2%p 이상의 성능 향상을 보였으며 다양한 케이스를 통해 우리의 모델이 수치 추론 학습 데이터의 다양성을 크게 향상시킬 수 있음을 확인하였다.

  • PDF

Cast Study : Visualization of Large Rotor Simulation Data using VTK (사례연구 : VTK를 이용한 대용량 로터 시뮬레이션 데이터의 가시화)

  • Lee, Joong-Youn;Hur, Younju;Kim, MinAh
    • Annual Conference of KIPS
    • /
    • 2009.11a
    • /
    • pp.393-394
    • /
    • 2009
  • 최근 컴퓨팅 성능의 급격한 발전으로 이를 통해 생산되는 데이터의 크기 역시 매우 커지고 있다. 이는 로터 시뮬레이션 분야에서도 마찬가지인데, 과거에는 백만개 정도의 격자 데이터 정도만을 다루었던 것에 비해 최근에는 1억개 이상의 격자 데이터를 다루려는 시도가 계속되고 있다. 그러나 이렇게 생산된 대용량의 시변환(time-variant) 유동 데이터는 그 크기가 매우 크기 때문에 일반 PC에서는 실시간으로 가시화하기에 곤란한 경우가 많다. 또, 이러한 로터 시뮬레이션 데이터는 매우 복잡한 구조를 가지고 있기 때문에 초보자가 이 데이터에서 vortex와 같은 중요한 정보를 뽑아서 가시화하는 데에는 많은 어려움이 있어 왔다. 본 논문에서는 일반 PC에서 가시화하기 어려운 대용량 로터 시뮬레이션 데이터를 고성능 가시화 컴퓨터와 VTK를 이용해서 빠르게 가시화하기 위한 방법을 서술한다. 또, 복잡한 데이터 내부의 중요한 정보들을 자동으로 빠르고 간편하게 표출하기 위한 방법을 제안한다.

Data Analysis for Plasma Equipment Sensor data (플라즈마 공정 장비의 센서데이터 분석 연구)

  • Ryu, Jinseung;Jeong, Minjoong;Jung, Hee-Jin
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.05a
    • /
    • pp.25-26
    • /
    • 2022
  • 플라즈마 공정장비 지능화를 이루기 위해서는 플라즈마 공정장비에서 플라즈마를 생성하는 다양한 조건 값에 따라 변화되는 플라즈마의 상태 값이 필요하며 이러한 데이터를 수집하기 위해 여러 종류의 측정 센서를 사용한다. 측정 센서에서 생산된 데이터를 이용하여 다양한 분석 기법을 사용하여 플라즈마 생성 조건 및 센서 데이터의 주요한 특징점 간의 관계성을 파악함으로써 플라즈마 공정장비의 상태를 진단할 수 있다. 이를 위해 플라즈마 공정장비에서 생산된 데이터를 기반으로 다양한 데이터 분석 연구를 통한 데이터간의 연관성을 보여주도록 한다.

  • PDF