• Title/Summary/Keyword: 과학기술 데이터

Search Result 2,575, Processing Time 0.036 seconds

A Study on the Multiple Classification System for S&T Knowledge Infrastructure Integrated Service (과학기술 지식인프라 통합서비스를 위한 분류체계 연구)

  • Lee, Hyejin;Lee, Seok-Hyoung;Choi, Hee-Seok
    • Annual Conference of KIPS
    • /
    • 2020.11a
    • /
    • pp.665-668
    • /
    • 2020
  • 대규모 프로젝트나 상호 이질적인 여러 시스템을 보유하고 있는 기관에서는 보통 시스템을 여러개로 나누어 운영하고 있다. 이러한 경우 운영의 효율성을 위해 시스템 통합에 대한 요구가 증가하게 된다. 시스템을 하나로 통합하다 보면 효율적인 운영이 가능하며, 단일화된 서비스를 통해 이용자는 여러 서비스를 한 곳에서 활용할 수 있는 편의성을 제공할 수 있다. 본 연구에서는 통합서비스 구축을 통해 이용자가 여러 서비스를 효율적으로 활용할 수 있는 접근점 중의 하나인 분류체계 구축 방법을 소개하고 실제 구현 사례를 제시한다. 통합서비스 요구분석을 통해 서비스에 필요한 분류체계들을 도출하고 다양한 서비스들을 여러 분류체계에 맞춰 구분함으로써 이용자는 원하는 서비스를 효율적으로 접근할 수 있는 장점이 있다. 이에 통합서비스에서의 분류체계는 중요한 서비스 요소 중의 하나이다. 본 연구결과는 대규모 통합서비스 구축시 필요한 분류체계 구축 절차에 활용될 수 있다.

AIS 데이터를 활용한 격자 기반 선박항로계획에 관한 연구

  • 이형탁;최혜민;한희정;윤석;이정석;김민규;조익순;양현
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.11a
    • /
    • pp.371-373
    • /
    • 2022
  • 현재 선박의 항로계획은 항해사들의 항해지식과 경험을 바탕으로 이루어지고 있다. 하지만 자율운항선박의 등장으로 항로계획의 자동화에 대한 연구가 학계와 산업계에 관심이 높다. 본 연구에서는 AIS 데이터를 활용하여 선박의 항로계획을 자동으로 생성하기 위해 격자기반의 최단경로 알고리즘을 활용하였다. 이는 자율운항선박의 항로계획 생성에 있어 안전성과 효율성을 향상시킬 수 있다.

  • PDF

Parallel Processing of BLAST Using Hadoop and Its Performance Evaluation (하둡을 이용한 BLAST의 병렬 처리 및 성능 분석)

  • Choi, Hoon;Um, Jungho;Yoon, Hwa-mook;Choi, Yun-Soo;Lee, Minho;Lee, Won-Goo;Song, Sa-Kwang;Jung, Hanmin
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.115-117
    • /
    • 2012
  • 차세대 시퀀싱 장비는 기존의 컴퓨팅 방법으로 처리할 수 없을 만큼 많은 양의 시퀀스 데이터를 생성하고 있다. 본 논문에서는 차세대 시퀀스 데이터의 정렬을 위해 널리 사용되고 있는 BLAST의 병렬 처리 방법을 하둡을 사용하여 제시하며, 이의 성능 개선 효과를 분석한다.

Development of Analysis Platform for Plant Sequence Assembly (식물 염기 서열 분석 플랫폼의 개발)

  • Choi, Hoon;Um, Jungho;Yoon, Hwa-mook;Choi, Yun-Soo;Lee, Minho;Lee, Won-Goo;Song, Sa-Kwang;Jung, Hanmin
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.1158-1161
    • /
    • 2012
  • 식물 염기 서열 분석은 동물에 비해 유전체가 길고 데이터 양이 많아 특별한 전략을 요구하고 있다. 본 논문은 FCLA 전략을 지원하기 위한 데이터 분석 플랫폼의 개발에 대해 서술한다.

Bigdata Prediction Support Service for Citizen Data Scientists (시민 데이터과학자를 위한 빅데이터 예측 지원 서비스)

  • Chang, Jae-Young
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.19 no.2
    • /
    • pp.151-159
    • /
    • 2019
  • As the era of big data, which is the foundation of the fourth industry, has come, most related industries are developing related solutions focusing on the technologies of data storage, statistical analysis and visualization. However, for the diffusion of bigdata technology, it is necessary to develop the prediction analysis technologies using artificial intelligence. But these advanced technologies are only possible by some experts now called data scientists. For big data-related industries to develop, a non-expert, called a citizen data scientist, should be able to easily access the big data analysis process at low cost because they have insight into their own data. In this paper, we propose a system for analyzing bigdata and building business models with the support of easy-to-use analysis system without knowledge of high-level data science. We also define the necessary components and environment for the prediction analysis system and present the overall service plan.

An Auto-Labeling based Smart Image Annotation System (자동-레이블링 기반 영상 학습데이터 제작 시스템)

  • Lee, Ryong;Jang, Rae-young;Park, Min-woo;Lee, Gunwoo;Choi, Myung-Seok
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.6
    • /
    • pp.701-715
    • /
    • 2021
  • The drastic advance of recent deep learning technologies is heavily dependent on training datasets which are essential to train models by themselves with less human efforts. In comparison with the work to design deep learning models, preparing datasets is a long haul; at the moment, in the domain of vision intelligent, datasets are still being made by handwork requiring a lot of time and efforts, where workers need to directly make labels on each image usually with GUI-based labeling tools. In this paper, we overview the current status of vision datasets focusing on what datasets are being shared and how they are prepared with various labeling tools. Particularly, in order to relieve the repetitive and tiring labeling work, we present an interactive smart image annotating system with which the annotation work can be transformed from the direct human-only manual labeling to a correction-after-checking by means of a support of automatic labeling. In an experiment, we show that automatic labeling can greatly improve the productivity of datasets especially reducing time and efforts to specify regions of objects found in images. Finally, we discuss critical issues that we faced in the experiment to our annotation system and describe future work to raise the productivity of image datasets creation for accelerating AI technology.

Automatic Object Extraction from Electronic Documents Using Deep Neural Network (심층 신경망을 활용한 전자문서 내 객체의 자동 추출 방법 연구)

  • Jang, Heejin;Chae, Yeonghun;Lee, Sangwon;Jo, Jinyong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.11
    • /
    • pp.411-418
    • /
    • 2018
  • With the proliferation of artificial intelligence technology, it is becoming important to obtain, store, and utilize scientific data in research and science sectors. A number of methods for extracting meaningful objects such as graphs and tables from research articles have been proposed to eventually obtain scientific data. Existing extraction methods using heuristic approaches are hardly applicable to electronic documents having heterogeneous manuscript formats because they are designed to work properly for some targeted manuscripts. This paper proposes a prototype of an object extraction system which exploits a recent deep-learning technology so as to overcome the inflexibility of the heuristic approaches. We implemented our trained model, based on the Faster R-CNN algorithm, using the Google TensorFlow Object Detection API and also composed an annotated data set from 100 research articles for training and evaluation. Finally, a performance evaluation shows that the proposed system outperforms a comparator adopting heuristic approaches by 5.2%.

A Study on XMDR-DAI Design for Business Intelligence (비즈니스 인텔리전스를 위한 XMDR-DAI 설계 관한 연구)

  • Moon, Seok-Jae;Shin, Hyo-Young;Jung, Gye-Dong;Choi, Young-Keun
    • Annual Conference of KIPS
    • /
    • 2009.11a
    • /
    • pp.153-154
    • /
    • 2009
  • 최근 기업은 저장된 데이터를 비즈니스 인텔리전스 기반으로 통합하고 분석한다. 이를 위해서 기업들은 ETL(Extraction, Transformation, Loading) 기술을 이용하여 다양한 소스로부터 데이터를 추출하여 변환한 후 데이터웨어하우스에 저장한다. 그러나 데이터웨어하우스/데이터 마트 기반 비즈니스 인텔리전스 프로젝트들은 기존의 사용하던 툴이 기능상의 한계를 드러내면서 시스템 통합, 마이그레이션, 동기화 등의 어려움이 있다. 특히, 서로 다른 ETL 툴을 사용하는 경우 메타데이터의 통합, 데이터 실시간 동기화 기술, 데이터 표준화, 데이터 매칭 등이 어려워 부분적으로만 지원되고 있는 실정이다. 본 논문에서는 다양한 데이터 통합 및 추출, 변환하여 데이터웨어하우스에 저장할 수 있는 XMDR-DAI를 제안한다.

Location-based UCI Sensor time series data analysis (위치 기반의 UCI Sensor 시계열 데이터 분석)

  • Chang, Il-Sik;Park, Goo-man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.7-8
    • /
    • 2021
  • 인공지능 기술과 서비스는 딥러닝을 중심으로 한 기계학습 기술의 급속한 발전에서 원인을 둔다. 딥러닝 발전 요인으로 GPU등 하드웨어 발전, 기술 공유, 대규모 학습데이터 구축 및 공개를 들 수 있다. 데이터 셋에 관련하여 센서를 이용한 데이터셋의 경우 단순히 많은 데이터셋의 확보뿐 아니라 적절한 위치 및 환경에 따른 고려가 필요하다. 본 논문에서는 UCI의 화학 가스의 데이터셋을 이용하여 위치별 시계열 데이터를 딥러닝을 이용하여 분석하고, 위치별 정확도와 손실을 계산한다. 또한 계산된 결과를 히트맵을 통하여 시각화하여 직관적인 이해를 높인다. 또한 위치별 정확도가 높은 상위 5개의 위치에서 앙상블 방법을 통한 성능의 향상을 확인 하였다.

  • PDF

Data Model Study for National Research Data Commons Service (국가연구데이터커먼즈 서비스를 위한 데이터모델 연구)

  • Cho, Minhee;Lee, Mikyoung;Song, Sa-kwang;Yim, Hyung-Jun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.436-438
    • /
    • 2022
  • National Research Data Commons aims to build a system that can be used jointly by arranging analysis resources such as computing infrastructure, software, toolkit, API, and services used for data analysis together with research data to maximize the use of research data. do. The sharing and utilization system for publications and research data in the R&D process is well known. However, the environment in which data and tightly coupled software and computing infrastructure can be shared and utilized is insignificant and there is no management system. In this study, a data model is designed to systematically manage information on digital research resources required in the data-oriented R&D research process. This will be used to register and manage digital research resource information in the National Research Data Commons Service.

  • PDF