• Title/Summary/Keyword: 과학기술 데이터

Search Result 2,575, Processing Time 0.038 seconds

Resolving CTGAN-based data imbalance for commercialization of public technology (공공기술 사업화를 위한 CTGAN 기반 데이터 불균형 해소)

  • Hwang, Chul-Hyun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.26 no.1
    • /
    • pp.64-69
    • /
    • 2022
  • Commercialization of public technology is the transfer of government-led scientific and technological innovation and R&D results to the private sector, and is recognized as a key achievement driving economic growth. Therefore, in order to activate technology transfer, various machine learning methods are being studied to identify success factors or to match public technology with high commercialization potential and demanding companies. However, public technology commercialization data is in the form of a table and has a problem that machine learning performance is not high because it is in an imbalanced state with a large difference in success-failure ratio. In this paper, we present a method of utilizing CTGAN to resolve imbalances in public technology data in tabular form. In addition, to verify the effectiveness of the proposed method, a comparative experiment with SMOTE, a statistical approach, was performed using actual public technology commercialization data. In many experimental cases, it was confirmed that CTGAN reliably predicts public technology commercialization success cases.

Analysis of Components and Institutional Collaboration in the National Crisis Management Manual (국가 위기관리 매뉴얼의 구성 요소 및 기관 협업 분석)

  • You, Beon-Jong;Kim, Byungkyu;Shim, Hyoung-Seop
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.113-116
    • /
    • 2021
  • 우리나라는 최근 COVID-19 감염병 재난에 대한 체계적이고 성공적인 방역과 대응으로 국제적인 주목과 인정을 받고 있으며, 세계 10위 수준의 국가 경제 발전과 재난관리 중요성의 인식 향상에 따라 수준 높은 국가 재난관리 체계에 대한 국민적 관심과 요구가 높아지고 있다. 2004년 국가 위기관리 기본지침의 제정과 함께 국가 위기관리 표준 매뉴얼이 수립된 이래로 국가 위기관리 체계에서 위기관리 매뉴얼은 중추적인 역할을 담당하고 있다. 하지만 4차시대 혁명시대 ICT 기술 및 재난정보들이 융합된 재난 대응 환경에서 책자와 파일 위주의 정적 문서 포맷과 비구조적인 내용구성으로 주요정보 간 연계·활용성이 낮은 현재 매뉴얼 체계는 실제 재난상황에서 KEY 역할을 수행하기에는 여러 측면에서 한계가 뚜렷하다. 본 논문에서는 국가 위기관리 매뉴얼 체계 개선의 초석을 마련하는 단계로써 표준 매뉴얼에 대한 구성요소를 분석하고 기관 간 협업관계를 분석하였다.

  • PDF

Analysis of KSIC of Korea Patent Data in the Field of Disaster & Safety (재난안전분야 국내 특허문헌의 표준산업분류 분석)

  • You, Beom-Jong;Kim, Byungkyu;Shim, Hyoung-Seop
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.541-544
    • /
    • 2022
  • 재난안전분야 연구 및 기술개발을 위한 현황분석 및 동향파악을 위해 연구개발활동의 주요 성과물인 특허정보의 활용은 매우 중요하다. 본 논문에서는 재난안전분야 국내 특허문헌을 대상으로 산업분야별 현황 및 특성을 분석하였다. 분석연구를 위해 재난안전분야 키워드를 포함하고 표준산업분류 매핑이 가능한 국내 특허정보를 식별하여 데이터셋으로 사용하였다. 분석 결과, 표준산업분류 체계의 산업분야 레벨별 특허 분포 현황 및 출원기관 분포 현황과 산업분야별 핵심 키워드가 자세히 파악되었다. 연구결과는 국가 재난대응을 위한 지능형 위기경보 체계 등을 개발하기 위한 정보 자원으로 활용이 기대되며, 향후 논문, 보고서를 통합한 포괄적인 재난안전분야 문헌 분석 연구가 필요하다.

  • PDF

A Study on the Expansion of Meta-Tag for Research Data in Scholarly Service Type of OpenURL (연구데이터와 관련된 OpenURL의학술서비스 유형 메타태그의 확장에 대한 연구)

  • Kim, Sun-Tae;Lee, Tae-Young
    • Journal of Information Management
    • /
    • v.42 no.4
    • /
    • pp.39-58
    • /
    • 2011
  • This paper presents a meta-tag expanded from scholarly service types of OpenURL written in Key/Encoded-Value format, after analyzing new scholarly service types and DataCite metadata elements which are for research data publishing and services. So far, OpenURL Z39.88 standard, KEVFormat: Sch-Svc, supporting six scholarly service type only, the expansion of this standard is needed for a research data circulation. New eight scholarly service types were extracted, after analyzing and comparing with the Scopus, Web of Science, and NDSL services. And nine representative attributes were extracted, after analyzing intensively the DataCite's elements.

A Study on the Intellectual Structure of Data Science Using Co-Word Analysis (동시출현단어분석을 통한 데이터과학 분야의 지적구조에 관한 연구)

  • Kim, Hyunjung
    • Journal of the Korean Society for information Management
    • /
    • v.34 no.4
    • /
    • pp.101-126
    • /
    • 2017
  • Data Science is emerging as a closely related field of study to Library and Information Science (LIS), and as an interdisciplinary subject combining LIS, statistics and computer science in an attempt to understand the value of data by applying what LIS has been doing for collecting, storing, organizing, analyzing, and utilizing information. To investigate which subject fields other than LIS, statistics, and computer science are related to Data Science, this study retrieved 667 materials from Web of Science Core Collection, extracted terms representing Web of Science Categories, examined subject fields that are studying Data Science using descriptive analysis, analyzed the intellectual structure of the field by co-word analysis and network analysis, and visualized the results as a Pathfinder network with clustering created with the PNNC clustering algorithm. The result of this study might help to understand the intellectual structure of the Data Science field, and may be helpful to give an idea for developing relatively new curriculum.

Performance Comparison of Statistics-Based Machine Learning Model for Classification of Technical Documents (기술문서 분류를 위한 통계기반 기계학습 모델 성능비교 및 한계 연구)

  • Kim, Jin-gu;Yu, Heonchang
    • Annual Conference of KIPS
    • /
    • 2022.05a
    • /
    • pp.393-396
    • /
    • 2022
  • 본 연구는 국방과학기술 분야의 특허 및 논문 실적을 이용하여 통계기반 기계학습 모델 4 종을 학습하고, 실제 분석 대상기관의 데이터 입력결과를 분석하여 실용성에 대한 한계점 분석을 목적으로 한다. 기존 연구에서는 특허분류코드를 기준으로 분류하여 특수 목적으로 활용하거나 세부 연구 범위 내 연구 주제탐색 및 특징연구 등 미시적인 관점에서의 상세연구 활용 목적인 반면, 본 연구는 거시적인 관점에서 연구의 전체적인 흐름과 경향성 파악을 목적으로 한다. 이에 ICT 기술 138 종의 특허 및 논문 30,965 건과 국방과학기술 192 종의 특허 및 논문 23,406 건을 학습데이터로 각 모델을 학습하였다. 비교한 통계기반 학습모델은 Support Vector Machines, Decision Tree, Naive Bayes, XGBoost 모델이다. 학습데이터에 대한 학습검증 단계에서는 최대 99.4%의 성능을 보였다. 다만, 실제 분석대상기관의 특허 및 논문 12,824 건으로 입력분석한 결과, 모델별 편향성 문제, 데이터 전처리 이슈, 다중클래스 및 다중레이블 문제를 확인, 도출한 문제에 대한 해결방안을 제시하고 추가 연구의 방향성을 제시한다.

Design and Implementation of a 3D Game in Heterogeneous Networked Virtual Environment (이기종 네트워크 가상환경에서의 3D 게임 설계 및 구현)

  • Rhee, Seon-Min;You, Hyo-Sun;Kwak, Hye-Ryung;Kim, Myoung-Hee
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.877-880
    • /
    • 2004
  • 본 논문에서는 서로 다른 곳에 구축되어 있는 이기종 가상환경을 네트워크로 연동하고 이러한 환경에서 3D 게임을 지원하기 위한 시스템 설계 및 구현 결과를 제시한다. 각각의 가상환경은 수평-수직-정방형 디스플레이 장비 및 마그네틱-하이브리드 방식의 트랙킹 장비를 이용하여 구축되었다. 제안 시스템에서는 서로 다른 형태의 디스플레이, 트래킹 및 인터랙션 도구로 이루어진 개별 가상환경을 연동함으로써 발생하는 데이터 간의 이질성을 해결하기 위한 뷰 동기화, 인터랙션 동기화 기법 및 사용자 인식 모듈을 제공한다. 또한 별도의 컨트롤 서버를 구축하여 개별 노드간의 동기화를 제공하고 공유 데이터를 효과적으로 관리할 수 있도록 하였다. 개발된 환경 및 시스템에서 "Alice in Virtual World" 라는 1 인칭 슈팅 게임을 수행하여 그 활용 가능성을 입증하였다.

  • PDF

A study on how to generate GPU usage statistics for each task in a cluster system operated by shared node policy (공유노드 정책으로 운영 중인 클러스터 시스템에서 작업별 GPU 사용 통계 생성 방안에 대한 연구)

  • Kwon, Min-Woo;Yoon, JunWeon;Hong, TaeYoung
    • Annual Conference of KIPS
    • /
    • 2022.11a
    • /
    • pp.37-39
    • /
    • 2022
  • KISTI(한국과학기술정보연구원)는 슈퍼컴퓨터 5호기 메인시스템인 Nurion과 보조시스템인 Neuron을 연구자들에게 서비스하고 있다. Neuron은 메인시스템인 Nurion이 Intel Knights Landing 프로세서가 장착된 클러스터로 구성됨에 따라 인공지능, 빅데이터에 관한 연구 인프라 수요를 충족시키기 위해 GPU를 장착한 이기종 클러스터로 구성되어 있다. Neuron은 연구자들에게 효율적으로 계산 자원을 배분하기 위해 SLURM 작업배치스케줄러의 공유노드 정책을 이용하여 한 개의 계산노드에서 다수 개의 작업이 수행될 수 있는 환경으로 서비스되고 있다. 본 논문에서는 공유노드 정책으로 운영 중인 클러스터 시스템에서 작업별로 GPU 사용 통계 데이터를 생성하는 기법을 소개한다.

A Study on the Encoding Scheme Standard of Special Characters in Science & Technology Information (과학기술정보를 위한 특수문자 표기법 표준화에 관한 연구)

  • Lee, Soo-Sang
    • Journal of Information Management
    • /
    • v.36 no.3
    • /
    • pp.27-49
    • /
    • 2005
  • The encoding schemes of special characters in science & technology information services are always serious matters. Therefore, this paper draw up a general plan for encoding scheme of special characters related in some way. For this work, I have made an investigation into encoding cases of KISTI'S YesKisti service. And I have reviewed the important issues and standardization trends. Finally, this study proposes some requisites and problems for encoding scheme standard of special characters in science & technology information services.