• Title/Summary/Keyword: 과학기술 데이터

Search Result 2,575, Processing Time 0.041 seconds

Traffic Data Generation Technique for Improving Network Attack Detection Using Deep Learning (네트워크 공격 탐지 성능향상을 위한 딥러닝을 이용한 트래픽 데이터 생성 연구)

  • Lee, Wooho;Hahm, Jaegyoon;Jung, Hyun Mi;Jeong, Kimoon
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.11
    • /
    • pp.1-7
    • /
    • 2019
  • Recently, various approaches to detect network attacks using machine learning have been studied and are being applied to detect new attacks and to increase precision. However, the machine learning method is dependent on feature extraction and takes a long time and complexity. It also has limitation of performace due to learning data imbalance. In this study, we propose a method to solve the degradation of classification performance due to imbalance of learning data among the limit points of detection system. To do this, we generate data using Generative Adversarial Networks (GANs) and propose a classification method using Convolutional Neural Networks (CNNs). Through this approach, we can confirm that the accuracy is improved when applied to the NSL-KDD and UNSW-NB15 datasets.

A Proposal of Evaluation of Large Language Models Built Based on Research Data (연구데이터 관점에서 본 거대언어모델 품질 평가 기준 제언)

  • Na-eun Han;Sujeong Seo;Jung-ho Um
    • Journal of the Korean Society for information Management
    • /
    • v.40 no.3
    • /
    • pp.77-98
    • /
    • 2023
  • Large Language Models (LLMs) are becoming the major trend in the natural language processing field. These models were built based on research data, but information such as types, limitations, and risks of using research data are unknown. This research would present how to analyze and evaluate the LLMs that were built with research data: LLaMA or LLaMA base models such as Alpaca of Stanford, Vicuna of the large model systems organization, and ChatGPT from OpenAI from the perspective of research data. This quality evaluation focuses on the validity, functionality, and reliability of Data Quality Management (DQM). Furthermore, we adopted the Holistic Evaluation of Language Models (HELM) to understand its evaluation criteria and then discussed its limitations. This study presents quality evaluation criteria for LLMs using research data and future development directions.

Data Modeling Process to Ensure Semantic Interoperability of Data : An Application to EDM Machining (데이터의 의미적 상호운용성 확보를 위한 데이터 모델링 프로세스 : EDM 가공에의 적용)

  • Seo, Tae-Sul;Pham, D.T.
    • Journal of Information Management
    • /
    • v.38 no.1
    • /
    • pp.59-73
    • /
    • 2007
  • To construct machining databases, which are reusable and sharable their meanings, semantic metadata management is required. In this study a semantic data modeling process for machining data is developed. It combines conventional data models with ISO/IEC 11179 standard, metadata registry(MDR). Names of object classes and properties constituting data element names are identified using conventional data model while data elements are named and specified based on ISO/IEC 11179 in order to obtain semantic interoperability of data. An experimental application to electrical discharge machining(EDM) is performed to explain the process.

Comparison and Analysis of Science and Technology Journal Metadata (해외 과학기술 학술논문 메타데이터의 비교 분석)

  • Lee, Min-Ho;Lee, Won-Goo;Yoon, Hwa-Mook;Shin, Sung-Ho;Ryou, Jae-Cheol
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.9
    • /
    • pp.515-523
    • /
    • 2011
  • It is important to manage large amount of information from various information providers for supporting recent information services such as providing global research trends, detecting emerging signal and listing leading researchers. For integrated management, definition of integrated metadata schema, data transformation and schema matching are needed. It is first necessary to analyze existing various metadata for defining integrated metadata schema. In this paper, we have analyzed several metadata of scientific journal papers by classifying semantics, content rules and syntax, and looked around considerations to make integrated schema or transform metadata. We have known that XML is used as a syntax for supporting convenience and various usage condition, and hierarchy element names and common elements in semantics are needed. We also have looked at elements having various content rules and related standards. We hope that this study will be used as basic research material of metadata integrated management, data transform and schema matching for interoperability.

Satellite Land Cover Map Generation Using Deep Learning (딥러닝을 이용한 인공위성영상의 토지피복지도 생성기술)

  • Kim, Youngeun;Lee, Hyukzae;Park, Hyoungseob;Ryu, Kwangsun;Kim, Changick
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.240-242
    • /
    • 2019
  • 본 논문에서는 대한민국 국토에 대한 토지피복지도를 인공위성 영상으로부터 생성하는 기술을 제안한다. 제안하는 방법은 먼저 합성곱 신경망을 이용하여 인공위성 영상의 각 패치를 4 종류의 토지 용도로 분류한다. 이후 인공위성 영상과 토지 용도 분류 결과를 조건부 랜덤 필드에 적용하여 픽셀 단위로 색상과 질감이 유사한 영역을 같은 토지 용도로 분류될 수 있도록 하여 정확한 토지피복지도를 생성한다. 현재 대한민국 국토에 대한 토지피복지도 생성을 위해 구축된 데이터 세트가 없기 때문에 본 연구에서는 합성곱 신경망 학습을 위한 데이터 세트를 직접 구축하였다. 이를 위해 환경공간정보 서비스 웹사이트로부터 인공위성 영상을 취득하고, 각 영상을 패치 단위로 나누어 토지 용도를 직접 분류하였다. 실험 결과를 통해 제안하는 토지 용도 분류 합성곱 신경망의 성능을 평가하였으며, 최종 생성된 토지피복지도는 제안하는 방법이 효과적으로 토지 용도를 분류할 수 있음을 나타낸다.

  • PDF

Innovation Capability Index of Korea's Manufacturing Firms: An Empirical Study Using the Community Innovation Survey (CIS) Dataset

  • 신태영
    • Journal of Korea Technology Innovation Society
    • /
    • v.2 no.3
    • /
    • pp.48-60
    • /
    • 1999
  • 과학기술지표는 전통적으로 R&D 투입 데이터와 특허자료가 사용되었지만 본 연구에서는 이들의 단점을 극복할 대안으로 기업의 혁신활동 지표를 제시하고자 한다 먼저 한국의 CIS 데이터가 소개되고 계량분석을 이용한 방법론이 소개된다. 한편 이를 이용하여 산업별 혁신 능력지수를 제시한다

  • PDF

A Study in the Data Modeling for Archive System Applying RiC (RiC을 적용한 아카이브 시스템 데이터 모델링 연구)

  • Shin, Mira;Kim, Ikhan
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.19 no.1
    • /
    • pp.23-67
    • /
    • 2019
  • Records in Contexts (RiC) is an international archival description standard developed by integrating and normalizing four archival description standards of the International Council of Archives (ICA). RiC has the advantage of diversifying archival description, exposing the context of records, and ensuring data interoperability between disparate systems. In this study, RiC is set up as a key tool in the design of archive systems, and logical data modeling is performed to implement the database. Because of RiC's conceptual model, RiC-CM can be used as a data reference model, and which makes it possible to develop a data model that meets user requirements. Therefore, this study intends to implement these two data models: relational data model, which is widely used as the database on legacy systems, and graphical data model, which can flexibly extend objects around the relationship between information entities.

Researches on API Networking based Scientific Workflow Implementation (API 네트워킹 기반 과학분야 워크플로우 구현방안 연구)

  • Woojin seok;Kihyeon Kim;Jeonghoon Moon
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.274-275
    • /
    • 2023
  • 본 논문은 ICT 기술을 활용한 과학적 연구 적용사례를 분석하고, 데이터의 전송, 저장, 처리를 위한 ICT 기술의 적용모델을 소개하고자 한다. 과학을 다루는 많은 분야에서 플랫폼을 기반으로 분석SW들의 API 네트워킹을 통하여 분석모델들을 연계하여 결과치를 활용하는 방식으로 진화하고 있다. 이러한 API 네트워킹을 위한 ICT 기술들의 구축 모델을 분석하고자 한다.

A Unit-Based Volume Data Compression Scheme Using Daubechies D4 Wavelet Filter (Daubechies D4 웨이블릿 필터를 이용한 유닛(Unit) 기반 볼륨 데이터 압축 기법)

  • Hur, Young-Ju;Park, Sang-Hun
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.1201-1206
    • /
    • 2006
  • 데이터 압축 기술은 대용량의 데이터를 효율적으로 저장할 수 있게 해주는 기술로, 여러 분야에서 생성되는 데이터의 용량이 커지고 네트워크를 통한 데이터 전송에 대한 필요성이 증가함에 따라 그 중요도가 점점 더 커지고 있는 추세다. 특히 다양한 과학 분야에서 시뮬레이션의 결과로 산출되는 볼륨 데이터는 컴퓨팅 기술의 발전에 힘입어 점점 더 용량이 방대해지고 있는 추세이기 때문에 볼륨 데이터 압축에 대한 요구는 계속 커지고 있다. 본 논문에서는 Daubechies의 D4 기저함수를 이용한 웨이블릿 필터 변환과 zerobit 인코딩 기법을 응용한 유닛 기반의 볼륨 데이터 압축 기법을 제안한다. 유닛 기반 인코딩 기법은 복원 데이터의 손실율이 낮기 때문에 적은 웨이블릿 변환 계수로 화질이 좋은 이미지를 얻을 수 있다. 따라서 정밀한 영상을 요구하는 대용량 데이터의 압축 및 렌더링에 유용하게 사용할 수 있을 것이다.

  • PDF