• 제목/요약/키워드: Standard Dataset

검색결과 185건 처리시간 0.031초

기반시설 마스터데이터 표준요소 구축에 관한 연구 - 기반시설 표준데이터를 중심으로 - (A Study on the Establishment of Standard Elements of Infrastructure Master Data: Focused on Infrastructure Standard Dataset)

  • 손혜인;남영준
    • 한국비블리아학회지
    • /
    • 제28권4호
    • /
    • pp.35-55
    • /
    • 2017
  • 마스터데이터는 기관 내부의 광범위한 이용을 목적으로 구축되며, 주로 기업에서 많이 활용되고 있는 분야이다. 이 연구는 국가의 공공기관에서 활용할 수 있는 기반시설에 관한 마스터데이터 구축을 목적으로 연구를 진행하였다. 이를 위해 공공데이터포털에서 제공하는 표준데이터세트에 기반을 두고 해당 데이터세트의 개별 속성을 분석하였다. 이 중 마스터데이터의 특성에 맞는 표준요소를 추출하였고, 최종적으로 종합한 표준요소를 국가에서 활용하고 있는 표준화 체계를 통하여 검증하였다.

랜드마크 이미지 AI 학습용 데이터 구축을 위한 메타데이터 표준 설계 방안 연구 (A Study on Designing Metadata Standard for Building AI Training Dataset of Landmark Images)

  • 김진묵
    • 한국문헌정보학회지
    • /
    • 제54권2호
    • /
    • pp.419-434
    • /
    • 2020
  • 본 연구의 목적은 랜드마크 이미지의 AI 학습용 데이터 구축을 위한 메타데이터 표준 설계 방안을 제시하기 위함이다. 이를 위해, 이미지 검색시스템의 종류와 각각의 색인 방식에 관한 최신 기술 현황을 포괄적으로 조사하여 분석하고, AI 머신러닝을 적용한 랜드마크 인식에 필수적인 학습용 공개 데이터셋과 이미지 객체 인식에 관한 기계학습 도구를 조사하였다. 이를 통해, 랜드마크 이미지 AI 학습용 데이터에 최적화된 메타데이터 요소를 선정하고 각각의 요소에 대한 입력 데이터를 정의하였다. 결론 및 제언에서는 랜드마크 인식을 활용한 추천시스템을 포함한 응용서비스 개발 방안을 논의하였다.

공공기관 데이터세트 식별과 평가 절차 연구 국가철도공단 전자조달시스템 사례를 중심으로 (Study on Public Institution Dataset Identification and Evaluation Process : Focusing on the Case of KR Electronic Procurement System)

  • 황진현;백영미;임진희
    • 기록학연구
    • /
    • 제70호
    • /
    • pp.41-83
    • /
    • 2021
  • 공공기록물법 시행령 개정 이후 기록관에서는 데이터세트 기록 관리를 위한 관리기준표를 작성하고 이에 대한 관리와 통제를 수행하게 되었다. 이에 본 연구에서는 기록관의 체계적 데이터세트 기록 관리를 위한 데이터세트 기록 식별 절차와 평가 지표를 개발하였다. 이를 적용하여 국가철도공단의 KR전자조달시스템의 8개 데이터세트 기록 식별 후 관리기준표를 작성하였고, 평가지표에 따라 평가를 진행, 보존기간과 이관 및 수집 여부를 책정하였다. 데이터세트 기록의 관리 절차에 대한 구체적 사례가 부족한 시점에, 이 사례연구가 기록관에 실무적 도움이 되기를 바란다.

DCAT을 활용한 디지털도서관 데이터셋 관리와 서비스 설계 (Designing Dataset Management and Service System for Digital Libraries Using DCAT)

  • 박진호
    • 한국문헌정보학회지
    • /
    • 제53권2호
    • /
    • pp.247-266
    • /
    • 2019
  • 본 연구는 새로운 지식정보자원으로 중요성이 높아지고 있는 데이터셋을 관리 서비스하기 위해 W3C 표준인 DCAT 활용방안을 제시하고자 하였다. 이를 위해 먼저 DCAT을 구성하는 8개의 클래스 중 핵심 클래스 4가지를 중심으로 클래스와 속성을 분석하였다. 또한 디지털도서관에서 DCAT을 기반으로 다양한 데이터셋을 관리 서비스할 수 있는 시스템을 모델링하여 제시하였다. 이 시스템은 원천데이터, 데이터셋 관리, 링크드 데이터 연결, 이용자 서비스로 구분하여 구성하였으며 특히 데이터셋관리에서는 DCAT 매핑 기능을 제시하여 다양한 데이터셋 서비스와 상호운용성 확보가 가능하도록 하였다.

입자 군집 최적화 알고리즘 기반 다항식 신경회로망의 설계 (Design of Particle Swarm Optimization-based Polynomial Neural Networks)

  • 박호성;김기상;오성권
    • 전기학회논문지
    • /
    • 제60권2호
    • /
    • pp.398-406
    • /
    • 2011
  • In this paper, we introduce a new architecture of PSO-based Polynomial Neural Networks (PNN) and discuss its comprehensive design methodology. The conventional PNN is based on a extended Group Method of Data Handling (GMDH) method, and utilized the polynomial order (viz. linear, quadratic, and modified quadratic) as well as the number of node inputs fixed (selected in advance by designer) at Polynomial Neurons located in each layer through a growth process of the network. Moreover it does not guarantee that the conventional PNN generated through learning results in the optimal network architecture. The PSO-based PNN results in a structurally optimized structure and comes with a higher level of flexibility that the one encountered in the conventional PNN. The PSO-based design procedure being applied at each layer of PNN leads to the selection of preferred PNs with specific local characteristics (such as the number of input variables, input variables, and the order of the polynomial) available within the PNN. In the sequel, two general optimization mechanisms of the PSO-based PNN are explored: the structural optimization is realized via PSO whereas in case of the parametric optimization we proceed with a standard least square method-based learning. To evaluate the performance of the PSO-based PNN, the model is experimented with using Gas furnace process data, and pH neutralization process data. For the characteristic analysis of the given entire data with non-linearity and the construction of efficient model, the given entire system data is partitioned into two type such as Division I(Training dataset and Testing dataset) and Division II(Training dataset, Validation dataset, and Testing dataset). A comparative analysis shows that the proposed PSO-based PNN is model with higher accuracy as well as more superb predictive capability than other intelligent models presented previously.

폐교 사립대학 행정정보 데이터세트의 기록관리 방안 연구 (A Study on Managing Dataset in the Administration Information System of Closed Private Universities)

  • 이재영;정연경
    • 한국기록관리학회지
    • /
    • 제21권1호
    • /
    • pp.75-95
    • /
    • 2021
  • 오늘날 대학의 신입생 충원율이 급감하면서 대학의 폐교가 새로운 문제로 등장함에 따라 폐교대학의 기록물 관리가 새로운 이슈로 다뤄지고 있다. 최근 사립학교법이 개정되면서 폐교 기록물 관리를 위한 기본적인 법적 토대가 마련되었지만, 전자기록 중 행정정보 데이터세트에 관한 사항은 반영되지 못한 상태이다. 또한 공공기록물법의 개정에 따라 폐교대학의 행정정보 데이터세트도 공공기록물로서 관리되어야 하나 현재 폐교대학의 기록물 관리는 비전자기록물의 이관이나 정리에 관한 이슈가 주를 이룬다. 본 연구는 이러한 현실을 지적하며 폐교대학 행정정보 데이터세트를 공공기록물로서 관리하기 위한 방안을 도출하는 것에 중점을 두었다. 기본적으로 각종 참고문헌 및 기관의 내부자료를 바탕으로 데이터세트에 관한 이론적 논의를 검토하고 폐교대학 데이터세트 관리현황을 파악하였다. 최종적으로는 폐교대학 통합정보관리시스템의 데이터 관리를 위한 방안으로 기록화 대상 선정, 보존기간 책정, 행정정보 데이터세트 관리기준표 작성, 행정정보 데이터 세트 평가·삭제, 폐교대학 행정정보 데이터세트 종합관리체계 구축 등을 제시하였다.

WebSHArk 1.0: A Benchmark Collection for Malicious Web Shell Detection

  • Kim, Jinsuk;Yoo, Dong-Hoon;Jang, Heejin;Jeong, Kimoon
    • Journal of Information Processing Systems
    • /
    • 제11권2호
    • /
    • pp.229-238
    • /
    • 2015
  • Web shells are programs that are written for a specific purpose in Web scripting languages, such as PHP, ASP, ASP.NET, JSP, PERL-CGI, etc. Web shells provide a means to communicate with the server's operating system via the interpreter of the web scripting languages. Hence, web shells can execute OS specific commands over HTTP. Usually, web attacks by malicious users are made by uploading one of these web shells to compromise the target web servers. Though there have been several approaches to detect such malicious web shells, no standard dataset has been built to compare various web shell detection techniques. In this paper, we present a collection of web shell files, WebSHArk 1.0, as a standard dataset for current and future studies in malicious web shell detection. To provide baseline results for future studies and for the improvement of current tools, we also present some benchmark results by scanning the WebSHArk dataset directory with three web shell scanning tools that are publicly available on the Internet. The WebSHArk 1.0 dataset is only available upon request via email to one of the authors, due to security and legal issues.

공공기관 행정정보시스템 관련 단위과제 및 보존기간 책정 현황분석 (Current Status Analysis of Business Units and Retention Period Estimation related to Administrative Information Systems of Public Institutions)

  • 윤성호;유신성;최기쁨;오효정
    • 한국비블리아학회지
    • /
    • 제31권2호
    • /
    • pp.139-160
    • /
    • 2020
  • 『공공기록물 관리에 관한 법률』이 제정된 2007년부터 이미 행정정보시스템이 전자기록생산시스템에 포함되었으며, 행정정보 데이터세트는 전자기록물의 한 유형으로 관리 대상임이 명시되었다. 특히 최근 시행령의 개정으로 행정정보 데이터세트 관리기준표를 기반으로 한 기록관리가 법제화된 상황 속에서, 본 연구는 공공기관의 행정정보시스템과 관련된 단위과제를 분석하고 유형별 보존기간 책정 현황을 파악하였다. 이를 위해 국가기록원의 직접관리기관과 재난관리 책임기관 49개 기관으로부터 36개 공공기관의 기록물 분류체계를 수집하여 행정정보시스템과 관련된 단위과제를 판별하였다. 선별된 824개 단위과제를 유형에 따라 대·소분류로 구분하고 보존기간을 비교, 분석하였다. 본 연구를 통해 도출된 문제점과 개선방안이 향후 행정정보 데이터세트 관리기준표를 작성하기 위한 기초자료로 활용되길 기대한다.

Action Recognition with deep network features and dimension reduction

  • Li, Lijun;Dai, Shuling
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.832-854
    • /
    • 2019
  • Action recognition has been studied in computer vision field for years. We present an effective approach to recognize actions using a dimension reduction method, which is applied as a crucial step to reduce the dimensionality of feature descriptors after extracting features. We propose to use sparse matrix and randomized kd-tree to modify it and then propose modified Local Fisher Discriminant Analysis (mLFDA) method which greatly reduces the required memory and accelerate the standard Local Fisher Discriminant Analysis. For feature encoding, we propose a useful encoding method called mix encoding which combines Fisher vector encoding and locality-constrained linear coding to get the final video representations. In order to add more meaningful features to the process of action recognition, the convolutional neural network is utilized and combined with mix encoding to produce the deep network feature. Experimental results show that our algorithm is a competitive method on KTH dataset, HMDB51 dataset and UCF101 dataset when combining all these methods.

Scaling Up Face Masks Classification Using a Deep Neural Network and Classical Method Inspired Hybrid Technique

  • Kumar, Akhil;Kalia, Arvind;Verma, Kinshuk;Sharma, Akashdeep;Kaushal, Manisha;Kalia, Aayushi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권11호
    • /
    • pp.3658-3679
    • /
    • 2022
  • Classification of persons wearing and not wearing face masks in images has emerged as a new computer vision problem during the COVID-19 pandemic. In order to address this problem and scale up the research in this domain, in this paper a hybrid technique by employing ResNet-101 and multi-layer perceptron (MLP) classifier has been proposed. The proposed technique is tested and validated on a self-created face masks classification dataset and a standard dataset. On self-created dataset, the proposed technique achieved a classification accuracy of 97.3%. To embrace the proposed technique, six other state-of-the-art CNN feature extractors with six other classical machine learning classifiers have been tested and compared with the proposed technique. The proposed technique achieved better classification accuracy and 1-6% higher precision, recall, and F1 score as compared to other tested deep feature extractors and machine learning classifiers.