• 제목/요약/키워드: data science

검색결과 56,444건 처리시간 0.053초

Data Framework Design of EDISON 2.0 Digital Platform for Convergence Research

  • Sunggeun Han;Jaegwang Lee;Inho Jeon;Jeongcheol Lee;Hoon Choi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권8호
    • /
    • pp.2292-2313
    • /
    • 2023
  • With improving computing performance, various digital platforms are being developed to enable easily utilization of high-performance computing environments. EDISON 1.0 is an online simulation platform widely used in computational science and engineering education. As the research paradigm changes, the demand for developing the EDISON 1.0 platform centered on simulation into the EDISON 2.0 platform centered on data and artificial intelligence is growing. Herein, a data framework, a core module for data-centric research on EDISON 2.0 digital platform, is proposed. The proposed data framework provides the following three functions. First, it provides a data repository suitable for the data lifecycle to increase research reproducibility. Second, it provides a new data model that can integrate, manage, search, and utilize heterogeneous data to support a data-driven interdisciplinary convergence research environment. Finally, it provides an exploratory data analysis (EDA) service and data enrichment using an AI model, both developed to strengthen data reliability and maximize the efficiency and effectiveness of research endeavors. Using the EDISON 2.0 data framework, researchers can conduct interdisciplinary convergence research using heterogeneous data and easily perform data pre-processing through the web-based UI. Further, it presents the opportunity to leverage the derived data obtained through AI technology to gain insights and create new research topics.

미국 정보 대학의 데이터사이언스 학위 현황 연구 (Degree Programs in Data Science at the School of Information in the States)

  • 박형주
    • 한국도서관정보학회지
    • /
    • 제53권2호
    • /
    • pp.305-332
    • /
    • 2022
  • 본 연구의 목적은 문헌정보학 프로그램이 있는 정보 대학에서 수여하는 데이터사이언스 학위의 현황을 알아보는 것이다. 데이터 수집의 대상은, 2022년 미국도서관협회의 인가를 받은 문헌정보학 프로그램이 있는 64개의 대학에서 수여하는 데이터사이언스 학위였다. 분석의 대상은 각 대학의 데이터사이언스 학위 과정, 부전공, 세부 전공, 수료증, 취업 후 예상 진로, 취업률 등이었다. 교과 분석을 위해 미국 정보 대학에서 제시한 교과목 명, 교과 설명, 중점 교육 분야를 분석했다. 데이터사이언스를 학위 명으로 개설한 대학은 총 8개 정보 대학의 12개 학위였으며, 학사 학위 5개, 석사 학위 6개, 박사 학위 1개였다. 개설된 교과의 주제는 데이터사이언스 입문, 정보검색, 데이터마이닝, 데이터베이스, 데이터와 인문학, 머신 러닝, 메타데이터, 연구 방법론, 데이터 분석 및 시각화, 실습/캡스톤, 윤리 및 보안, 이용자, 정책, 큐레이션 및 관리였다. 대부분의 대학은 전통적인 문헌정보학 교과를 개설하지 않고 있었다. 정보 대학이 제시한 졸업 후 예상 취업 진로는 데이터사이언티스트, 데이터 엔지니어, 데이터 분석가 등이었다. 본 연구의 결과는 정보학의 관점에서 데이터사이언스 학위 과정, 세부 전공, 수료증 또는 교과과정 개발 및 개정을 위한 논의에 활용될 수 있는 기초 자료로 활용되기를 기대한다.

Comparison of Various Criteria for Designing ECOC

  • Seok, Kyeong-Ha;Lee, Seung-Chul;Jeon, Gab-Dong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.437-447
    • /
    • 2006
  • Error Correcting Output Coding(ECOC) is used to solve multi-class problem. It is known that it improves the classification accuracy. In this paper, we compared various criteria to design code matrix while encoding. In addition. we prorpose an ensemble which uses the ability of each classifier while decoding. We investigate the justification of the proposed method through real data and synthetic data.

  • PDF

한국 우주관측 자료 전략 수립 제안 (Proposals for Korean Space Observation Data Strategies)

  • 백지혜;최성환;박종엽;김수진;심채경;양태용;정민섭;조영수;최영준
    • 우주기술과 응용
    • /
    • 제1권2호
    • /
    • pp.241-255
    • /
    • 2021
  • 우주관측 자료는 우주 임무를 통해 관측한 별, 은하, 태양, 우주 플라즈마(plasma), 달, 행성 등의 연구 자료로 관측 자료를 가공 및 활용한 것까지 포함한다. 국내외 천문우주 관측시스템이 대형화되고, 우주 임무의 확대 및 자료 용량 증가(빅 데이터)로 인해 우주관측 자료의 체계적이고 효율적인 관리에 대한 필요성이 증대되고 있다. 이에 우리나라도 우주관측 자료의 전략을 세우고, 이를 바탕으로 우주관측 자료 정책을 수립해야 한다. 이를 위한 준비 단계로 우주관측 자료에 대한 광범위한 이해와 다년간의 경험으로부터 발전된 미 항공우주국(National Aeronautics and Space Administration, NASA)의 자료 전략을 분석하였다. NASA의 자료 전략 분석 결과를 바탕으로 우리나라의 우주관측 자료 전략 방향과 앞으로 우주관측 자료 정책을 수립하는 데 기반이 될 우주관측 자료 전략 권고 사항 10가지를 제안한다.

Verification Control Algorithm of Data Integrity Verification in Remote Data sharing

  • Xu, Guangwei;Li, Shan;Lai, Miaolin;Gan, Yanglan;Feng, Xiangyang;Huang, Qiubo;Li, Li;Li, Wei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.565-586
    • /
    • 2022
  • Cloud storage's elastic expansibility not only provides flexible services for data owners to store their data remotely, but also reduces storage operation and management costs of their data sharing. The data outsourced remotely in the storage space of cloud service provider also brings data security concerns about data integrity. Data integrity verification has become an important technology for detecting the integrity of remote shared data. However, users without data access rights to verify the data integrity will cause unnecessary overhead to data owner and cloud service provider. Especially malicious users who constantly launch data integrity verification will greatly waste service resources. Since data owner is a consumer purchasing cloud services, he needs to bear both the cost of data storage and that of data verification. This paper proposes a verification control algorithm in data integrity verification for remotely outsourced data. It designs an attribute-based encryption verification control algorithm for multiple verifiers. Moreover, data owner and cloud service provider construct a common access structure together and generate a verification sentinel to verify the authority of verifiers according to the access structure. Finally, since cloud service provider cannot know the access structure and the sentry generation operation, it can only authenticate verifiers with satisfying access policy to verify the data integrity for the corresponding outsourced data. Theoretical analysis and experimental results show that the proposed algorithm achieves fine-grained access control to multiple verifiers for the data integrity verification.

An Open Science 'State of the Art' for Hong Kong: Making Open Research Data Available to Support Hong Kong Innovation Policy

  • Sharif, Naubahar;Ritter, Waltraut;Davidson, Robert L;Edmunds, Scott C
    • Journal of Contemporary Eastern Asia
    • /
    • 제17권2호
    • /
    • pp.200-221
    • /
    • 2018
  • Open Science is an umbrella term that involves various movements aiming to remove the barriers to sharing any kind of output, resources, methods or tools at any stage of the research process. While the study of open science is relatively advanced in Western countries, we know of no scholarship that attempts to understand open science in Hong Kong. This paper provides a broad-based background on the major research data management organisations, policies and institutions with the intention of laying a foundation for more rigorous future research that quantifies the benefits of open access and open data policies. We explore the status and prospects for open science (open access and open data) in the context of Hong Kong and how open science can contribute to innovation in Hong Kong. Surveying Hong Kong's policies and players, we identify both lost research potential and provide positive examples of Hong Kong's contribution to scientific research. Finally, we offer suggestions regarding what changes can be made to address the gaps we identify.

RVDB와 대용량 서버 간의 직접 데이터 전송 알고리즘 개발과 시험에 관한 연구 (DEVELOPMENT AND TESTS OF THE ALGORITHM FOR DIRECT DATA TRANSMISSION BETWEEN RVDB AND HUGE CAPACITY DATA SERVER)

  • 노덕규;오세진;염재환;정동규;오충식;윤영주;김효령
    • 천문학논총
    • /
    • 제29권3호
    • /
    • pp.45-52
    • /
    • 2014
  • This paper describes the development of algorithm for direct data transmission between Raw VLBI Data Buffer (RVDB) and Huge Capacity Data Server (HCDS) operated in Korea-Japan Correlation Center (KJCC). The transmitted data is the VLBI observation data, which is recorded at each radio telescope site, and the data transmitting rate is varying from 1 Gbps, in usual case, upto 8 Gbps. The developed algorithm for data transmission enables the direct data transmission between RVDB and HCDS through 10 Gbps optical network using VLBI Data Interchange Format (VDIF). Proposed method adopts the conventional UDP/IP protocol, but in order to prevent the loss of data during data transmission, the packet error monitoring and data re-transmission functions are newly designed. The VDIF specification and VDIFCP (VDIF Control Protocol) are used for the direct data transmission between RVDB and HCDS. To validate the developed algorithm for data transmission, we conducted the data transmission from RVDB to HCDS, and compared to the transmitted data with the original data bit by bit. We confirmed that the transmitted data is identical to the original data without any loss and it has been recovered well even if there were some packet losses.

국내 데이터사이언스 학위 및 교과 운영 현황과 문헌정보학과로의 함의 (Data Science Degree and Curriculum in Korea and its Implications for the Information Field)

  • 박형주;이희진
    • 한국도서관정보학회지
    • /
    • 제53권3호
    • /
    • pp.431-454
    • /
    • 2022
  • 본 연구의 목적은 국내 대학에서 수여하는 데이터사이언스 학위 및 교과 운영 현황과 국내외 정보대학의 데이터사이언스 교과 운영 현황을 이해함으로써, 국내 문헌정보학과의 데이터사이언스 교과 운영에 대한 함의를 살펴보는 것이다. 데이터 수집의 대상은 2022년 한국교육개발원에서 공개한 국내 439개 학교의 데이터사이언스 학위였다. 분석의 대상은 데이터사이언스 학위를 운영하는 국내의 대학교, 단과대학, 학부, 학과, 세부 전공, 연계전공, 융합전공, 마이크로 학위, 나노 학위, 트랙, 모듈, 산학협동 과정 등이었다. 교과 분석을 위해서 국내 데이터사이언스 학위 과정에 개설된 1,148개의 교과 명을 분석했다. 국내 문헌정보학과 학사 과정의 1,325개의 교과 명을 분석해서 국내 문헌정보학과의 데이터사이언스 교과 운영 현황을 확인했다. 국내의 데이터사이언스 학위는 개론, 기술, 실습, 응용, 심화 교과 등 데이터사이언스 교과를 골고루 개설하고 있었다. 국내 문헌정보학과는 데이터사이언스와 관련된 교과 개설에 적극적이지 않았으나, 개설한 경우에는 데이터사이언스 개론, 데이터베이스, 데이터시각화, 데이터큐레이션, 메타데이터, 빅데이터, 정보 기술 교과가 개설되어 있었다. 본 연구의 결과는 문헌정보학의 관점에서 데이터사이언스 학위 과정, 세부 전공, 연계전공, 융합전공, 마이크로 학위, 나노 학위, 연계 트랙, 모듈, 산학협동과정 등의 교과의 개발 및 개정에 필요한 논의의 기초 자료로 활용되기를 기대한다.

엔트리를 활용한 초등 데이터 과학 교육 사례 연구 (A Study on Elementary Education Examples for Data Science using Entry)

  • 허경
    • 정보교육학회논문지
    • /
    • 제24권5호
    • /
    • pp.473-481
    • /
    • 2020
  • 데이터과학은 스몰데이터 분석에서 출발하여, 빅데이터 분석을 위한 머신러닝, 딥러닝까지 포함하고 있다. 데이터과학은 인공지능 기술의 핵심 영역이고, 학교 교육과정에 체계적으로 반영해야 할 내용이다. 데이터과학 교육을 위해, 엔트리에서도 초등교육용 데이터 분석 도구를 제공하고 있다. 빅데이터 분석에서는 데이터 표본을 추출하여, 통계학적인 추측과 판단을 통해 분석결과를 해석한다. 본 논문에서는 통계학적인 지식을 필요로 하는 빅데이터 분석 영역을 초등영역에서 제외하기로 하고, 초등영역에 초점을 맞춘 데이터과학 교육 사례를 제안하였다. 이를 위해서, 일반적인 데이터과학 교육 단계를 먼저 설명하고, 초등 데이터과학 교육 단계를 새롭게 제안하였다. 그리고 엔트리에서 제공하는 공공 스몰 데이터를 사용한 데이터 변수 값 비교 사례와 데이터 변수 간 상관관계 분석 사례를 초등 데이터과학 교육 단계에 따라 제안하였다. 본 논문에서 제안된 엔트리 데이터분석 사례들을 활용하면, 여러 교과에서 발생하는 데이터를 사용한 초등 데이터과학 융합 교육이 가능하다. 또한, 엔트리를 사용하여 텍스트, 음성 및 영상인식 AI 도구와 결합한 데이터과학 교육 자료도 개발 가능하다.

데이터 기술: 지식창조를 위한 새로운 융합과학기술 (Data Technology: New Interdisciplinary Science & Technology)

  • 박성현
    • 품질경영학회지
    • /
    • 제38권3호
    • /
    • pp.294-312
    • /
    • 2010
  • Data Technology (DT) is a new technology which deals with data collection, data analysis, information generation from data, knowledge generation from modelling and future prediction. DT is a newly emerged interdisciplinary science & technology in this 21st century knowledge society. Even though the main body of DT is applied statistics, it also contains management information system (MIS), quality management, process system analysis and so on. Therefore, it is an interdisciplinary science and technology of statistics, management science, industrial engineering, computer science and social science. In this paper, first of all, the definition of DT is given, and then the effects and the basic properties of DT, the differences between IT and DT, the 6 step process for DT application, and a DT example are provided. Finally, the relationship among DT, e-Statistics and Data Mining is explained, and the direction of DT development is proposed.