• Title, Summary, Keyword: 데이터

Search Result 55,907, Processing Time 0.148 seconds

Data Publishing and Library (데이터 출판과 도서관)

  • Jung, Youngim
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • /
    • pp.101-101
    • /
    • 2017
  • 연구 성과물에 대한 접근성을 개선함으로써 다른 연구에도 도움을 주어 또 다른 과학적 발명과 발견에 기여할 수 있어야 한다는 오픈 사이언스의 철학이 전세계적으로 설득력을 얻으면서 연구 데이터 공개 및 출판을 위한 사회적 논의도 활발하게 이루어지고 있다. 또한, 지난 몇년 동안 글로벌 표준식별자 개발, 메타데이터 및 인용 방식의 표준화, 데이터 리포지토리 구축 등 연구 데이터 공개 및 출판을 위한 기술이 비약적으로 발전하고 있다. 전통적으로 학술지 논문의 부속 자료로 여겨지던 데이터(연구 데이터)는 이제 다양한 분야에서 논문과는 독립적으로 데이터 리포지토리에 기탁되어 공개되거나 데이터 저널에 출판되기도 한다. 그러나 학술 논문의 출판과는 달리 데이터 출판은 종종 다른 용어와 의미로 정의되기도 하며 분야마다 데이터 출판의 방식과 구현의 정도가 크게 다르다. 본 연구에서는 현재 진행 중인 데이터 공개 및 출판 이니셔티브를 소개하고 데이터의 공적 이용가능성, 문서화, 인용, 식별자 부여, 검증 및 데이터 출판의 단계별 구현 사례를 분석한다. 또한 국내에서 데이터 출판과 관련하여 수행 중인 과제를 검토한다. 마지막으로, 학술 정보 출판과 연구데이터 관리를 도서관의 기능으로 인식하고 출판과 관련한 다양한 관심사를 논의하는 도서관 중심 이니셔티브를 살펴봄으로써 데이터 출판과 관련한 도서관의 역할을 모색하고자 한다.

  • PDF

Enhanced Meta Process Implementation For Growing Data Warehouse (데이터웨어하우스 성장에 따른 개선된 메타프로세스 구현)

  • Lee, Dong-Won;Moon, Seung-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.7-9
    • /
    • 2000
  • 데이터 웨어하우스는 기업의 의사 결정 과정을 향상시킬 수 있게 하는 정보기술이다. 대표적인 정의로는 '기업의 의사결정 과정을 지원하기 위한 주제 중심적이고 통합적이며 시간성을 가지는 비휘발성 자료의 집합 '이다.[1] 즉, 기업들이 보유하고 있는 분산된 대량의 데이터를 추출, 변환, 통합하여 요약된 읽기 전용의 데이터베이스로 구축함으로써, 경영분석이나 기업내의 의사 결정 지원 자료로 주로 활용된다. 데이터 웨어하우스의 경우, 일반사용자는 웨어하우스내에 저장된 데이터를 직접 이용하는 경우가 대부분이다. 따라서, 데이터의 구조와 의미에 대한 일반 사용자의 이해가 필요하게 되었다. 즉, 데이터의 추출 및 정제규칙, 데이터의 통합규칙, 요약알고리즘, 데이터 처리스케쥴 등을 알아야만 한다. 메타데이터는 최소한의 데이터 구조, 데이터의 요약에 사용된 알고리즘, 운영 데이터베이스와 데이터 웨어하우스사이의 대응관계와 같은 정보를 포함하여야 한다.[3] 여기서 변환프로세스에 대한 정보를 데이터의 형식에 대한 정보와 일반적인 데이터들과 차별화하여 메타프로세스라 한다.[5] 메타프로세스는 데이터를 변환하여 데이터 웨어하우스에 적재하는 과정에서 생성되는 메타데이터의 일부로써 데이터 웨어하우스에 통합된 자료들이 어떤 변환과정을 거쳐 생성된 자료인지를 알려주는 변환프로세스에 관한 정보를 제공한다. 본 연구에서는 대부분의 데이터 웨어하우스에서 구현되고 있는 메타데이터들은 데이터 항목의 속성정보를 위주로 한 것이며, 변환 프로세스와 관련된 데이터 관리가 미약하다. 따라서, 데이터 웨어하우스의 메타데이터 중 메타프로세스 정보의 추출 및 관리 시스템을 제안하는 것이다.

  • PDF

Transmission system design for synchronized data service on digital data broadcasting environment (디지털 데이터 방송 환경에서 동기화 데이터 서비스를 위한 전송 시스템 설계)

  • Lee Yong Ju;Park Min Sik;Choi Ji Hoon;Choi Jin Soo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • /
    • pp.201-204
    • /
    • 2003
  • 본 논문에서는 디지털 데이터 방송에서 동기화 데이터 서비스를 제공하기 위한 전송 시스템과 이를 이용한 동기화 데이터 서비스 방법을 제안한다. 데이터 방송을 통해 전송되는 부가 데이터는 그 특징에 따라 비동기, 동기, 동기화 데이터로 구분된다. 이들 중 동기화 데이터는 사용자의 선택에 의해 데이터 방송 수신기에서 재생되는 비동기 데이터와는 달리 비디오 또는 오디오의 특정 장면에 통기되어 재생될 수 있는 데이터고서, 데이터를 전송하는 단계에서 데이터가 재생되어야 하는 시전의 시간 정보인 재생시각이 함께 전송되는 특징이 있다. 동기화 데이터의 이와 같은 특징으로 인해 현재 대부분의 데이터 방송에 사용되고 있는 비동기 데이터 서비스를 위한 전송 시스템은 동기화 데이터의 전송에는 부적합하며, 동기화 데이터 서비스를 위해서는 새로운 전송 시스템에 대한 연구가 필요하다. 본 논문에서는 데이터 방송을 동해 동기화 데이터 서비스를 제공하기 위해 기존의 비동기 데이터 전송 시스템에 MPEG-2 오디오/비디오 TS(Transport Stream)를 출력하는 장치와 동기화 데이터를 다중화 하는 장치를 추가한 새로운 동기화 데이터 전송 시스템과 이를 이용한 동기화 데이터 서비스 방법을 제안한다

  • PDF

Design of Metadata for Provenance Management of Genome Data (유전체 데이터의 유래(Provenance) 관리를 위한 메타데이터의 설계)

  • Song, Myoung-Seon;Chang, Jae-Woo;Um, Jung-Ho;Choi, Dong-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.1195-1198
    • /
    • 2011
  • 최근 의료 분야에 대한 관심이 높아짐에 따라 유전체 데이터를 수집하고 관리하여 분석하는 기술에 대한 많은 연구가 수행되고 있다. 유전체 데이터는 크게 유전체 데이터를 분석하는 전처리단계와 유전체 데이터로부터 변이된 유전체 데이터를 생성하는 후처리단계를 통해 분석된다. 이러한 분석 과정은 많은 시간이 소요되며, 후처리단계에서 결과 데이터는 분석 알고리즘 및 처리 기법에 따라 상이한 결과 데이터를 생성한다. 또한, 유전체 데이터의 각 파이프라인 별 분석된 데이터의 관리가 필요하다. 본 논문에서는 유전체 데이터의 특성을 고려하여, 유전체 데이터 유래 관리를 위한 메타데이터를 설계한다. 아울러 데이터 유래 메타데이터는 자신의 이전데이터들의 결과데이터에 신속한 접근이 가능해야하며, 자신과 유사한 데이터 유래를 지닌 파이프라인의 상세 정보를 신속하게 검색하는 색인구조가 필요하다. 따라서 이를 고려한 유래 메타데이터 검색 알고리즘을 설계한다.

  • PDF

A Comparative Study of Big Data, Open Data, and My Data (빅데이터, 오픈데이터, 마이데이터의 비교 연구)

  • Park, Jooseok
    • The Journal of Bigdata
    • /
    • v.3 no.1
    • /
    • pp.41-46
    • /
    • 2018
  • With the advent of the fourth industrial revolution, data becomes very important resource. Now is called as 'Data Revolution Age.' It is said that Data Revolution Age started with Big Data, then accelerated with Open Data, finally completed with My Data. In this paper, we compared Big Data, Open Data, and suggested roles and effects of My Data as a digital resource.

A Study on Building the Scientific Data Repository Involving Human Data and Its Application (인체 데이터를 포함한 과학 데이터 리파지터리의 구축 및 활용에 관한 연구)

  • Lee, Sang-ho;Lee, sang-hwan
    • Proceedings of the Korea Contents Association Conference
    • /
    • /
    • pp.170.1-170.1
    • /
    • 2012
  • 본 발표에서는 KISTI에서 현재 구축하고 있는 인체 데이터의 현황과 인체 데이터를 포함한 과학 데이터 리파지터리의 구축과 활용에 대한 전반적인 내용을 소개한다. 인체 데이터는 인체 절단면 영상을 중심으로 한 Visible Korean 데이터와 CT, MR 영상과 인체 뼈대 물성을 중심으로 한 Digital Korean 데이터로 나누어지며 이들 데이터의 제작 과정과 활용 내용을 주로 소개한다. 과학 데이터 리파지터리 구축 내용은 현재 국가의 연구개발 예산으로 수행되고 있는 연구과제에서 생성된 다양한 과학 데이터들을 국가적 차원에서 수집, 관리, 유통시키기 위해 기관별 또는 분야별로 과학데이터센터를 육성하고 이를 거점으로 하여 국내의 과학데이터가 수집, 관리, 유통, 활용될 수 있도록 국가적 과학데이터 관리체계를 구축한다. 또한 이렇게 수집된 과학데이터의 활용을 위해 연구자들이 데이터 기반의 연구 과제를 수행할 수 있도록 데이터 기반의 첨단 연구 환경을 구축하고 연구에 필요한 S/W, H/W 및 기타 필요한 IT 기반의 요소기술들을 개발, 지원한다. 또한 KISTI가 제작 주체가 되어 생산한 상기의 인체 데이터뿐만 아니라 의료 관련 분야의 연구 현장에서 생산되고 있는 다양한 인체 데이터를 수집, 관리, 공유할 수 있도록 인체 데이터 리파지터리를 구축하기 위해 Visible Korean, Digital Korean 데이터를 포함한 다양한 의료 데이터의 리파지토리를 설계하고 이러한 의료 데이터 기반 연구의 활성화 및 데이터 리파지터리의 활성화를 위한 정부 및 분야별 커뮤니티 차원의 다양한 대책들을 소개한다.

  • PDF

메타모델을 이용한 데이터전송시스템

  • Lee, Jin-U
    • Digital Contents
    • /
    • no.6
    • /
    • pp.68-73
    • /
    • 1999
  • 데이터 웨어하우스이 데이터 아키텍쳐가 결정되면 모델링 과정을 거쳐 DB를 생성한다. 그런데 데이터 웨어하우스 DB가 제 역할을 수행하기 위해서는 필요한 데이터가 축적되어 있어야 한다. 데이터 웨어하우스는 자체적으로 데이터를 생산하는 것이 아니고 이미 존재하는 데이터를 집대성하여 재구성하는데, 데이터 원천의 대부분은 업무용 시스템이며 일부 데이터를 활용한다.

  • PDF

A Study on Data Resource Management Comparing Big Data Environments with Traditional Environments (전통적 환경과 빅데이터 환경의 데이터 자원 관리 비교 연구)

  • Park, Jooseok;Kim, Inhyun
    • The Journal of Bigdata
    • /
    • v.1 no.2
    • /
    • pp.91-102
    • /
    • 2016
  • In traditional environments we have called the data life cycle DIKW, which represents data-information-knowledge-wisdom. In big data environments, on the other hand, we call it DIA, which represents data-insight-action. The difference between the two data life cycles results in new architecture of data resource management. In this paper, we study data resource management architecture for big data environments. Especially main components of the architecture are proposed in this paper.

  • PDF

Improving data quality through Data Owners management (데이터 오너 관리를 통한 데이터 품질 향상)

  • Park, Ji-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.278-281
    • /
    • 2007
  • 데이터 품질 기준은 반드시 현업의 입장에서 바라봐야 하며, 현업의 마인드가 데이터 품질에 가장 결정적인 영향을 미친다. 이에 따라 데이터 품질을 향상시키기 위해서는 현업이 데이터 품질 관리에 직접 참여할 수 있는 연구가 필요하다. 본 연구에서는 데이터 값(Data Value)에 대한 데이터 오너 (Owner)를 부여하여 데이터 품질 오류 시 현업이 직접 데이터 품질 관리 프로세스에 참여 할 수 있는 방안을 제시하였다. 데이터 품질 관리 프로세스는 데이터 품질 대상 및 기준을 정의하고 측정, 분석, 개선하는 방법이다. 본 연구에서 제시한 데이터 오너 관리 방안은 보다 효율적인 데이터 품질 관리 프로세스를 개선 시킬 수 있을 것이다.

  • PDF

빅데이터 이용 확산을 위한 ODI 기반 데이터 액세스 프레임워크

  • Kim, Hwa-Jong
    • Information and Communications Magazine
    • /
    • v.31 no.11
    • /
    • pp.67-71
    • /
    • 2014
  • 최근 사회 각 분야에서 빅데이터를 분석하여 새로운 가치를 찾아내려는 시도가 급속히 증가하고 있다. 그러나 빅데이터를 분석하여 소기의 성과를 얻으려면 한 기관이나 기업이 자체로 보유하고 있는 데이터 뿐 아니라 외부에 있는 가치 있는 데이터가 필수적으로 필요한 경우가 대부분이다. 현재 빅데이터 이용에서 가장 어려운 것은 대용량 데이터를 다루는 하드웨어나 분석 소프트웨어 도입이 아니라 핵심적으로 필요한 외부 빅데이터를 어떻게 확보할 것인가이다. 본 고에서는 빅데이터를 효과적으로 공유하고 활용하기 위한 방안으로 오픈 데이터 인터페이스(ODI)를 제안한다. ODI를 사용함으로써 프로그램이 직접 읽을 수 있는(machine readable) 데이터 공유가 확대되고, 데이터 매쉬업이 쉬워지며, 개인의 데이터 가공 능력을 거래할 수 있는 생태계 구현이 가능해질 것이다.