• 제목/요약/키워드: 데이터 레포지토리

검색결과 7건 처리시간 0.035초

WoS DCI : 더욱 다양한 정보를 체계적으로! (WoS DCI : Systematically obtain more diverse information)

  • 강윤희
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2017년도 제24회 학술대회 논문집
    • /
    • pp.102-102
    • /
    • 2017
  • 디지털 정보의 폭발적인 증가세와 함께 연구 데이타 또한 다양한 형태로 축적 되고 있다. 이에 다양한 정보들을 효율적으로 활용하는 것이 연구 혁신의 동력원으로 작용하고 어떠한 데이터를 어떻게 효율적으로 활용할 것인가가 정보 사회의 화두로 떠오르고 있다. 특히, 데이타 정보의 경우 전세계 약 900개 이상의 레파지토리들이 다양한 구조와 플랫폼을 토대로 축적 되고 있어 이에 대한 엄선 된 데이터 레파지토리 정보를 WoS의 단일 플랫폼에서 손쉽게 취득 할 수 있는 DCI(Data Citation Index)에 대한 관심이 증가되고 있는 추세이다. 현재 DCI에는 330여 종의 레포지토리에 수록 된 650만개 이상의 레코드를 수록 중이며 매년 50만 건 이상의 레코드가 추가 되고 있다. DCI는 레포지토리의 메타데이터를 분석하고 WoS에서 보유하고 있는 정보와 취합하여 데이터를 재구성하고 구조화하여 위계 질서를 부여하고 각 레코드가 소스 레포지토리로 연결되도록 링크를 제공하여 데이터 열람 및 다운로드가 가능하도록 하며 WoS내에 관련 논문(SCIE급)이 있는 경우 논문 과 데이터 상호 간의 링크도 제공한다. 보다 체계적인 데이터 관리를 위한 정보의 구조화와 보다 전문적인 정보 검색을 위한 Taxonomic Data와 시소러스(Thesaurus) 정보를 통한 DCI의 활용을 통해 새로운 정보의 세계를 경험해 보자.

  • PDF

클라우드 기반의 비즈니스 생명주기를 고려한 서비스 레포지토리 설계 및 프로토타입 구축 (Design & Prototype of a Service Repository Considering Business Lifecycle based on Cloud)

  • 박승균;윤찬현;석태경;김경환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1743-1745
    • /
    • 2010
  • 클라우드 컴퓨팅 환경을 기반으로 하는 비즈니스 생명주기는 직접적인 어플리케이션이나 서비스의 구현을 포함해서, 기획, H/W나 S/W 프로비저닝, 운용 및 관리, 평가와 같은 과정을 요구한다. 이 모든 과정은 다양한 형태의 비즈니스 자산들을 필요로 하면서, 또 다른 새로운 자산들을 만들어낸다. 반복되는 비즈니스 생명주기에서 생성된 비즈니스 자산의 재사용성을 극대화할 수 있다면, 신속하고 효과적인 클라우드 기반의 비즈니스를 추구할 수 있는데, 이러한 과정의 중심에는 효과적인 레포지토리의 구축이 우선된다. 이에 본 논문은 클라우드기반 비즈니스 시스템의 특징을 살펴보고, 비즈니스 생명주기의 각 단계에서 요구되는 레포지토리의 요구사항을 분석하여 적합한 메타데이터 및 데이터 아키텍처를 설계하고 제안하고자 한다. 또한, 오픈소스 시스템을 통해 제안하는 시스템의 활용가능성을 확인하고자 한다.

IoT 온디바이스 AI 실현을 위한 AI 모델 레포지토리 (AI Model Repository for Realizing IoT On-device AI)

  • 이석준;최충재;성낙명
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.597-599
    • /
    • 2022
  • IoT 디바이스에서 on-device AI를 수행할 때, 타겟 서비스나 디바이스의 환경에 따라 필요한 AI 모델이 달라질 수 있다. 또한, 기존 AI 모델도 federated learning과 같이 추가적인 데이터를 이용해 트레이닝을 하거나 보다 향상된 새로운 기법을 사용하는 등 업데이트가 일어날 수 있다. 이에 따라 IoT 디바이스에서 양질의 AI 서비스를 수행하기 위해서는 상황에 따라 필요한 AI 모델을 선택적으로 사용하거나 최적화된 최신 버전의 AI 모델로 업데이트 할 수 있어야 한다. 본 논문에서는 이를 지원하기 위한 AI 모델 레포지토리를 제안한다. 레포지토리는 AI 모델의 등록, 검색, 관리 및 배포를 지원하며 실사용을 위한 웹 포털을 포함한다. 제안하는 시스템의 실효성 확인을 위해 Node.js와 Vue.js로 구현하여 동작을 확인하였다.

  • PDF

WebBase 기반 웹 아카이브 시스템의 설계 (The Design of Web Archive System on the WebBase)

  • 이민희;이무훈;장창복;김동혁;고병오;최의인
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1473-1476
    • /
    • 2003
  • 웹의 성장으로 사용자는 언제 어디서든지 유용한 정보의 이용이 가능해졌다. 웹이 광범위하게 사용됨에 따라 정보를 획득하기 위해 대다수의 사용자들이 웹을 의존하고 있다. 그러나 웹상의 모든 정보는 정보가 저장되어 있는 서버의 관리자들에 의해 계속적으로 갱신 또는 삭제되어 가고 있어 기존의 정보들은 그것의 중요성 여부와 관계없이 대다수의 정보가 소멸되고 있다. 따라서 오랜 기간에 거쳐 생성된 웹상의 중요 데이터(importance data)들을 효율적으로 활용하기 위한 웹 아카이브(archive) 시스템이 연구되었다. 그러나 현재 존재하는 웹 아카이브 시스템은 갱신되기 이전의 데이터를 다루기 위한 체계적인 처리기법을 제시하지 못하고, 수집된 데이터들에 대한 연관관계를 저장하지 못하여 데이터 관리에 있어 비효율적이라는 문제점을 가지고 있다. 이에 따라 본 논문에서는 웹으로부터 다운로드한 데이터를 레포지토리(repository)에 효율적으로 저장하기 위해 설계된 대표적인 WebBase를 기반으로 하여 갱신되기 이전의 모든 정보들에 대한 내용을 히스토리(history) 저장소내에 저장하여 정보를 효율적으로 활용할 수 있는 웹 아카이브 시스템의 구조를 제안한다.

  • PDF

re3data를 기반으로 한 인문사회 RDR 연구 (A Study on Analysis of Research Data Repository in Humanities and Social Sciences)

  • 조재인;박종도
    • 한국비블리아학회지
    • /
    • 제30권2호
    • /
    • pp.69-87
    • /
    • 2019
  • 오픈데이터헌장을 계기로 연구데이터 공유에 대한 논의가 지속되는 가운데, 미국, 영국, 일본 등을 중심으로 연구지원 기관들은 연구자들에게 결과물을 신뢰할 수 있는 저장소에 기탁하도록 유도하고 있다. 인문사회분야는 생명, 자연과학 분야에 비해 연구데이터 공유 문화나 저장 인프라가 미성숙하지만 이 역시 데이터의 영속적 접근과 활용 보장을 위해 신뢰할 수 있는 저장 인프라의 구축과 운영이 필요하다. 본 연구는 이러한 배경에서 re3data에 등록된 305개 인문사회분야 데이터 레포지토리(RDR: Research Data Repository)를 대상으로 현황을 파악하고 운영 수준에 따라 4개의 군집으로 유형화해 분석하였다. 그 결과 전체의 70%를 차지하는 보편적 수준의 RDR이 유형화되었으며, 독일이 운영 주체이거나 언어학 분야가 두드러진 우수 군집도 확인되었다. 한편, 인문사회 하위주제영역에 있어 아카이빙되는 데이터 유형에 차이가 존재하는지 대응일치 분석(Correspondence Analysis)을 통해 확인한 결과, 역사 및 예술분야는 이미지, 사회계열 전반은 통계데이터나 오피스문서, 언어학은 오디오, 텍스트, 코드 등이 관련성 있는 데이터 유형으로 분석되었다.

연구소프트웨어의 공유, 재사용 및 인용과 관련된 현재 관행의 의미 (The Implications of Current Practices Relating to the Sharing, Reuse, and Citation of Research Software for the Future of Research)

  • 박형주
    • 정보관리학회지
    • /
    • 제38권4호
    • /
    • pp.65-82
    • /
    • 2021
  • 이 연구의 목적은 연구소프트웨어의 공유, 재사용, 인용 현황을 분석하는 것이다. 학술커뮤니케이션에서 연구소프트웨어는 최근 들어 더욱 중요한 역할을 하고 있다. 현재 연구소프트웨어의 인용이 일반적인 관행이 아니거나, 적어도 데이터인용색인(DCI)이 연구소프트웨어의 인용과 재사용을 제대로 인덱싱하지 못하는 것으로 관찰되었다. 소프트웨어인용은 주요 레포지토리(prominent repositories)에서 발견되었다. 소프트웨어인용이 많은 레포지토리는 CRAN(Comprehensive R Archive Network)과 Zenodo였다. 연구소프트웨어가 재사용되는 경우, 비공식 소프트웨어인용(informal software citation)과 공식 소프트웨어인용(formal software citation)이 동시에 관찰되었다. 비공식 소프트웨어인용은 연구소프트웨어가 논문의 본문에서는 언급되지만 참고문헌에는 없는 경우였고, 공식 소프트웨어인용은 참고문헌에도 있는 경우였다. 또한, 이 연구의 결과는 연구소프트웨어의 자기 인용(self-citation) 현황을 설명했다.

Data Citation Index를 기반으로 한 연구데이터 인용에 관한 연구 (Study about Research Data Citation Based on DCI (Data Citation Index))

  • 조재인
    • 한국문헌정보학회지
    • /
    • 제50권1호
    • /
    • pp.189-207
    • /
    • 2016
  • 연구데이터의 개방과 공유는 연구의 효율성과 연구 과정의 투명성을 제고할 뿐 아니라, 데이터 통합과 재해석을 통해 새로운 과학으로의 창출도 가능하다. 서구를 중심으로 연구데이터 공개와 재사용을 위한 다양한 정책이 개발되면서 표준적인 인용 체계도 자리를 잡아가고 있다. 본 연구는 연구데이터 인용색인 DCI(Data Citation Index)를 기반으로 연구데이터의 구축 규모와 인용 정도를 파악하고, 기술통계분석과 Kruskal-Wallis H 분석을 통해서 고인용 데이터의 특성과 인용 경향을 분석해 보았다. 또한 알트매트릭스(Altmetrics) 분석 도구인 Impactstory를 통하여 연구데이터의 사회적 영향력도 진단해 보았다. 그 결과 연구데이터의 규모는 유전학과 생명공학 분야가 압도적으로 크지만, 다수 인용된 분야는 인구, 고용 등 경제 사회과학분야인 것으로 나타났으며, UK Data Archive, ICPSR(Inter-University Consortium For Political And Social Research)에 구축된 연구데이터가 가장 많이 인용되고 있는 것으로 분석되었다. 또한 데이터세트보다는 조사방법과 연구방법론이 포함된 데이터스터디가 높은 피인용도를 보이는 것으로 나타났으며, 연구데이터의 알트매트릭스 분석 결과에서도 사회과학분야의 데이터스터디가 상대적으로 많이 참조되고 있는 것으로 나타났다.