• Title/Summary/Keyword: 데이터 구축

Search Result 8,504, Processing Time 0.037 seconds

Current Status of Domestic Marine Data Construction for Maritime Digital Twin (해양 디지털트윈을 위한 국내 해양 데이터 구축 현황)

  • Chung, Ki-Sook;Jung, Woo-Suk
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2023.11a
    • /
    • pp.71-72
    • /
    • 2023
  • 해양 디지털 트윈 구축을 위해서는 바다와 인접한 육상공간, 해상 및 해저 공간 등의 공간 정보와 시시각각 변하는 해양 환경 데이터, 그리고 해양 생태계 및 해양 자원 등 관련된 해양 데이터를 수집하고 이를 트윈에 적용하는 것이 필수적이다. 본 논문에서는 해양 디지털트윈 구축을 위해 필요한 해양 데이터의 국내 제공 현황을 정리하였다.

  • PDF

국내 DW 구축 효과 및 발전방향

  • Park, Ju-Seok
    • Digital Contents
    • /
    • no.6 s.73
    • /
    • pp.20-22
    • /
    • 1999
  • 국내의 데이터 웨어하우스 시장은 IMF 환경으로 인한 경기부진에도 불구하고 전사적 자원관리(Enterprise Resoruce Planning :ERP), 전자상거래(Electronic Commerce:EC) 구축 프로젝트 등과 더불어 정보 기술(Information Technology:IT)투자의 가장 중요한 부분을 차지하고 있다.이 글에서는 국내 기업들의 데이터 웨어하우스 구축 실태를 설문조사하고 이를 분석하여 향후 데이터 웨어하우스 발전 방향을 제시하려고 한다.

  • PDF

Automatic Ontology Generation for Item Recommendation to Customer (고객 상품 추천을 위한 온톨로지 자동 생성)

  • 구미숙;황정희;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.235-237
    • /
    • 2004
  • 최근 인터넷 기술의 발전으로 인해 정보량이 급증함으로써 이들 정보자원을 효과적으로 검색하기 위한 방법으로 메타데이터를 이용하여 필요한 정보 자원에 정확하게 접근하는 방법이 다양한 분야에서 제안되고 있다. 메타데이터는 정보자원을 효과적으로 검색하고 데이터를 재가공하여 다양한 각종 정보자원에 대한 정보 및 기록 관리를 할 수 있다. 이 논문에서는 정보를 효율적으로 검색하기 위하여 XML을 이용한 온톨로지 기반의 메타데이터를 이용한다. 홈쇼핑 사이트의 고객인 소비자를 대상으로 효율적인 정보 추천 및 검색을 위해, 상품 토픽맵 온톨로지를 구축하고 소비자에게 알맞은 쇼핑 정보를 전달하기 위한 정보검색 시스템을 설계 구축한다. 온톨로지의 자동적 구축은 데이터 마이닝 기법인 COBWEB의 개념 계층적 클러스터링 알고리즘을 이용하였다. 기존의 전문가에 의한 수동적인 온톨로지 구축을 자동화 시키므로써, 대량의 온톤로지를 구축하여 정보검색에 효율을 기할 수 있다.

  • PDF

Study on Making Chunking Dataset for Keyword Extraction and its Improvement Methods (키워드 추출용 구묶음 데이터 구축 및 개선 방법 연구)

  • Lee, Minho;Choi, Maengsik;Kim, Jeongah;Lee, Chunghee;Kim, Bohui;Oh, Hyo-Jung;Lee, Yeonsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.512-517
    • /
    • 2020
  • 구묶음은 문장을 겹치지 않는 문장 구성 성분으로 나누는 과정으로, 구묶음 방법에 따라 구문분석, 관계 추출 등 다양한 하위 태스크에 사용할 수 있다. 본 논문에서는 문장의 키워드를 추출하기 위한 구묶음 방식을 제안하고, 키워드 단위 구묶음 데이터를 구축하기 위한 가이드라인을 제작하였다. 해당 가이드라인을 적용하여 구축한 데이터와 BERT 기반의 모델을 이용하여 학습 및 평가를 통해 구축된 데이터의 품질을 측정하여 78점의 F1점수를 얻었다. 이후 패턴 통일, 형태소 표시 여부 등 다양한 개선 방법의 적용 및 재실험을 통해 가이드라인의 개선 방향을 제시한다.

  • PDF

Manual Revision of Penn Korean Universal Dependency Treebank (Penn Korean Universal Dependency Treebank 데이터셋 구축)

  • Oh, Taehwan;Han, Jiyoon;Kim, Hansaem
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.61-65
    • /
    • 2021
  • 본 연구에서는 2018년에 공개된 Penn Korean Universal Dependency Treebank(이하 PKT-UD v2018) 데이터의 오류를 분석하고 이를 개정하여 새롭게 데이터셋(이하 PKT-UD v2020)을 구축하였다. PKT-UD v2018은 구구조 분석 방식으로 구축된 Penn Korean Treebank를 UD(Universal Dependencies)의 체계에 맞추어 자동적으로 변환한 후 보정하여 구축한 데이터이다. 본 연구에서는 이와 같은 자동 변환의 과정에서 발생한 오류를 바로 잡고, UD 체계를 최대한 활용하면서 한국어의 특성을 잘 살린 데이터셋을 구축할 수 있는 방법을 제안하였다.

  • PDF

A Study on the MultiMedia Data Mining using Multi-dimensional DataCube (다차원 데이터큐브를 이용한 멀티미디어 데이터 마이닝 연구)

  • 김진옥;황대준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.151-153
    • /
    • 2001
  • 멀티미디어 데이터의 증가와 마이닝 기술의 발전으로 인해 멀티미디어 마이닝에 대한 관심이 증가하고 있다. 본 논문에서는 내용기반의 정보검색 기술과 다차원 다중 데이터큐브 구축기술을 통해 멀터미디어데이타의 마이닝을 구현하는 시스템에 대해 제안한다. 제안 시스템은 멀티미디어 데이터에 내용기반의 정보추출 시스템을 적용하여 성분백터를 추출하고 이를 메타데이타로 한 데이스베이스를 구축한다. 그리고 데이타베이스로부터 지식을 마이닝할 수 있도록 다차원 데이터큐브를 구축하여 빠른 데이터검색과 마이닝결과을 이용자에게 보여주는 모듈로 구성된다. 다차원 데이터큐브는 다중 어레이 구조로써 다차원 데이터를 저장하고, 저장된 여러 데이터 레벨 정보에서 가장 중요한 주제를 통합 생성하여 효율적으로 처리하므로 멀티미디어 데이터를 마이닝하는데 효과적인 방법이다. 또만 다차원데이타큐브를 다중으로 생성하는 방법은 데이터 마이닝 속도를 높이는데 효율적이다.

  • PDF

Study for Spatial Big Data Concept and System Building (공간빅데이터 개념 및 체계 구축방안 연구)

  • Ahn, Jong Wook;Yi, Mi Sook;Shin, Dong Bin
    • Spatial Information Research
    • /
    • v.21 no.5
    • /
    • pp.43-51
    • /
    • 2013
  • In this study, the concept of spatial big data and effective ways to build a spatial big data system are presented. Big Data is defined as 3V(volume, variety, velocity). Spatial big data is the basis for evolution from 3V's big data to 6V's big data(volume, variety, velocity, value, veracity, visualization). In order to build an effective spatial big data, spatial big data system building should be promoted. In addition, spatial big data system should be performed a national spatial information base, convergence platform, service providers, and providers as a factor of production. The spatial big data system is made up of infrastructure(hardware), technology (software), spatial big data(data), human resources, law etc. The goals for the spatial big data system build are spatial-based policy support, spatial big data platform based industries enable, spatial big data fusion-based composition, spatial active in social issues. Strategies for achieving the objectives are build the government-wide cooperation, new industry creation and activation, and spatial big data platform built, technologies competitiveness of spatial big data.

불완비 데이터에서 분류 나무의 구축

  • 우주성;김규성
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2001.11a
    • /
    • pp.105-108
    • /
    • 2001
  • 본 논문에서는 결측치가 있는 불완비 데이터에서 분류나루를 구축하는 방법을 고찰하였다. 기존의 결측치 처리 방법인 대리 분리 방법의 대안으로 대체 방법으로 결측치를 처리한 후 분류나무를 구축하는 방법을 제안하였다.

  • PDF

A Smart Monitoring Management System Architecture Design for Modular Data Center Infra (모듈러 데이터센터 인프라를 위한 스마트 모니터링 관리 시스템 구조 설계)

  • Lee, Woo Seung;Kim, Hyun Woo;Lee, Young Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.26-29
    • /
    • 2013
  • 클라우드 컴퓨팅 및 빅데이터 환경에서 최근 데이터의 유동량은 폭발적으로 증가하였다. 그에 따라 대규모 IT자원 및 서비스 제공을 위한 핵심 인프라 역할을 맡고 있는 데이터센터의 수요가 급증하고 있는 추세이다. 하지만, 데이터센터의 빠른 확장 속도에 비하여 데이터센터를 통합적, 효율적으로 관리하고 모니터링 할 수 있는 시스템의 부재로 데이터센터의 빠른 유지보수, 효율적 자원관리와 고신뢰 시스템 구축이 어려운 실정이다. 또한 국내 여건상 외국의 사례와 같이 넓은 부지를 사용하여 데이터센터를 구축할 수가 없기 때문에 모듈 형태의 데이터센터 구축 연구가 절실한 상황이다. 본 논문에서는 이러한 폭발적 데이터 환경과 국내 여건을 고려한 효율적인 인프라 지원을 위한 모듈러 데이터 센터의 스마트 모니터링 관리 시스템 구조를 설계한다.

Development of a Water Information Data Platform for Integrated Water Resources Management in Seoul (서울시 통합물관리를 위한 물정보 데이터 플랫폼 구축방안)

  • Yoon, Sun Kwon;Choi, Hyeonseok;Cho, Jaepil;Jang, Suk Hwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.76-76
    • /
    • 2020
  • 국가 물관리일원화 이후, 지방하천 관리에 대한 지자체 역할과 권한이 커지고 있으며, 중앙정부의 물관리 수준에 부합하는 데이터관리 체계구축 및 지속적인 품질관리(Quality Control, QC)와 표준화(Standardization) 기술개발이 요구되고 있다. 지자체의 경우 기존의 행정구역별로 분산 관리해오던 물관리 시스템을 유역단위로 전환할 필요가 있으며, 국가하천 구간과 연계한 종합적인 관리가 필요한 실정이다. 서울시의 물관리 시스템은 자치구별로 산재해 있으며, 관리 주체 및 해당 변수에 따라 제공되는 정보가 다르고 하천유역 단위로 분류되어 있지 않다. 따라서, 서울시와 자치구, 중앙정부 및 관련 기관과의 연계성 있는 정보제공을 위한 데이터 플랫폼 구축 기술개발이 필요한 실정이다. 본 연구에서는, 빅데이터, AI 기술을 활용한 물정보의 품질관리 자동화 기술개발과 지속적인 유지관리 및 표준화 정보제공 시스템 구축 기능을 포함하는 서울시 통합물관리 데이터 플랫폼 구축 목표 모델을 제시하였으며, 서울시 물관리 체계와 관련하여 SWAT 분석을 통한 단계별 사업추진 로드맵을 도출하였다. 분석결과, 서울시 통합물관리 플랫폼 구축을 위해서는 유역별 수량-수질 통합 모니터링 및 모델링 기술개발, 빅데이터 기반 물 정보화 플랫폼 구축 기술개발, 지방하천 유역 거버넌스 구축 및 법제도 정비 방안 마련이 요구되며, 관련하여 주요 이슈(3대 핵심전략, 10개 단위과제)를 도출하여 관련 연구과제를 제안하였다. 마지막으로, 서울시 통합물관리 정책 실현을 위해서는 법제도 마련이 시급하며, 서울시 '통합물관리 기본조례' 제정을 통한 기반을 조성할 필요가 있음을 시사하였다. 또한, 다양한 분야 이해관계자 협의체인 '서울시 통합물관리위원회(가칭)'의 거버넌스를 구성하여 운영하는 것이 현실적이며, 한강유역관리 및 지방하천 관리와 관련한 중추적인 역할 수행과 쟁점 논의 등 합리적 합의가 가능할 것으로 기대한다.

  • PDF