• 제목/요약/키워드: 데이터 구축

검색결과 8,424건 처리시간 0.036초

국방 데이터공유환경 구축에 관한 연구 (A study on Establishing National Defence Shared Data Environment (SHADE))

  • 이학래;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1725-1728
    • /
    • 2002
  • 국방부는 90년대 후반부터 국방정보체계 구축사업을 본격적으로 추진하면서 정보체계의 상호운용성 문제를 심각하게 인식하고 상호운용성을 보장하는 국방 정보체계를 구축하기 위하여 많은 노력을 추진하고 있다. 상호운용성을 보장하는 정보체계를 구축하기 위한 목표를 국방통합정보체계 구축으로 설정하고 이를 구성하는 요소로 국방정보체계표준, 공통운용환경, 데이터공유환경을 식별하고, 이를 구축하기 위해 추진하고 있다. 이들 가운데 국방정보체계표준은 선정되어, 국방전반에 대하여 효력을 발휘하고 있으며, 공통운용환경은 우리의 국방환경에 적합한 추진방향을 선정하였으나, 데이터공유환경을 구축하기 위한 전략 및 방법에 대한 연구는 부족한 실정이다. 본 연구에서는 선진국의 추진사례와 우리나라 국방 현실에 대한 분석을 통하여 우리의 현실에 맞는 데이터공유환경(SHADE)를 구축하기 위한 전략 및 방법을 제시하며, 그 내용으로는 먼저 현 국방 데이터 관리 실태 분석을 통하여 현 상황을 인식한 후, 구축하고자 하는 목표을 설정하고, 이러한 목표를 달성하기 위한 추진 전략 및 방향, 업무와 관련된 조직 및 인원에 대한 임무, 단계별 추진 과제 등을 식별하고 데이터공유가 요구되는 조직 및 체계에 적용가능한 데이터 관리 절차와 데이터 상호운용성을 만족시키기 위한 접근방법을 제시한다.

  • PDF

분산이기종환경에서의 공간데이터 교환 모델 및 시스템 (The Model and System of Spatial Data Interchange In Distributed Various Computing Platform)

  • 차정숙;김명구;김성룡;강인수
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2002년도 춘계학술대회 논문집
    • /
    • pp.22-28
    • /
    • 2002
  • 지리정보시스템에서 사용되는 공간데이터의 특성은 양이 방대하고 구조가 복잡하여 데이터를 구축하는데 많은 비용과 노력이 요구된다. 또한 각 지리정보 응용시스템마다 특정한 포맷으로 데이터를 구축, 사용하는 실정 때문에 기존에 동일한 데이터가 구축이 되었더라도 재사용하지 못하고 다시 재 구축하여 사용하였다. 대부분의 지리정보 응용시스템에서 기존의 데이터를 재 사용지 못하고 전체 예산의 60% 이상을 데이터 구축에 중복 투자하는 문제점이 존재한다. 또한 데이터구축의 문제점뿐만 아니라 소프트웨어적으로 시스템 환경에 의존적으로 구현되어 시스템 환경이 변하는 경우에 시스템 자체가 수정되거나 재 구현되어야 하는 문제점도 존재하였다. 본 논문에서는 이러한 데이터 중복구축 및 투자와 시스템 의존적인 구성의 문제점들을 해결하기 위해 기존에 존재하는 데이터를 온라인상에서 검색하여 사용자가 재 사용할 수 있도록 OpenGIS에서 제안한 CatalogService를 구현하고 분산된 상호 이질적인 환경에서 서로의 데이터를 공유하고 연동하는 모델을 제안하고 구현하기 위해 WWW, COM, CORBA 기반으로 시스템을 구현하였다.

  • PDF

EmoNSMC: Distant Supervision 을 이용한 한국어 감정 태깅 데이터셋 구축 (EmoNSMC: Constructing Korean Emotion Tagging Dataset Using Distant Supervision)

  • 이영준;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.519-521
    • /
    • 2019
  • 최근 소셜 메신저를 통해 많은 사람들이 의사소통을 주고받음에 따라, 텍스트에서 감정을 파악하는 것이 중요하다. 따라서, 감정이 태깅된 데이터가 필요하다. 하지만, 기존 연구는 감정이 태깅된 데이터의 양이 많지가 않다. 이는 텍스트에서 감정을 파악하는데 성능 저하를 야기할 수 있다. 이를 해결하기 위해, 본 논문에서는 단어 매칭 방법과 형태소 매칭 방법을 이용하여 많은 양의 한국어 감정 태깅 데이터셋인 EmoNSMC 를 구축하였다. 구축한 데이터셋은 네이버 영화 감상 리뷰 데이터 (NSMC)에 디스턴트 수퍼비전 방법 (distant supervision) 방법을 적용하여 weak labeling을 진행하였고, 이 과정에서 한국어 감정 어휘 사전 (KTEA) 을 이용하였다. 구축된 데이터셋의 감정 분포 결과, 형태소 매칭 방법을 통해 구축한 데이터셋이 좀 더 감정 분포가 균등한 것을 확인할 수 있었다. 해당 데이터셋은 공개되어 있다.

  • PDF

EA를 위한 데이터 아키텍처 구축 모델 (A Model of implementation Data Architecture for Enterprise Architecture)

  • 김석수;이화식
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권9호
    • /
    • pp.175-183
    • /
    • 2011
  • 데이터는 IT의 핵심요소이다. 다른 아키텍처는 선진 기술과 기법을 참조하고 도입하여 적용이 가능하지만 데이터 아키텍처는 고유한 것이어서 우리 스스로 구축을하여야 한다. 데이터는 기술의변화와 진화에 민감하지 않은 영역으로 처음 구축 시 잘 만들면 건물의 철골 구조물과 같이 건실한 정보 시스템을 구축하는데 좋은 방향을 제시할 수 있다. 잘 구축된 데이터 아키텍처는 엔터프라이즈 아키텍처 구축을 용이하게 하고, 구축 후 관리 및 운영을 효과적으로 할 수 있게 한다. 본 논문은 엔터프라이즈 아키텍처를 위한 데이터 아키텍처 구축 모델을 제시한다.

품질이 관리된 스트레스 측정용 테이터셋 구축을 위한 제언 (Recommendations for the Construction of a Quslity-Controlled Stress Measurement Dataset)

  • 김태훈;나인섭
    • 스마트미디어저널
    • /
    • 제13권2호
    • /
    • pp.44-51
    • /
    • 2024
  • 스트레스 측정용 데이터셋의 구축은 건강, 의료분야, 심리향동, 교육분야 등 현대의 다양한 응용 분야에서 핵심적인 역할을 수행하교 있다. 특히, 스트레스 측정용 인공지능 모델의 효율적인 훈련을 위해서는 다양한 편향성을 제거하고 품질 관리된 데이터셋을 구축하는 것이 중요하다. 본 논문에서는 다양한 편향성 제거를 통한 품질의 관리된 스트레스 측정용 데이터셋 구축에 관하여 제안하였다. 이를 위해 스트레스 정의 및 측정도구 소개, 스트레스 인공지능 데이터 셋 구축과정, 품질향상을 위한 편향성 극복 전략 그리고 스트레스 데이터 수집시 고려사항을 제시하였다. 특히, 데이터셋 품질을 관리하기 위해 데이터셋 구축시 고려사항과, 발생할 수 있는 선택편향, 측정편향, 인과관계편향, 확증편향, 인공지능편향과 같은 다양한 편향서에 대해 검토하였다. 본 논문을 통해 스트레스 데이터 수집시 고려사항과 스트레스 데이터셋의 구축에서 발생할 수 있는 다양한 편향성을 체계적으로 이해하고, 이를 극복하여 품질이 보장된 데이터셋을 구축하는데 기여할 것으로 기대된다.

생물다양성데이터 검색포탈 구축 (Establishment of Search Portal on Biodiversity Data)

  • 안성수;박형선;권창혁;안부영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.561-564
    • /
    • 2005
  • 본 논문은 생물다양성데이터 네트워크 구축에 필요한 국내외의 생물다양성데이터 표준형식과 프로토콜 등을 소개하고 지리적으로 분산된 국내 생물다양성데이터를 통합 검색하여 활용 할 수 있는 방법과 국내생물다양성데이터의 검색포탈을 어떻게 구축하였는지 설명한다. 다음으로 포탈구축에 사용된 데이터 표준, 데이터 교환 프로토콜, 시스템 아키텍쳐 그리고 소프트웨어 구성요소에 대해 설명하고 끝으로 검색포탈이 원활이 운영되어지기 위해 데이터 소유기관 등에서 필요한 활동과 생물다양성데이터 검색포탈 구축의 결과 및 기대효과 등에 서술한다.

  • PDF

수산과학 빅데이터 플랫폼 구축과 메타 데이터 관리방안 (Fishery R&D Big Data Platform and Metadata Management Strategy)

  • 김재성;최영진;한명수;황재동;조완섭
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.93-103
    • /
    • 2019
  • 본 논문에서는 수산과학 R&D 정보의 빅데이터 플랫폼 구축과 메타 데이터 관리기법에 관해 소개한다. 빅데이터 플랫폼에서는 다양한 유형의 수산과학 R&D 정보를 수집하여 통합 연계하고, 이를 데이터 레이크 형태로 구축하는 방안을 제시한다. 수산과학 분야에서 수집, 축적되고 있는 기존의 데이터와 함께 위성영상 데이터, 연구보고서 등 비정형 빅데이터까지 수집하여 다양한 분석을 지원하는 빅데이터 플랫폼의 구축방안을 제시한다. 다음으로 데이터 추출과 전처리 및 저장 과정에서 메타 데이터를 수집하고 관리함으로써 수산과학 빅데이터의 체계적인 관리가 가능하도록 한다. 빅데이터 플랫폼 구축과 함께 메타 데이터를 표준양식으로 구축함으로써 데이터의 수집, 저장, 활용 및 유통 등 데이터 수명주기 전반에 걸쳐 체계적이고도 지속적인 빅데이터 관리 방안을 제시하는데 의의가 있다.

  • PDF

정보통신안테나

  • 한국정보통신산업협회
    • 정보화사회
    • /
    • 통권18호
    • /
    • pp.54-58
    • /
    • 1989
  • 한국전기통신공사는 현재의 전화망이 데이터통신을 활성화하는데 제약요소가 많다고 보고 향후 데이터통신의 경쟁체제에 대처키 위한 기반을 조성하고 데이터통신을 제2의 전기 통신사업으로 발전 육성시킬 목적으로 데이터통신 시범망을 구축키로 했다. 공사의 시범망 구축계획은 체신부의 PC 1,000만대 보급을 통한 정보이용의 활성화계획 추진과 데이터통신이 경쟁체제및 국제화, 미국의 데이터통신 시장개방 압력의 가중, 법적 규제 완화 추세로 가고 있는 배경에 기인한다. 통신공사는 시범기간동안 데이터통신 이용에 알맞는 통신망 개발자료 수집과 요금체제 개발을 추진하고 요금체제 정립전 및 정보처리용 통신 노드구축전까지 기존 시설을 활용하여 데이터통신 활성화를 도모할 방침이다.

  • PDF

개방형GIS를 위한 COM/CORBA 기반의 메타 데이터 검색 및 전송 컴포넌트에 관한 연구 (A Study on the MetaData Searching and Transmission Component based on COM/CORBA for OpenGIS)

  • 차정숙;김명구;이혜선;김성룡;김성규
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2001년도 춘계 학술대회 논문집 통권 4호 Proceedings of the 2001 KSRS Spring Meeting
    • /
    • pp.35-37
    • /
    • 2001
  • 공간데이터의 특성은 양이 방대하고 복잡하여 구축하는데 많은 시간과 비용이 요구되어진다. 이러한 GIS데이터들은 각자의 요구사항을 준수하여 여러 포맷으로 구축되어지기 때문에 현실적으로 동일한 공간 데이터들이 중복해서 구축되는 문제점들이 존재해왔다. 이러한 문제점을 해결하기 위해서 OGC(OpenGIS Consortium)에서는 구축되어 있는 공간 데이터들을 유통할 수 있는 방법에 대해 제안하였고, 이를 정의한 Catalog 명세서가 1999년에 발표되었다. 데이터 유통을 통하여 공간 데이터 중복투자 방지 및 활용을 촉진하기 위해 서비스를 제공하는 카탈로그 서버를 구축하여 사용자들이 원하는 데이터들을 검색, 접근할 수 있도록 하는 것이 본 논문의 목적이다.

  • PDF

옷 추천 시스템 데이터 셋 구축을 위한 텍스트 데이터 마이닝 (Text Data Mining to build a Dataset for Clothing Recommendation System)

  • 이주상;정선태;차준엽
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.393-396
    • /
    • 2020
  • 추천시스템은 대량의 정보를 이용하여 특정 사용자가 선호할만한 상품의 리스트를 추천하는 것이다. 현재 추천시스템으로 유명한 Netflix, Amazon, Youtube 등은 기업내의 상품 및 사용자 데이터를 토대로 이루어 졌으나 스타트 업 및 소규모 기업이 추천 시스템을 구축하기 위해선 기반이 될 데이터셋 자체가 없으며 데이터 수집에도 한계가 있다. 본 논문에서는 옷 추천 시스템 구축을 위해 특정 기업만이 아닌 모든 의류매장들이 사용할 수 있는 데이터 셋 구축 방법에 대해 제안하며, 고객 데이터 셋 구축을 위한 텍스트 데이터 마이닝 처리 과정과 결과에 대해 기술한다.