• Title/Summary/Keyword: 과학기술 데이터

Search Result 2,575, Processing Time 0.04 seconds

Knowledge-grounded Dialogue Generation Using Domain-level Learning Approach for Practical Services (현업 서비스를 위한 도메인 수준 학습 방법을 활용한 지식 기반 대화생성)

  • Chae-Gyun Lim;Young-Seob Jeong;ChangWon Ok;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.619-623
    • /
    • 2022
  • 대화생성은 대규모 학습 데이터로부터 사전 학습된 언어모델을 활용한 도전적인 다운스트림 태스크 중 하나이다. 대화에서 특정한 지식에 대한 맥락이 보존된 응답 문장을 생성하기 위한 기술의 일환으로써 지식 기반 대화생성이 연구되고 있으며, 현업에서는 사업목표에 따른 대화 서비스를 제공하는 목적으로 이러한 기술을 적용할 수 있다. 본 논문에서는, 각각의 서비스 도메인에 특화된 모델을 적절히 활용 가능하도록 전체 데이터를 도메인별로 구분하여 학습한 다수의 대화생성 모델을 구축한다. 또한, 특정 도메인의 데이터로 학습된 모델이 나머지 도메인에서 어떤 수준의 대화생성이 가능한지 비교 분석함으로써 개별 학습된 모델들이 도메인의 특성에 따라 서로 다른 영향력이나 연관성을 나타낼 가능성을 확인한다. 이러한 실험적인 분석 결과를 바탕으로 현업의 서비스에서 개별 도메인에 특화된 모델이 적절히 활용하는 것이 유용함을 확인하고자 한다.

  • PDF

Benchmark Dataset Generation for 360-degree Image Applications (360° 영상 응용을 위한 벤치마크 데이터 생성 연구)

  • Lee, Jongsung;Lee, Yeejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.112-115
    • /
    • 2021
  • 최근 가상현실 및 증강 현실에 대한 관심도가 높아지면서, 깊이 추정, 객체 인식, 영상 분할 등의 다양한 컴퓨터 비전 알고리즘을 360° 영상에 적용하는 연구가 활발히 진행되고 있다. 이 중, 다수의 RGB 카메라를 활용하여 3 차원 정보를 추출하는 깊이 추정 기술은 보다 나은 몰입감을 제공하기 위한 핵심 기술이다. 그러나 깊이 추정 알고리즘의 객관적 성능 평가를 위한 정제된 360° 영상 데이터셋은 극히 부족하며, 이로 인하여 관련 분야 연구에 한계가 있다. 따라서 본 논문에서는 객관적인 알고리즘 성능 평가가 가능하며, 정제된 360° 동영상 데이터셋을 제안하고, 추후 다양한 360° 영상 응용 알고리즘 개발에 활용하고자 한다.

  • PDF

Implementation of Tiering Storage to Support High-Performance I/O (고성능 I/O 지원을 위한 계층형 스토리지 구현)

  • Junweon Yoon;Taeyeong Hong
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.50-52
    • /
    • 2023
  • ML/DL과 같은 AI의 연구가 HPC 환경에서 수행되면서 데이터 병렬화, 분산 학습 및 대규모 데이터 세트를 처리를 위한 요구사항이 급격히 증가하였다. 또한, 병렬처리 연산에 특화된 가속기 기반 이기종 아키텍처 환경 변화로 I/O 처리에 고대역폭, 저지연의 스토리지 기술을 필요로 하고 있다. 본 논문에서는 고집적의 병렬 컴퓨팅 환경에 고성능 HPC, AI 애플리케이션을 처리하기 위한 티어링 스토리지 기술을 논한다. 나아가 실제 고성능 NVMe 기반의 플래시 티어링 계층 구성에서 액세스 패턴에 따른 데이터 처리 환경을 구축하고 성능을 검증한다. 이로써 다양한 사용자 어플리케이션의 I/O 패턴을 특성에 맞게 지원할 수 있다.

Implementation of Monte Carlo estimation of Pi based on UPMEM PIM (UPMEM PIM 기반 원주율의 몬테카를로 추정 구현)

  • Jae-Hyuck Kwak;Kwang Jin Oh
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.27-29
    • /
    • 2023
  • 폰노이만 구조를 따르는 기존의 컴퓨터 시스템은 프로세서와 메모리의 역할이 구분되어 있으며 프로세서는 메모리에 저장된 명령어와 데이터를 불러와 실행한다. 이 과정에서 메모리와 프로세서 간에 발생하는 데이터 이동은 메모리 집약적인 응용을 처리하는데 있어서 심각한 오버헤드를 야기할수 있다. PIM(Processing-In-Memory)은 데이터 이동 병목을 해결하기 위해서 메모리에 프로세서의 능력을 통합하는 기술로서 최근의 메모리 기술의 발전으로 주목받고 있다. 본 논문에서는 UPMEM사의 상용 PIM 제품을 기반으로 몬테카를로 방법을 이용한 원주율 추정을 구현하고 성능 확장성을 분석하였다.

Design of Metadata Model and Development of Management System for Electronic Documents on the Web (Web상의 전자문서를 위한 메타데이터 모델의 제안 및 관리시스템의 개발)

  • Jung, Hyo-Taeg;Yang, Young-Jong;Kim, Soon-Yong;Lee, Sang-Duk;Choy, Yoon-Chul
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.4
    • /
    • pp.924-941
    • /
    • 1998
  • It is not easy to access to the required data from the Web by using search engines because there are too many data selected and they do not provide enough information related to the corresponding data. Metadata is data about data. It includes information about data itself and contents of data as well. Users can acquire enough information about the corresponding data and access to the required data exactly using metadata, and therefore the data usability will be increased. In this paper, several metadata technologies and metadata models that are already in process of standardization or adopted as standards are analyzed, and the SeriCore Metadata Model for documents such as papers, project reports, technical reports, abstracts, and manuals, and graphic images that are in the field of science technologies on the Web is proposed. The SeriCore Metadata Management System that can generate, store, and retrieve metadata effectively is designed and implemented based on the SeriCore Metadata Model.

  • PDF

Evaluation on Quality of Publisher-Generated Usage Statistics (출판사 생성 이용통계 데이터의 품질 평가에 대한 연구)

  • Jung, Young-Im
    • Journal of Information Management
    • /
    • v.43 no.3
    • /
    • pp.161-180
    • /
    • 2012
  • In this study, concept and importance of e-journal usage statistics has been examined and Journal Usage Factor project performed by Project COUNTER group has been investigated. Advantages and limits of usage statistics generated by library, link resolver and publisher have been clarified. By analyzing various errors and problems included in publisher-generated usage statistics, we conclude that the current usage statistics is not completely credible yet.

Modeling of metadata for agricultural and livestock food product (농축산물 식품 메타데이터 모델링)

  • Cho, Hyeeun;Kim, Dae-young
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.10a
    • /
    • pp.475-478
    • /
    • 2016
  • This paper deals with how to operate the metadata for agricultural and livestock food product through the GS1 Source which is a GS1 standard metadata service. We defines GS1 standard identifiers for identifying food product and explain the guidelines for the methods how to document with GS1 standard schema and how to query the metadata in the storage of GS1 Source.

  • PDF

A Study on the Library Big Data Service Model (도서관 빅데이터 서비스 모형 개발에 관한 연구 - 도서관 서비스 수요 분석을 중심으로 -)

  • Lee, Eun Jee;Kim, Wan-Jong
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2014.08a
    • /
    • pp.131-134
    • /
    • 2014
  • 전 세계적으로 다양한 영역에서 빅데이터 활용 성공 사례가 증가하게 되면서 도서관 분야에서도 빅데이터를 활용한 신규 서비스 개발 필요성이 제기 되고 있다. 본 연구는 공공도서관의 정보서비스 제공 및 도서관 운영 실태, 이용자 특성 등을 분석하였고, 이를 바탕으로 새로운 도서관 패러다임을 이끄는 도서관 빅데이터 서비스 모형을 개발하고자 한다. 먼저, 설문 대상을 사서 집단과 이용자 집단으로 나누어 공공도서관 이용현황을 파악하였고, 대표적인 공공도서관 서비스인 장서개발 및 열람봉사, 이용자 맞춤형 추천서비스에 대한 수요도를 분석하였다. 추가적으로 응답에 대한 집단 간 차이에 대해 살펴보았다. 분석결과를 토대로 관련 서비스 개발을 위한 방향성을 도출하였고, 향후 활용 가능한 도서관 빅데이터 서비스 정립을 위한 기초 방안을 제시하였다.

  • PDF

Study of Big Data based VTSO Decision Support Tool (빅데이터 기반 관제사 지원 도구에 관한 연구)

  • Hye-Jin Kim;Jae-Yong Oh
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.06a
    • /
    • pp.265-266
    • /
    • 2022
  • 전통적으로 선박교통관제서비스는 정보제공(INS), 항행지원(NAS), 교통관리(TOS)로 구분되어 왔으나, 최근 IMO 결의서 A.1158의 개정을 통해 선박교통관제서비스의 목적을 선박 항해에 안전하지 않은 상황을 선제적으로 모니터링하고 통제하는 것으로 규정하고 있다. 이를 위해 기존의 VTS 서비스 용어들을 모두 삭제하였으며, IALA에서도 관제사의 의사결정도구에 대한 개정을 논의하고 있는 상황이다. 이에 본 논문에서는 빅데이터 기반의 관제사 의사결정도구를 제안하였으며, 적용 가능성을 검토하였다. 제안하는 방법은 관제사의 주관적인 판단과 단순한 규칙에 의존하던 기존의 관제 방법과는 달리 데이터를 기반으로 하는 객관적인 관제 기준을 제시할 수 있으며, 이러한 방법이 실제 관제 현장에 적용되어 해양사고를 방지하고, 항만의 운영 효율을 향상시킬 수 있기를 기대한다.

  • PDF

Development and Validation of Data Science Education Instructional Model (데이터 과학 교육을 위한 수업모형 개발 및 타당성 검증)

  • Bongchul Kim;Bomsol Kim;Jonghoon Kim
    • Journal of The Korean Association of Information Education
    • /
    • v.26 no.5
    • /
    • pp.417-425
    • /
    • 2022
  • The 'Comprehensive Plan for Nurturing Digital Talents' reported at the Cabinet meeting of the Ministry of Education in August 2022 focuses on qualitative and quantitative expansion of informatics education centered on SW, AI education. With the advent of the era of artificial intelligence, data science education is also drawing attention as a field of informatics education. Data science is originally a field where various studies are fused, and advanced technologies are being used for data analysis, modeling, and machine learning. This study devised a draft of the instructional model of data science education through literature research and analysis of previous studies, and developed a final instructional model through usability test and expert validation.