• Title/Summary/Keyword: 생성형 정보추출

Search Result 246, Processing Time 0.025 seconds

Design of customized Real-time SLA Mart (가입자 맞춤형 실시간 SLA 분석 마트의 설계)

  • Park, Noh-Sam;Lee, Gil-Haeng
    • Proceedings of the IEEK Conference
    • /
    • 2007.07a
    • /
    • pp.161-162
    • /
    • 2007
  • 본 논문에서는, 고객의 서비스 품질보장(SLA)에 대한 정보를 바탕으로 고객별로 특화된 분석 마트를 실시간으로 생성하기 위한 구조 및 그 방법을 제공한다. 본 논문의 가입자 맞춤형 실시간 SLA 분석 마트는 SLA 정보를 바탕으로 가입자별 분석 마트를 사용자의 요구에 따라 실시간으로 분석 마트를 생성한다. 사용자가 특정 가입자에 대한 SLA 분석 정보를 요청하면 가입자 프로파일에 요청 정보가 저장되고, SLA 데이터에서 가입자에 대한 SLA정보를 추출하여 가입자 프로파일의 요구사항에 따라서 분석 마트를 실시간으로 생성하는 구조를 가진다.

  • PDF

Korean Caption Extraction with Decision Tree (의사결정 트리를 이용한 한글 자막 추출)

  • Jung, Je-Hee;Lee, Seun-Hoon;Kim, Jae-Kwang;Lee, Jee-Hyong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.527-532
    • /
    • 2008
  • 자막은 영상과 관련이 있는 정보를 포함한다. 이러한 영상의 정보를 이용하기 위해서 자막을 추출하는 연구가 진행되고 있다. 기존의 자막 추출 연구는 언어 독립적인 특징으로 자막을 이루는 획의 에지는 일정한 간격을 유지하거나 수평라인으로 존재하는 글자의 분포를 이용한 방법을 제안하였다. 이러한 방법들은 획의 간격이 일정한 자막이나 하나의 글자가 하나의 획으로 이루어진 글자에서만 정상적인 동작을 보장하였다. 본 논문에서는 한글 자막 특징을 고려한 자막 추출 방법을 제안한다. 먼저, 한글 자막의 특징인 가로 획의 다수 분포를 고려한 적응형 에지 이진화를 수행하여 에지 영상을 생성하고 에지 연결 객체를 생성한다. 그 후에 생성한 연결 객체를 특징을 추출하여 사전에 생성한 의사결정 트리로 연결 객체를 자막과 비자막 연결객체로 분류한다. 의사결정 트리를 생성하기 위해서 사용한 연결 객체는 뉴스, 다큐멘터리 프로그램에서 획득하였으며, 성능 평가를 위해서 뉴스, 다큐멘터리, 스포츠 프로그램과 같은 대중 방송에서 획득한 영상에서 자막을 추출하였다. 평가 방법은 찾아진 연결 객체 중에 자막 연결 객체의 비율과 전체 자막 중에서 찾아진 자막 연결 객체의 비율로 분석하였다. 실험 결과에서는 제안한 방법이 한글 자막의 추출에 적용 가능함을 보여준다.

  • PDF

XML Global Schema Generation Model of XML Documents Considering Conflicts on Local Schema Integration (지역 스키마간 충돌 문제를 고려한 XML 문서의 전역 스키마 생성 모델)

  • 김정희;곽호영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.70-72
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF

A Study on Dataset Generation Method for Korean Language Information Extraction from Generative Large Language Model and Prompt Engineering (생성형 대규모 언어 모델과 프롬프트 엔지니어링을 통한 한국어 텍스트 기반 정보 추출 데이터셋 구축 방법)

  • Jeong Young Sang;Ji Seung Hyun;Kwon Da Rong Sae
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.12 no.11
    • /
    • pp.481-492
    • /
    • 2023
  • This study explores how to build a Korean dataset to extract information from text using generative large language models. In modern society, mixed information circulates rapidly, and effectively categorizing and extracting it is crucial to the decision-making process. However, there is still a lack of Korean datasets for training. To overcome this, this study attempts to extract information using text-based zero-shot learning using a generative large language model to build a purposeful Korean dataset. In this study, the language model is instructed to output the desired result through prompt engineering in the form of "system"-"instruction"-"source input"-"output format", and the dataset is built by utilizing the in-context learning characteristics of the language model through input sentences. We validate our approach by comparing the generated dataset with the existing benchmark dataset, and achieve 25.47% higher performance compared to the KLUE-RoBERTa-large model for the relation information extraction task. The results of this study are expected to contribute to AI research by showing the feasibility of extracting knowledge elements from Korean text. Furthermore, this methodology can be utilized for various fields and purposes, and has potential for building various Korean datasets.

Facial Caricaturing System - with Correction of Facial Decline - (얼굴 캐리커처 생성 시스템 - 얼굴 기울기 교정을 통한 -)

  • Kim, Yong-Gyun;Lee, Ok-Kyoung;Lee, Chang-Soo;Oh, Hae-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04b
    • /
    • pp.887-890
    • /
    • 2001
  • 본 논문은 사용자로부터 입력된 얼굴 사진을 얼굴 기울기 교정을 거친 후 얼굴 구성요소의 특징정보를 추출하고, 추출된 특징정보와 가장 유사한 캐리커처를 생성하는데 목적이 있다. 우리는 입력된 인물 사진에서 눈 영역 추출을 이용, 얼굴의 기울기를 교정시킨 다음 세그멘테이션을 통하여 인물의 얼굴을 추출하고, 추출된 얼굴의 수직과 수평 히스토그램을 이용하여 얼굴 구성요소를 추출한다. 또한 모양과 크기 등이 다양한 특징정보를 가진 얼굴 구성요소에 관한 데이터베이스를 구축함으로써 캐리커처의 질을 향상시키고자 한다. 우리는 사용자로부터 입력된 사진에서 추출된 얼굴 구성요소의 특징정보와 데이터베이스에 저장되어 있는 캐리커처 이미지의 특징정보와 유사도를 계산한다. 마지막으로 유사도가 가장 높은 캐리커처 이미지를 선택하여 눈, 눈썹, 코, 입, 얼굴형 등을 각각 위치에 매핑시킨다.

  • PDF

Generative Evidence Inference Method using Document Summarization Dataset (문서 요약 데이터셋을 이용한 생성형 근거 추론 방법)

  • Yeajin Jang;Youngjin Jang;Harksoo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.137-140
    • /
    • 2023
  • 자연어처리는 인공지능 발전과 함께 주목받는 분야로 컴퓨터가 인간의 언어를 이해하게 하는 기술이다. 그러나 많은 인공지능 모델은 블랙박스처럼 동작하여 그 원리를 해석하거나 이해하기 힘들다는 문제점이 있다. 이 문제를 해결하기 위해 설명 가능한 인공지능의 중요성이 강조되고 있으며, 활발히 연구되고 있다. 연구 초기에는 모델의 예측에 큰 영향을 끼치는 단어나 절을 근거로 추출했지만 문제 해결을 위한 단서 수준에 그쳤으며, 이후 문장 단위의 근거로 확장된 연구가 수행되었다. 하지만 문서 내에 서로 떨어져 있는 근거 문장 사이에 누락된 문맥 정보로 인하여 이해에 어려움을 줄 수 있다. 따라서 본 논문에서는 사람에게 보다 이해하기 쉬운 근거를 제공하기 위한 생성형 기반의 근거 추론 연구를 수행하고자 한다. 높은 수준의 자연어 이해 능력이 필요한 문서 요약 데이터셋을 활용하여 근거를 생성하고자 하며, 실험을 통해 일부 기계독해 데이터 샘플에서 예측에 대한 적절한 근거를 제공하는 것을 확인했다.

  • PDF

A Study on Test Case Extraction And Application for Intelligent Transport RoboCAR Drive Control Verification (지능형 교통 RoboCAR 운행제어 검증을 위한 Test Case 추출 및 적용 연구)

  • Jang, Woo-Sung;Park, Chan-Min;Lee, Cheul-Hee;Kim, R.Young-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1452-1455
    • /
    • 2012
  • 본 논문은 출시된 지능형 교통 기반으로 설계된 RoboCAR 운행제어 개발과 시험을 하고자 한다. 이를 위해 시스템 설계를 통해,Test Case 추출과 실제로 적용하여 구현된 소프트웨어를 시험에 목적을 둔다. 이 절차는 Use-Case Diagram 설계, Decision Factor 추출, 이 기반으로 Cause-Effect Diagram을 생성한다. Cause-Effect Diagram을 통해 Decision Table을 생성한다. 최종적으로 Decision Table을 기반으로 Test Case를 추출한다. 추출된 Test Case를 적용하여 시스템을 테스트 하였고, 설계와 구현이 동일하게 되었음을 검증하였다.

Design and Implementation of Testbed for Information Cost Test (이동 객체 데이터베이스 상에서 정보 비용 테스트를 위한 테스트 베드의 설계 및 구현)

  • 김태원;김경식;김창화;강태원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.73-75
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF

A Contour Generation Algorithm for Visualizing Non-Lattice Type Data (비격자형 자료의 시각화를 위한 등치선도 생성 알고리즘)

  • Lee, Jun;Kim, Ji-In
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.29 no.2
    • /
    • pp.94-104
    • /
    • 2002
  • As a part of scientific data visualization automatic generation algorithms for a contour map have been investigated mainly on data which are defined at every lattice point. But in actual situation like weather data measurement. it is impossible to get data defined at every lattice point This is because the exact value on every lattice point can not be obtained due to characteristics in sampling devices or sampling methods. In order to define data on every lattice point where data were not sampled an interpolation method. was applied to the sample data to assign approximate values for some lattice type data but by using the non-lattice type of sample data sets. A triangle data link was defined by using non lattice points directly based on actually sample data set, not by using the pre-processed rectangle lattice points. The suggested algorithm generates a contour map a contour map only by using sample data set which are much smaller than old one without data interpolation and there is no skew on data any more since it does not need any interpolation to get the values of the defined lattice points.

3D Object Extraction Mechanism via UML Sequence Models from Natural Language Requirements (자연어 요구사항으로부터 UML 시퀀스 모델을 경유한 3D 객체 추출 메커니즘)

  • Hyuntae Kim;Janghwan Kim;R. Young Chul Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.490-493
    • /
    • 2024
  • 현재 다양한 분야에서 AI 가 사용되고 있다. 최근에는 소프트웨어공학 관점에서 요구 사항 분석에 Chat GPT 와 같은 LLM 모델을 적용하고 있다. 하지만 1) 대부분의 생성형 AI 는 불투명한 공정을 통해 3D 이미지가 생성하고, 3D 이미지를 생성할 때마다 다른 이미지를 생성한다. 이에 따라 동일한 인물이나 사물을 사용하고 싶은 사용자들은 동일한 객체가 들어간 그림을 일관성 있게 생성할 수 없다. 2) 또한 LLM 과 이미지 생성 AI 와의 결합이 시도 되고 있지만 문장 의미 분석 성능이 부족하다. 이를 해결하기 위해, 자연어 요구사항을 언어학적 기법을 통해 분석하고, 분석 결과를 기반으로 UML 시퀀스 다이어그램 및 3D 객체 생성 메커니즘을 제안한다. 즉 언어학적 분석 기법을 통해, 요구사항의 정확한 의미와 속성을 추출한다. 그런 다음 추출된 정보를 시퀀스 다이어그램과 매핑하여 3D 객체 이미지를 생성한다. 제안하는 방법을 통해 3D 객체 생성의 소프트웨어 개발 공정 사용으로 생산성을 높여 시간과 비용을 단축할 수 있을 것으로 기대한다.