• Title/Summary/Keyword: 데이터생성

Search Result 7,167, Processing Time 0.034 seconds

Design of an Integrated XML Data Generator for the Performance Evaluation of XML DBMSs (XML 데이터베이스 시스템 성능 평가를 위한 통합 XML 데이터 생성기의 설계)

  • Shin, Sun Mi;Jeong, Hoe Jin;Lee, Sang Ho
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.7-10
    • /
    • 2004
  • XML 데이터베이스 시스템이 개발되면 다른 XML 데이터베이스 시스템과의 성능 비교, 또는 자체 기능에 대한 성능 평가를 수행한다. 성능 평가를 수행하기 위해서는 해당 성능 평가에 적합한 XML 데이터를 생성하는 XML 데이터 생성기가 필요하다. 본 논문에서는 지금까지 개발되었던 다양한 XML 데이터 생성기들의 특징 및 장단점을 살펴보고, 이를 기반으로 하나의 사용자 인터페이스를 이용하여 XML 데이터를 생성하는 통합 XML 데이터 생성기의 설계 내용을 기술한다. 통합 XML 데이터 생성기는 레코드 단위의 텍스트 데이터 파일의 내용을 기반으로 XML 데이터를 생성한다. 통합 XML 데이터 생성기는 관계형 데이터베이스 시스템의 데이터를 이용하여 XML 데이터로 생성하는 등 사용자가 제공하는 데이터 활용이 가능하며, 타 XML 데이터 생성기에 비해 다양한 XML 데이터를 생성함으로써 광범위한 XML 데이터베이스 시스템 성능 평가에 이용될 수 있다.

  • PDF

The Extended Generator of Spatiotemporal Datasets (확장된 시공간 데이터 집합 생성기)

  • Lee, Sun-Jun;Kim, Sang-Ho;Ryu, Keun-Ho;Lee, Seong-Ho
    • Annual Conference of KIPS
    • /
    • 2002.04a
    • /
    • pp.67-70
    • /
    • 2002
  • 시공간 접근 방법들을 위한 효율적인 성능평가 환경은 최소한 다음과 같은 모듈들을 포함해야 한다. 종합적인 데이터집합의 생성, 데이터집합의 저장, 접근 구조들의 수집과 실행, 실험적인 결과의 시각화 등이다. 데이터집합 저장 모듈에 초점을 맞추어서 다양한 실제 세계 시나리오를 실험하기 위한 종합적인 데이터의 생성이 요구된다. 과거의 여러 알고리즘들은 작업공간에서 미리 분배된 정적인 공간데이터를 생성하기 위하여 구현되어져왔다. 하지만 시간에 따라 변화하는 공간객체인 시공간 데이터를 생성하기에는 어렵다. 이 논문에서 시공간 데이터 타입의 데이터 생성기에서 고려하여야 할 매개변수들에 대하여 논의한다. "Generate_Spatio_Temporal_Data"라는 알고리즘은 움직이는 점 또는 사각형데이터를 생성하고 거래시간과 유효시간을 구별하지 않았으며 시간 점만을 표현하였다. 이 논문에서는 정확한 시간적 개념을 표현하기 위하여 거래시간과 유효시간간격 모두를 지원하는 데이터 생성기에 관하여 논의하기 위한 알고리즘을 제시하고 실제적인 데이터집합 생성을 위한 매개변수들을 나타낸다.

  • PDF

Implementation of Testdata Generation Tool for MPEG-2 TS (MPEG-2 TS 형태의 테스트 데이터 자동 생성기의 구현)

  • 염선화;최병주;박기웅
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.427-429
    • /
    • 2000
  • 멜티미디어 표준인 MPEG-2 TS 형태의 테스트 데이터를 자동 생성하는 도구인 TDGT(Test Data Generation Tool)를 설계하고 구현하였다. TDGT는 테스터로부터 기본적인 입력사항을 받아들이고 이를 기반으로 테스트 데이터를 자동 생성한 후 결과물로 테스트 데이터 스크립트 파일과 테스트 데이터 시나리오 파일, 테스트 데이터 커버리지 분석 결과를 테스터에게 제공한다. TDGT는 복잡하고 방대한 테스트 데이터를 생성하는데 요구되는 노력, 시간을 상당히 줄여주며 전문적인 지식이 없는 이도 쉽게 테스트 데이터를 생성할 수 있게 한다. 본 논문은 TDGT가 테스트 데이터를 자동 생성하는 구조와 TDGT의 분석을 제시하였으며 이 시스템의 prototype을 기술한다.

  • PDF

A Data Generator for Database Benchmarks and its Performance Evaluation (데이터베이스 벤치마크를 위한 데이터 생성기와 성능 평가)

  • Ok, Eun-Taek;Jeong, Hoe-Jin;Lee, Sang-Ho
    • The KIPS Transactions:PartD
    • /
    • v.10D no.6
    • /
    • pp.907-916
    • /
    • 2003
  • Database benchmarks require efficient of large-scale data. This presents the system architecture, control flows, and characteristics of the data generator we have developed. The data generator features generation of large-scale data, column-by-column data generation, a number of data distributions and verification, and real data generation. An extensive conparison with other data generators in terms of function is also presented. Finally, empirical performance experiments between RAID systems and non-RAID one have been conducted to alleviate I/O bottleneck. The test results can serve as guidelines to help confifure system architecture.

Ontology-based Metadata Automated Generation for Personal Media (온톨로지 기반 개인 미디어 메타데이터 자동 생성)

  • Choi, Jung-Hwa;Seo, Hee-Cheol;Park, Young-Tack
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.340-345
    • /
    • 2006
  • 개인 디지털 콘텐츠 증가에 따른 개인 미디어의 관리를 위해 대량의 메타데이터를 자동으로 생성하는 연구가 반드시 필요하다. 본 논문에서는 온톨로지 기반의 추론을 이용하여 개인 미디어 메타데이터를 자동으로 생성하는 방법을 제안한다. 제안한 방법은 부족한 정보로부터 적합한 의미를 추출하여 메타데이터를 자동 생성하므로 콘텐츠관리의 어려운 문제점을 해결한다. 본 논문에서 제안하는 방법을 사용자가 메모를 부착하기만 하면, 온톨로지 기반 추론을 통해 메타데이터를 자동 생성하는 방법으로 다음과 같은 세가지 기술과 특징을 갖는다. 첫째, 개인 미디어 온톨로지를 정의한다. 둘째, 미디어 메타데이터 표준을 정의한다. 미디어의 종류가 다르더라도 정의한 표준의 키워드만 추출할 수 있다면 미디어의 통합관리가 가능하다. 셋째, 메타데이터 자동 생성 기술을 연구한다. 단순히 온톨로지에 정의된 키워드의 의미만을 보지 않고, 온톨로지 기반의 추론엔진을 이용하여 사용자를 중심으로 관련 키워드의 관계를 고려한 메타데이터 생성의 정확성을 높인다. 이러한 기술을 기반으로 시맨틱 검색도 가능하며, 기존의 메타데이터 저작도구와 비교하여 보다 정확한 메타데이터 자동생성과 검색이 가능하다.

  • PDF

Design of Vehicle Location Data Generator based on a User defined Scenario (사용자 지정 시나리오에 기반 한 차량 위치 데이터 생성기 설계)

  • 정홍진;정영진;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.142-144
    • /
    • 2004
  • 다양한 지리 관측 기술 및 GPS 그리고 무선통신 기술의 발달로 인해, 해수의 흐름 변화 관측이나 PDA를 장착한 물류 차량 관리와 같이 시간에 따라 이동하는 여러 객체들의 변화를 추적하고 관리하는 것이 용이해지고 있다. 그리고. 이로 인해 지능형 교통 시스템. 물류 차량 관리 시스템 등이 활발히 개발되고 있다. 그러나 개발된 시스템에서 차량 운송 계획 평가 및 테스트를 할 경우 차량의 실제 데이터가 부족하기 때문에 적절한 평가 및 다양한 테스트를 하기 힘들고, 실생활에 알맞은 시스템을 만들기 어려움 점이 있다. 이렇게 부족한 차량 데이터를 보충하기 위해, 대부분의 연구에서는 몇몇의 이동 객체 위치 데이터 생성기를 활용하고 있다. 그러나 기존의 이동 객체 데이터 생성기는 단순히 정규 분포, 가우스 분포. 랜덤 데이터. 도로 정보 등을 고려하여 데이터를 생성하기 때문에. 사용자가 물류 수송 계획 등에 활용하기 위해 의도한 시나리오에 따른 데이터를 생성하지 못하고 있다. 따라서, 이 논문에서는 차량 위치 데이터 생성기에 사용자가 지정한 시나리오를 생성, 저장하는 이동 객체 패턴 제공기를 추가하여. 사용자 지정 시나리오를 지원하는 차량 위치 데이터 생성기를 설계한다 이 논문에서 설계된 차랑 위치 데이터 생성기는 사용자가 원하는 계획대로 차량의 위치 정보를 생성함으로써, 물류 수송 및 도로 건설계획 등을 검토할 때 도움이 될 수 있을 것이다.

  • PDF

Learning data production technique for visual optimization of generative models (생성모델의 시각적 최적화를 위한 학습데이터 제작기법)

  • Cho, Hyeongrae;Park, Gooman
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.13-14
    • /
    • 2021
  • 본 논문은 생성모델의 학습데이터 제작기법에 대한 실험 및 결과와 향후 관련 연구의 방향을 기술한다. GAN으로 대표되는 생성모델이 아티스트에게 얼마만큼의 만족도와 영감을 주는지를 비교 실험 및 평가하기 위해서는 정제된 학습데이터가 필요하다. 하지만 현실적으로 아티스트의 작품은 데이터 세트를 만들기에는 그 수가 적고 인공지능이 학습하기에도 정제되어있지 않다. 2차 가공작업을 통하여 아티스트의 원본 작업과 유사한 데이터 세트의 구축은 생성모델의 성능향상을 위해 매우 중요하다. 연구의 결과 생성모델이 표현하기 어려운 스타일의 작가 작품을 선정한 뒤 최적의 학습데이터를 만들기 위한 다양한 실험과 기법을 통해 구축한 데이터 세트를 생성모델 알고리즘에 적용하고 실험을 통해 창작자의 작품제작 의도인 작가 진술에 최대한 유사한 이미지의 생성과 더 나아가 작가가 생각하지 못했던 창조적 모방의 결과물을 도출하였고 작가평가를 통해 높은 만족도를 얻었다.

  • PDF

XML Schema Generating Technique based on Metadata Registry (메타데이터 레지스트리 기반의 XML 스키마 생성 기법)

  • 이태웅;권주흠;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.181-183
    • /
    • 2002
  • 데이터베이스 개발에 있어서 다른 도구에 의한 다양한 스키마의 생성은 데이터베이스간의 통합을 어렵게 만들고 있다. 이러한 이질적 문제를 해결하고자 메타데이터 레지스트리를 이용한 방안이 활발히 연구되고 있다. 메타데이터 레지스트리(Metadata Registry)는 공유와 전달 목적으로 한 메타데이터를 표준화시킨 것이다. 이는 정보 통합 측면에 대하여 로컬 스키마를 공유화된 메타데이터를 가지고 생성함으로써 글로벌 스키마로의 통합이 가능하다. 따라서 이러한 메타데이터를 기반으로 하여 공유할 수 있는 로컬스키마의 작성 기법이 필요하다. 본 논문에서 메타데이터 레지스트리를 이용하여 XML 스키마를 생성하는 방안을 제안한다. 메타데이터를 XML 스키마로 변환하는 규칙을 제시하고 이를 기반으로 한 XML 스키마 생성 시스템을 설계하였다.

  • PDF

WeXGene: Web-based XML Data Generator (WeXGene: 웹 기반 XML 데이터 생성기)

  • Shin Sun Mi;Jeong Hoe Jin;Lee Sang Ho
    • The KIPS Transactions:PartD
    • /
    • v.12D no.2 s.98
    • /
    • pp.199-210
    • /
    • 2005
  • We need XML generate various kinds of XML data to evaluate XML database systems. Existing XML data generators are developed to generate XML data that are suitable for particular evaluation methods, and their functionalities are limited in terms of generating XML data This paper introduces a new XML data generator, WeXGene, that not only improves the drawbacks of existing data generators but also adds new data generation functionalities. For generating XML data WeXGene uses the user data files and the structure definition files, which specify SDTD(Symbolic DTD) or input parameters. The user data file is a text data file that has column data or row data. It is also possible that WeXGene generates XML data without accessing the user data file. This paper presents the design details, overall system architecture, and data generation process of WeXGene. An analytic comparison with other XML data generators is also presented.

Automatic Generation of Training Corpus for a Sentiment Analysis Using a Generative Adversarial Network (생성적 적대 네트워크를 이용한 감성인식 학습데이터 자동 생성)

  • Park, Cheon-Young;Choi, Yong-Seok;Lee, Kong Joo
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.389-393
    • /
    • 2018
  • 딥러닝의 발달로 기계번역, 대화 시스템 등의 자연언어처리 분야가 크게 발전하였다. 딥러닝 모델의 성능을 향상시키기 위해서는 많은 데이터가 필요하다. 그러나 많은 데이터를 수집하기 위해서는 많은 시간과 노력이 소요된다. 본 연구에서는 이미지 생성 모델로 좋은 성능을 보이고 있는 생성적 적대 네트워크(Generative adverasarial network)를 문장 생성에 적용해본다. 본 연구에서는 긍/부정 조건에 따른 문장을 자동 생성하기 위해 SeqGAN 모델을 수정하여 사용한다. 그리고 분류기를 포함한 SeqGAN이 긍/부정 감성인식 학습데이터를 자동 생성할 수 있는지 실험한다. 실험을 수행한 결과, 분류기를 포함한 SeqGAN 모델이 생성한 문장과 학습데이터를 혼용하여 학습할 경우 실제 학습데이터만 학습 시킨 경우보다 좋은 정확도를 보였다.

  • PDF