• Title/Summary/Keyword: 벤치마크데이터

Search Result 273, Processing Time 0.04 seconds

A Integrated Suite for Database Benchmarks (데이터베이스 벤치마크를 위한 통합 도구)

  • Jeong Hoe-Jin;Lee Sang-Ho
    • The KIPS Transactions:PartD
    • /
    • v.13D no.2 s.105
    • /
    • pp.165-174
    • /
    • 2006
  • As new database systems are developed or new functions are added to existing database systems, database developers or users would like to evaluate new database systems or new functions. This paper presents an integrated database benchmark suite. The integrated suite offers genetic benchmarks, custom benchmark, and hybrid benchmarks to users on a unified Web user interface. With regard to text data generation, the integrated suite supports eight data distributions with three data types. The integrated suite can also generate XML data in three different ways. Users can run benchmarks in realistic environments by performing the workload generation facility of the integrated suite, which generates composite workloads similar to real-world workloads. Using supporting tools, users can easily implement new generic and custom benchmarks in the integrated suite. An illustrative demonstration to add a new custom benchmark into the integrated suite is presented.

Automated Benchmark Management Tool for DBMS Performance Evaluation (DBMS 성능 평가를 위한 자동화된 벤치마크 관리기)

  • 심재희;차상균
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.157-159
    • /
    • 2003
  • 정보 통신 산업의 발달로 인해 데이터의 양이 점차 증가하고 고성능의 데이터 접근이 필요한 분야가 증가됨에 따라 DBMS의 성능에 대한 관심이 높아지고 있다. 따라서 DBMS 벤더들은 계속적으로 새로운 기술을 도입하여 확장 가능한 고성능의 시스템을 지원하는데 노력하고 있다. 그러나 새로운 기술에 대한 충분하고도 광범위한 테스트가 이뤄지지 않는다면 시스템의 성능과 안정성 등에 예상치 못한 문제가 생기기 마련이다. 따라서 벤치마크를 통하여 시스템의 취약점을 알아내고 기술의 질적 평가를 하는 과정이 필수적이지만, 벤치마크 프로그램을 작성하고 수행하는 과정에 상당히 오랜 시간이 걸리기 때문에 시스템에 대한 충분한 테스트를 빠르고 용이하게 하기가 힘들다. 이에 본 논문에서는 이런 문제점을 해결할 수 있는 방안으로 사용자의 특정한 응용 도메인에서 수행될 작업부하 프로그램을 간단히 작성할 수 있으며 그 외의 나머지 벤치마크 과정을 자동화하는. DBMS 성능 평가를 위한 자동화된 벤치마크 관리기를 설계하고 구현하였다. 본 논문에서 제안한 자동화된 DBMS 벤치마크 관리기를 사용하면 사용자는 간단한 코드 작성만으로도 응용 도메인의 벤치마크를 용이하게 할 수 있다.

  • PDF

BST-IGT Model: Synthetic Benchmark Generation Technique Maintaining Trend of Time Series Data

  • Kim, Kyung Min;Kwak, Jong Wook
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.2
    • /
    • pp.31-39
    • /
    • 2020
  • In this paper, we introduce a technique for generating synthetic benchmarks based on time series data. Many of the data measured on IoT devices have a time series characteristic that measures numerical changes over time. However, there is a problem that it is difficult to model the data measured over a long period as generalized time series data. To solve this problem, this paper introduces the BST-IGT model. The BST-IGT model separates the entire data into sections that can be easily time-series modeled, collects the generated data into templates, and produces new synthetic benchmarks that share or modify characteristics based on them. As a result of making a new benchmark using the proposed modeling method, we could create a benchmark with multiple aspects by mixing the composite benchmark with the statistical features of the existing data and other benchmarks.

A Study on Methodology on Building NLI Benchmark Dataset in korean (한국어 추론 벤치마크 데이터 구축을 위한 방법론 연구)

  • Han, Jiyoon;Kim, Hansaem
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.292-297
    • /
    • 2020
  • 자연어 추론 모델은 전제와 가설 사이의 의미 관계를 함의와 모순, 중립 세 가지로 판별한다. 영어에서는 RTE(recognizing textual entailment) 데이터셋과 다양한 NLI(Natural Language Inference) 데이터셋이 이러한 모델을 개발하고 평가하기 위한 벤치마크로 공개되어 있다. 본 연구는 국외의 텍스트 추론 데이터 주석 가이드라인 및 함의 데이터를 언어학적으로 분석한 결과와 함의 및 모순 관계에 대한 의미론적 연구의 토대 위에서 한국어 자연어 추론 벤치마크 데이터 구축 방법론을 탐구한다. 함의 및 모순 관계를 주석하기 위하여 각각의 의미 관계와 관련된 언어 현상을 정의하고 가설을 생성하는 방안에 대하여 제시하며 이를 바탕으로 실제 구축될 데이터의 형식과 주석 프로세스에 대해서도 논의한다.

  • PDF

Design and Implementation of a Benchmark to Evaluate the Performance of a Main Memory Database System (주기억 데이터베이스 시스템의 성능평가를 위한 벤치마크 설계 및 구현)

  • 임한성;김경창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.118-120
    • /
    • 2002
  • 본 논문에서는 주기억 데이터베이스 시스템의 메모리 벤치마크를 설계하고 실제 사용되는 주기억 데이터베이스 시스템에 설계된 벤치마크를 구현하였다. 벤치마크를 통해서 주기억 데이터베이스 시스템에서 이용된 메모리 최적화 기법을 통해 줄어든 메모리 양의 평가와 주기억 데이터베이스에 저장된 데이터에 비례해서 업무 작업 시에 필요로 하는 메모리 소요량을 예측할 수 있고, 여러 데이터베이스간의 상대적인 비교를 할 수 있도록 한다

  • PDF

Benchmark Data File Format for 3D Object Search System (3D 객체 검색시스템을 위한 벤치마크 데이터 파일포맷)

  • Shin Sung-Sik;Gwun Ou-Bong;Song Ju-Whan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.106-108
    • /
    • 2006
  • 멀티미디어와 인터넷 기술이 성숙되어감에 따라 3D 객체가 콘텐츠를 작성하는데 많이 이용되고 있고 더불어 3D 객체의 검색시스템에 대한 연구가 시작되고 있다. 이에 따라 검색시스템을 평가하기 위해서는 표준화된 3D 벤치마크 데이터가 필요하다. 본 논문에서는 검색용 3D 벤치마크 데이터 파일을 만드는데 기반이 되는 새로운 3D 그래픽스 파일포맷을 제안한다. 제안한 파일포맷은 렌더링보다 검색효율을 목표로 하기 때문에 기하학적인 정보이외의 다른 정보는 줄이고 검색 속도와 편리성을 함께 고려하였다.

  • PDF

A Data Generator for Database Benchmarks and its Performance Evaluation (데이터베이스 벤치마크를 위한 데이터 생성기와 성능 평가)

  • Ok, Eun-Taek;Jeong, Hoe-Jin;Lee, Sang-Ho
    • The KIPS Transactions:PartD
    • /
    • v.10D no.6
    • /
    • pp.907-916
    • /
    • 2003
  • Database benchmarks require efficient of large-scale data. This presents the system architecture, control flows, and characteristics of the data generator we have developed. The data generator features generation of large-scale data, column-by-column data generation, a number of data distributions and verification, and real data generation. An extensive conparison with other data generators in terms of function is also presented. Finally, empirical performance experiments between RAID systems and non-RAID one have been conducted to alleviate I/O bottleneck. The test results can serve as guidelines to help confifure system architecture.

Generating A Synthetic Multimodal Dataset for Vision Tasks Involving Hands (손을 다루는 컴퓨터 비전 작업들을 위한 멀티 모달 합성 데이터 생성 방법)

  • Lee, Changhwa;Lee, Seongyeong;Kim, Donguk;Jeong, Chanyang;Baek, Seungryul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.1052-1055
    • /
    • 2020
  • 본 논문에서는 3D 메시 정보, RGB-D 손 자세 및 2D/3D 손/세그먼트 마스크를 포함하여 인간의 손과 관련된 다양한 컴퓨터 비전 작업에 사용할 수 있는 새로운 다중 모달 합성 벤치마크를 제안 하였다. 생성된 데이터셋은 기존의 대규모 데이터셋인 BigHand2.2M 데이터셋과 변형 가능한 3D 손 메시(mesh) MANO 모델을 활용하여 다양한 손 포즈 변형을 다룬다. 첫째, 중복되는 손자세를 줄이기 위해 전략적으로 샘플링하는 방법을 이용하고 3D 메시 모델을 샘플링된 손에 피팅한다. 3D 메시의 모양 및 시점 파라미터를 탐색하여 인간 손 이미지의 자연스러운 가변성을 처리한다. 마지막으로, 다중 모달리티 데이터를 생성한다. 손 관절, 모양 및 관점의 데이터 공간을 기존 벤치마크의 데이터 공간과 비교한다. 이 과정을 통해 제안된 벤치마크가 이전 작업의 차이를 메우고 있음을 보여주고, 또한 네트워크 훈련 과정에서 제안된 데이터를 사용하여 RGB 기반 손 포즈 추정 실험을 하여 생성된 데이터가 양질의 질과 양을 가짐을 보여준다. 제안된 데이터가 RGB 기반 3D 손 포즈 추정 및 시맨틱 손 세그멘테이션과 같은 품질 좋은 큰 데이터셋이 부족하여 방해되었던 작업에 대한 발전을 가속화할 것으로 기대된다.

Improvement of BigCloneBench Using Tree-Based Convolutional Neural Network (트리 기반 컨볼루션 신경망을 이용한 BigCloneBench 개선)

  • Park, Gunwoo;Hong, Sung-Moon;Kim, Hyunha;Doh, Kyung-Goo
    • Journal of Software Assessment and Valuation
    • /
    • v.15 no.1
    • /
    • pp.43-53
    • /
    • 2019
  • BigCloneBench has recently been used for performance evaluation of code clone detection tool using machine learning. However, since BigCloneBench is not a benchmark that is optimized for machine learning, incorrect learning data can be created. In this paper, we have shown through experiments using machine learning that the set of Type-4 clone methods provided by BigCloneBench can additionally be found. Experimental results using Tree-Based Convolutional Neural Network show that our proposed method is effective in improving BigCloneBench's dataset.

A Genomes Analysis Benchmark in High Performance Computing (고성능 컴퓨팅 환경에서 유전체 서열 분석 벤치마크)

  • Choi, Jae-Hun;Jung, Ho-Youl;Park, Soo-Jun;Choi, Wan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.30-32
    • /
    • 2012
  • 본 논문에서는 고성능 컴퓨팅 환경에서 유전체 서열 분석 도구들을 벤치마크 하기 위한 시스템을 개발하고 실제 유전체 데이터를 이용하여 성능을 비교하였다. 이 벤치마크 시스템은 유전체 분석 파이프라인 절차에 따라 다양한 분석 도구들을 CPU 멀티 코어와 GPU 매니 코어 환경에서 선택적으로 구동할 수 있도록 지원한다. 따라서, 서로 다른 환경에서 수행된 다양한 유전자 분석 도구의 성능을 실제 유전체 서열 데이터를 이용하여 비교하고 시각화할 수 있다.