• Title/Summary/Keyword: 데이터 비교

Search Result 12,458, Processing Time 0.037 seconds

A Data Generator for Database Benchmarks and its Performance Evaluation (데이터베이스 벤치마크를 위한 데이터 생성기와 성능 평가)

  • Ok, Eun-Taek;Jeong, Hoe-Jin;Lee, Sang-Ho
    • The KIPS Transactions:PartD
    • /
    • v.10D no.6
    • /
    • pp.907-916
    • /
    • 2003
  • Database benchmarks require efficient of large-scale data. This presents the system architecture, control flows, and characteristics of the data generator we have developed. The data generator features generation of large-scale data, column-by-column data generation, a number of data distributions and verification, and real data generation. An extensive conparison with other data generators in terms of function is also presented. Finally, empirical performance experiments between RAID systems and non-RAID one have been conducted to alleviate I/O bottleneck. The test results can serve as guidelines to help confifure system architecture.

Comparison of MODIS Land Surface Temperature and Inland Water Temperature (내륙 수온과 MODIS 지표 온도 데이터의 비교 평가)

  • Na, Yu-Gyung;Kim, Juwon;Lim, Eunha;Park, Woo Jung;Kim, Min Jun;Choi, Jinmu
    • Journal of the Korean association of regional geographers
    • /
    • v.19 no.2
    • /
    • pp.352-361
    • /
    • 2013
  • This paper aims to analyze the root mean square errors of MODIS LST data and inland water temperature measurement data in order to use MODIS LST data as an input of numerical weather prediction model. MODIS LST data from July 2011 to June 2012 were compared to water temperature measurement data in the automated water quality measurement network. MODIS data have two composites: day-time and night-time. Monthly errors of day-time and night-time LST range $2{\sim}8^{\circ}C$ and $3{\sim}12^{\circ}C$, respectively. Temporally, monthly errors of day-time LST are less in fall and those of night-time LST are less in summer. Spatially, on the four major rivers including the Han, Nakdong, Geum, and Yeongsan rivers, the errors of Yeongsan river were the smallest, which location is the south-most among them. In this study, the errors of MODIS LST as an input of numerical weather prediction model were analyzed and the results can be used as an error level of MODIS LST data for inaccessible areas such as North Korea.

  • PDF

Performance Comparison of CDMA and TDMA protocols in radio access system for Integrated Voice/Data Services (음성 및 데이터서비스를 위한 무선접속시스템에서 CDMA와 TDMA방식의 성능비교)

  • 고종하;양영님;이정규
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.24 no.6A
    • /
    • pp.820-831
    • /
    • 1999
  • In this paper, we have compared the performance of a D-TDMA protocol with that of a CDMA protocol, in radio access system for integrated voice/data services.The D-TDMA protocol is based on a generic dynamic channel assignment approach to be followed a combination of “circuit mode” reservation for voice calls, along with dynamic first-come-first served assignment of remaining capacity for data messages. In the CDMA protocol, we have used the voice activity detection to reduce the interface power of other mobiles in internal and external cells, and analyzed the interference power ratio. Also we have computed BER(Bit Error Rate) by using this interference power ratio and evaluated voice blocking probability(voice packet loss probability) and data transmission delay, according to average data length and average data arrival rate.We have found the CDMA protocol achieves comparatively higher performance for short data length, regardless of data arrival rate. Otherwise, the data transmission delay of D-TDMA protocol is shorter than that of the CDMA protocol for long data message.

  • PDF

Building a Korean Text Summarization Dataset Using News Articles of Social Media (신문기사와 소셜 미디어를 활용한 한국어 문서요약 데이터 구축)

  • Lee, Gyoung Ho;Park, Yo-Han;Lee, Kong Joo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.8
    • /
    • pp.251-258
    • /
    • 2020
  • A training dataset for text summarization consists of pairs of a document and its summary. As conventional approaches to building text summarization dataset are human labor intensive, it is not easy to construct large datasets for text summarization. A collection of news articles is one of the most popular resources for text summarization because it is easily accessible, large-scale and high-quality text. From social media news services, we can collect not only headlines and subheads of news articles but also summary descriptions that human editors write about the news articles. Approximately 425,000 pairs of news articles and their summaries are collected from social media. We implemented an automatic extractive summarizer and trained it on the dataset. The performance of the summarizer is compared with unsupervised models. The summarizer achieved better results than unsupervised models in terms of ROUGE score.

Real-time stream data processing method based on IoT node cluster (IoT 노드 클러스터 기반의 실시간 스트림 데이터 처리 방안)

  • Lim, Hwan-Hee;Kim, Dong-Hyun;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.1-4
    • /
    • 2019
  • Edge Computing 환경에서는 데이터 처리와 시스템 제어를 위한 별도의 서버가 존재하지 않는다. 서버를 통한 중앙통제 방식이 아닌 Edge computing에 사용된 IoT기기들이 연동되어 데이터 분산 처리와 연산을 통해 전체 시스템이 동작된다. 이러한 Edge computing 시스템 구조 특성상 전체 시스템이 과부하를 피하기 위해 각 IoT 기기에서 동시다발적으로 감지되는 실시간 상황 정보를 효율적으로 처리 하여야한다. 이에 따라 실시간 상황 정보를 효율적으로 처리하거나, 다양한 데이터 분석처리 알고리즘들이 연구 개발되어 데이터 처리에 적용되어 왔다. 하지만 데이터의 정보 흐름과 타입에 초점을 맞춘 것이 아니라 예상분석 및 획일화된 알고리즘을 통해서 분석되기 때문에 해당 플랫폼이 주로 지향하는 데이터 형식에 맞지 않으면 성능저하를 수반하며 사용에 제약이 많은 문제점이 있다. 따라서 본 논문에서는 IoT 환경에서 실시간 반응성 향상을 목표로 오픈소스 기반 스트림 데이터 처리 방법에 대한 비교 분석과 Fast-reaction을 위한 데이터 처리 도구 비교 분석을 연구를 진행한다.

  • PDF

A Study for Improving the Performance of Data Mining Using Ensemble Techniques (앙상블기법을 이용한 다양한 데이터마이닝 성능향상 연구)

  • Jung, Yon-Hae;Eo, Soo-Heang;Moon, Ho-Seok;Cho, Hyung-Jun
    • Communications for Statistical Applications and Methods
    • /
    • v.17 no.4
    • /
    • pp.561-574
    • /
    • 2010
  • We studied the performance of 8 data mining algorithms including decision trees, logistic regression, LDA, QDA, Neral network, and SVM and their combinations of 2 ensemble techniques, bagging and boosting. In this study, we utilized 13 data sets with binary responses. Sensitivity, Specificity and missclassificate error were used as criteria for comparison.

Application of LiDAR Data for Volume determination of Terrain (지형의 체적 산정을 위한 LiDAR 자료의 활용)

  • Kang Joon-Mook;Min Kwan-Sik;Park Joung-Hyun;Kang Young-Mi
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2006.05a
    • /
    • pp.181-186
    • /
    • 2006
  • 오늘날 토목공사에서 토량을 산정하기 위해서는 많은 지형정보를 필요로 한다. 지형정보 획득의 한 방법으로 라이다측량을 실시하여 지형의 표고를 획득 할 수 있으며, 라이다 데이터는 기존의 일반측량, 사진측량, 원격탐측과 비교하여 좀 더 빠르고 정확한 지표의 표고를 획득할 수 있다. CPS 데이터와 함께 획득한 라이다 데이터는 지상의 수치표고모델 및 등고선 추출이 가능하며, 이 수치표고모델을 이용하여 토량을 산정하고 기존의 1:1000 수치지형도에서 산정한 토량과 정량적 비교를 수행하였다 비교결과 라이다 데이터가 수치지형도 상에서의 토량 산정 보다 더 정확한 결과를 얻을 수 있었다.

  • PDF

Comparison of Sequential Multi-Modality Data Effects on Memory Recall (기억 회상 현상에 대한 순차적 멀티 모달리티 데이터의 영향 비교)

  • Yun, Ung-Chang;Fareed, Umer;Jang, Byeong-Tak
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2010.05a
    • /
    • pp.66-71
    • /
    • 2010
  • 본 논문에서는 멀티 모달리티가 인간의 기억 현상 중에서 특히 회상 현상에 도움이 될 것이 라는 아이디어를 인간 실험과 컴퓨터 시뮬레이션을 통해서 비교 확인한다. 우리는 순차적 멀티모달리티 정보가 기억회상 현상에 미치는 영향을 알아보기 위해서 확률 하이퍼그래프 메모리모델을 사용하여 컴퓨터 시뮬레이션을 수행하였으며, 시뮬레이션 결과를 동일한 데이터를 사용한 인간 실험 결과와 비교하였다. 본 실험에서는 TV 드라마의 비디오 데이터를 이용하여 이전시점의 사진과 문장 정보가 다음 시점의 문장 생성에 미치는 영향을 확인하였다. 본 실험의 목적은 이전 시점의 문장 정보와 문장/사진 정보를 활용하여 멀티 모달리티의 영향을 확인하는 것이며 다양한 시점의 정보를 활용하여 순차성이 회상에 갖는 영향을 확인하는 것이다. 이를 통해서 기억 회상 현상에 있어서 멀티 모달리티가 미치는 영향과 순차적 데이터가 미치는 영향을 보일 수 있었으며, 기계를 통해서 인간의 기억 회상 현상을 재현할 수 있는 시뮬레이션 모델을 구현 하는데 실마리를 제공하였다.

  • PDF

Exploration of data alignment methods for bioassay analysis (생물 검정 데이터 정렬기법들의 비교 및 분석)

  • Kim, Han-Joo;Lee, Sung-Min;Park, Seung-Hyun;Yoon, Sung-Roh
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.453-455
    • /
    • 2012
  • 생물 검정(Bioassay)이란 생체 조직이나 분자의 구조 분석이나 기능 해석, 화합물이나 약에 의한 영향성을 실험하기 위해 실험체 조직과 약물의 상호작용에 의한 생성물의 양적 세기를 측정하는 과학적 실험 방법의 총칭이다. 바이오 어세이 실험 방법은 Gas Chromatography, 시험관 전기영동(Capillary Electrophoresis), 핵자기공명(NMR) 등의 다양한 실험 데이터를 포함한다. 결과로 생성된 실험 데이터를 정량적으로 분석하기 위해서는 일관성을 위해 얻어진 데이터를 정렬하는(alignment) 과정을 거쳐야 한다. 본 연구에서는 알려진 정렬 알고리즘들을 비교하기 위해, 알고리즘의 유형별로 분류하고 그 결과물을 분석하여 성능을 비교함과 동시에 특성을 파악하고자 한다.

A research on improving correctness of cardiac disorder data by using the Decision Tree Classifier (Decision Tree 분류기를 사용한 심전도 데이터 정확도 향상에 관한 연구)

  • Lee, Hyun-Ju;Shin, Dong-Il;Shin, Dong-Kyoo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.507-509
    • /
    • 2012
  • 심전도 질환 데이터는 일반적으로 분류기를 사용한 실험이 많다. 심전도 신호는 QRS-Complex와 R-R interval을 추출하는 경우가 많은데 본 실험에서는 R-R interval을 추출하여 실험하였다. 심전도 데이터의 분류 실험은 일반적으로 SVM(Support Vector Machine)과 MLP(Multilayer Perceptron)으로 실험되지만 본 실험은 Decision Tree를 사용하여 정확도 향상을 추구하였다. 그리고 정확도 비교 분석을 위해 SVM과 MLP 분류기 실험을 같이 수행하였고, 동일한 데이터와 간격으로 실험한 타 논문의 결과와 비교해 보았다. Decision Tree를 다른 분류기와 타 논문의 결과와 비교해 보니 정확도 부분에서는 Decision Tree가 가장 우수하였다.