• Title/Summary/Keyword: 선별성능

Search Result 442, Processing Time 0.036 seconds

High-quality data collection for machine learning using block chain (블록체인을 활용한 양질의 기계학습용 데이터 수집 방안 연구)

  • Kim, Youngrang;Woo, Junghoon;Lee, Jaehwan;Shin, Ji Sun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.23 no.1
    • /
    • pp.13-19
    • /
    • 2019
  • The accuracy of machine learning is greatly affected by amount of learning data and quality of data. Collecting existing Web-based learning data has danger that data unrelated to actual learning can be collected, and it is impossible to secure data transparency. In this paper, we propose a method for collecting data directly in parallel by blocks in a block - chain structure, and comparing the data collected by each block with data in other blocks to select only good data. In the proposed system, each block shares data with each other through a chain of blocks, utilizes the All-reduce structure of Parallel-SGD to select only good quality data through comparison with other block data to construct a learning data set. Also, in order to verify the performance of the proposed architecture, we verify that the original image is only good data among the modulated images using the existing benchmark data set.

Research on Selecting Influential Climatic Factors and Optimal Timing Exploration for a Rice Production Forecast Model Using Weather Data

  • Jin-Kyeong Seo;Da-Jeong Choi;Juryon Paik
    • Journal of the Korea Society of Computer and Information
    • /
    • v.28 no.7
    • /
    • pp.57-65
    • /
    • 2023
  • Various studies to enhance the accuracy of rice production forecasting are focused on improving the accuracy of the models. In contrast, there is a relative lack of research regarding the data itself, which the prediction models are applied to. When applying the same dependent variable and prediction model to two different sets of rice production data composed of distinct features, discrepancies in results can occur. It is challenging to determine which dataset yields superior results under such circumstances. To address this issue, by identifying potential influential features within the data before applying the prediction model and centering the modeling around these, it is possible to achieve stable prediction results regardless of the composition of the data. In this study, we propose a method to adjust the composition of the data's features in order to select optimal base variables, aiding in achieving stable and consistent predictions for rice production. This method makes use of the Korea Meteorological Administration's ASOS data. The findings of this study are expected to make a substantial contribution towards enhancing the utility of performance evaluations in future research endeavors.

Discrete Wavelet Transform-based Screening Process for a Li-Ion Battery (이산 웨이블릿 변환(DWT)를 이용한 리튬 이온 배터리 스크리닝 방법)

  • Kim, J.H;Chun, C.Y.;Hur, I.N.;Cho, B.H.;Lee, S.J.
    • Proceedings of the KIPE Conference
    • /
    • 2011.11a
    • /
    • pp.299-300
    • /
    • 2011
  • 상이한 전기화학적 특성을 가진 단위 셀들을 미리 선별하여 팩의 안전한 운용 및 배터리 관리 시스템의 성능 향상을 위해 스크리닝(screening)은 필수적이다. 그러므로, 본 논문에서는 이산 웨이블릿 변환(DWT;discrete wavelet transform)을 이용한 리튬 이온 배터리 스크리닝 방법을 제안한다. 제안된 방식은 축소된 하이브리드 자동차용 전류프로파일을 통해 얻어진 충방전 전압을 이산 웨이블릿 변환에 적용하여 저주파 전압 성분과 고주파 전압 성분으로 분리하고, 각 단계별로 얻어진 성분들의 통계처리를 실시하여 스크리닝을 구현한다. 특히, 마지막 단계에서의 저주파 전압 성분과 고주파 전압 성분은 배터리의 State-of-health(SOH)를 예측하기 위한 성분으로 정의된다.

  • PDF

Optimal Screening Procedures with Dichotomous Performance and Continuous Screening Variables (이치형(二値型) 성능변수(性能變數) 대신 연속형(連續型) 변수(變數)를 이용(利用)한 최적(最適) 선별(選別) 검사방식(檢査方式))

  • Bae, Do-Seon;Kim, Sang-Bok;An, Sang-Sik
    • Journal of Korean Institute of Industrial Engineers
    • /
    • v.14 no.1
    • /
    • pp.83-89
    • /
    • 1988
  • Optimal screening procedures with dichotomous performance variable T and continuous screening variable X are presented for assuring with a specified degree of confidence that at least ${\ell}$ out of m items found acceptable in screening inspection are conforming. It is assumed that T is a Bernoulli random variable and that the conditional distribution of X given T=t is normal. When m is also to be determined, optimal m and cut-off value of X minimizing the total expected cost are obtained. Cases of known and unknown parameters are considered and for unknown parameter cases, Bayesian approaches are used to find the optimal screening procedures.

  • PDF

A Study on Structural Analysis of Color Discerning Device for the Performance Enhance (Color Discerning Device의 구조해석을 통한 성능향상에 대한 연구)

  • Kim, Sung-Hyun;Lee, Kyu-Ho;Chung, Jin-Tai
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 2006.11a
    • /
    • pp.571-576
    • /
    • 2006
  • A Color Discerning Device(CDD) is the equipment to use in Rice Processing Complex(RPC). By use a high-speed charge-coupled device camera, CDD can sorting discolored grain according to light and shade. The existing CDD's driving performance is not so good as overseas machine. Besides, transportation process causes a defect in the mechanism from impact or harmonic excitation or etc. This study is represented the problem of CDD through modal analysis and static analysis by using ANSYS workbench. To analysis the problem of driving condition, devide each part of CDD for performed modal analysis. The problem of driving condition and transportation process solved by carry out modal analysis and static analysis.

  • PDF

A Management System for Object Optimization in HOST Mainframe (호스트 메인프레임 환경의 데이터베이스를 위한 객체(Object) 최적화 관리 시스템)

  • Jung, Sung-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.279-282
    • /
    • 2006
  • 데이터베이스는 매우 복잡한 성격을 지니고 있으며, 일반적으로 한 조직의 모든 데이터를 모아놓으므로 대형화되는 것이 보통이다. 따라서 데이터베이스는 항시 많은 데이터들이 생성 및 갱신을 반복한다. 이에 데이터베이스의 구성요소인 객체 또한 생성 및 변경을 거듭한다. 즉, 이러한 데이터의 증가 및 갱신으로 인하여 처음 생성되었을 때의 객고의 성능 및 저장 공간에 대한 이용은 향후 지속적인 관리가 없이는 보장받지 못한다. 이에 데이터베이스를 관리하는 사람들은 많은 인적 물적 자원을 할애하여 객체를 관리하고 최적의 상태로 만들기 위하여 노력한다. 본 논문에서는 이러한 일련의 행위들들 시스템에서 자동으로 자원을 수집하고 수집된 자원을 분석하여 시스템 특성을 반영한 관리기준에 부합하는 객체를 선별하여, 온라인 REORG(on-line reorganization) 작업을 통한 객체의 관리를 자동화 하여 보다 안정적인 데이터베이스 관리 및 데이터베이스의 관리의 효율성을 높이고. 데이터베이스 관리자의 생산성을 향상시키는데 기여 하고자 한다.

  • PDF

Monitoring Tools for Efficient Overload Measurements in Apache Kafka (Apache Kafka에서 효율적인 과부하 측정을 위한 모니터링 도구)

  • Bang, Jiwon;Son, Siwoon;Moon, Yang-Sae;Choi, Mi-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.52-54
    • /
    • 2017
  • 실시간으로 빠르게 발생하는 대용량 데이터를 다루기 위해 Apache Storm, Apache Spark 등 실시간 데이터 스트림 처리 기술에 대한 연구가 활발하다. 대부분의 실시간 처리 기술들은 단독으로 사용하기에 어려움이 있으며, 데이터 스트림의 입출력을 위해 메시징 시스템과 함께 사용하는 것이 일반적이다. Apache Kafka는 대표적인 분산 메시징 시스템으로써, 실시간으로 발생하는 대용량의 로그 데이터를 전달하는데 특화된 시스템이다. 현재 Kafka를 위한 다양한 성능 모니터링 도구들이 존재한다. 이러한 모니터링 도구들은 Kafka에서 처리되는 데이터의 양 이외에도 유입 데이터의 크기, 수집 속도, 처리 속도 등 다양한 데이터들을 관찰할 수 있다. 본 논문은 Kafka에서 제공하는 도구와 오픈 소스로 제공되는 여러 개의 도구들을 비교하여, 향후 Kafka의 로드 쉐딩에 대한 연구에 적용할 수 있는 최적의 모니터링 도구를 선별하고자 한다.

Implementation of Thesaurus Constructor and Visual Browser Based on Object-Oriented Paradigm (객체 지향 개념을 이용한 시소러스 구축기 및 시각화 브라우져의 구현)

  • 김기현;최재훈;한종진;양재동;금창섭
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.336-338
    • /
    • 1998
  • 시소러스는 구축 방법에 따라 매뉴얼 시소러스와 통계적 시소러스로 구분된다. 매뉴얼 시소러스는 정확한 의미 표현이 가능하지만 구축과정에 많은 비용이 소요되며, 통계적 시소러스는 자동으로 구축될 수는 있지만 개념간 의미 표현력이 부족하여 만족할 만한 검색 성능 향상을 기대할 수 없다. 따라서, 본 논문에서는 메뉴얼 시소러스에 객체 지향 개념을 적용하여 구축 비용을 감소시킬 수 있는 시소러스 구축기와 데이터 추상화 기법을 이용하여 선별적으로 개념들 간의 관계를 쉽게 참조할 수 있는 시소러스 시각화 브라우져를 구현하였다. 이 시스템은 시소러스 구축 과정에서 한 사람 이상의 전문가에게 일관된 관점을 제공하며 사용자에게는 높은 정확률의 검색 질의를 구성할 수 있도록 지원한다.

User Popularity based Cache Replacement Algorithm for Multimedia Streaming in Proxy Server (멀티미디어 스트리밍을 위한 프록시 서버에서의 사용자 선호도 기반 캐쉬 교환 알고리즘)

  • 이준표;박성한
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.412-414
    • /
    • 2004
  • 대용량의 멀티미디어 데이터들을 다수의 시용자가 동시에 요구할 경우 접속이 끊기거나 데이터의 손실과 같은 접속 성능이 현저하게 저하되는 문제가 발생할 수 있다. 이는 대부분의 사용자들의 요청을 원거리의 Central Server가 단독으로 처리하기 때문에 발생하는 문제이다. 띠라서 Central Sever의 Load 감소와 초기 지연시간 및 비디오 패킷의 손실의 문제점을 해결하기 위해 프록시 서버를 사용자의 근거리에 위치시키는 방법을 이용한다. 대용랑의 멀티미디어 데이터들을 복잡한 인터넷의 중간경로를 거치지 않고 다수의 사용자들에게 직접 전달함으로써 데이터의 손실을 방지함과 동시에 보다 안정적이고 빠른 속도로 제공하는 것이 가능하다. 특징적으로 프록시 서버는 Central Server에 비해 비교적 제한된 용랑을 가지고 있다. 따라서 본 논문에서는 사용자의 선호도를 기반으로 하여 앞으로 요구학 것이라고 예측되는 비디오 데이터들만을 선별적으로 저장하도록 하는 알고리즘을 제안한다. 시뮬레이션을 통해 제안하는 캐쉬 교환 알고리즘을 기존의 알고리즘과 비교, 관찰한 결과 상대적으로 높은 Hit rate가 나타남을 확인하였다.

  • PDF

다중 생체인식 전용 칩셋 설계

  • Kim Ki-Hyun;Yoo Jang-Hee;Chung Kyo-Il
    • Review of KIISC
    • /
    • v.16 no.3
    • /
    • pp.49-54
    • /
    • 2006
  • 임베디드 시스템 환경에서 실시간으로 얼굴, 그리고 홍채, 지문 등의 생체인식을 위한 시스템 구현을 위해서는 전용의 칩셋이 필요하다. 본 연구에서는 생체인식 알고리즘을 소프트웨어로 구현 및 검증한 후 임베디드 시스템에서 성능을 시험하여 실시간 처리를 어렵게 하는 각 생체인식 알고리즘의 많은 계산량을 요구하는 부분을 선별하여 하드웨어로 구현하도록 설계하였다. 따라서 각 생체인식 알고리즘은 소프트웨어와 하드웨어 부분으로 나누어져 구현되며, 이들의 효율적인 연동에 의해 다중 생체인식 시스템의 실시간 처리는 가능하게 된다. 칩셋으로 구현되는 부분은 얼굴인식의 얼굴 검출을 위한 Adaboost 알고리즘이 구현되며, 홍채인식인 경우 홍채의 외부/내부 경계 구하기 및 극좌표 알고리즘이 구현되고, 지문인식의 경우에는 지문 맵 정보 도출 알고리즘 부분이 구현된다.