• 제목/요약/키워드: Data-driven models

검색결과 257건 처리시간 0.027초

Clustering-based identification for the prediction of splitting tensile strength of concrete

  • Tutmez, Bulent
    • Computers and Concrete
    • /
    • 제6권2호
    • /
    • pp.155-165
    • /
    • 2009
  • Splitting tensile strength (STS) of high-performance concrete (HPC) is one of the important mechanical properties for structural design. This property is related to compressive strength (CS), water/binder (W/B) ratio and concrete age. This paper presents a clustering-based fuzzy model for the prediction of STS based on the CS and (W/B) at a fixed age (28 days). The data driven fuzzy model consists of three main steps: fuzzy clustering, inference system, and prediction. The system can be analyzed directly by the model from measured data. The performance evaluations showed that the fuzzy model is more accurate than the other prediction models concerned.

농업 디지털 트윈 구축 전략에 대한 연구 (Research on Construction Strategy of Agricultural Digital Twins)

  • 김한재;도준영;이용환
    • 반도체디스플레이기술학회지
    • /
    • 제23권1호
    • /
    • pp.79-83
    • /
    • 2024
  • Digital Twin technology is rapidly transforming various industries by providing comprehensive virtual models that replicate physical objects or processes. In the context of agriculture, digital twin can be a game-changer. This technology can help in creating precise simulations of farming scenarios, thereby enabling farmers to make data-driven decisions and optimize farm operations. The potential benefits include improved crop yields, resource efficiency, and environmental sustainability. However, the implementation of digital twin technology in agriculture poses challenges, such as data management issues and the need for robust IoT infrastructure. Despite these hurdles, the future of digital twin in agriculture looks promising, with ongoing research and developments aimed at overcoming these obstacles.

  • PDF

A REVIEW OF STUDIES ON OPERATOR'S INFORMATION SEARCHING BEHAVIOR FOR HUMAN FACTORS STUDIES IN NPP MCRS

  • Ha, Jun-Su;Seong, Poong-Hyun
    • Nuclear Engineering and Technology
    • /
    • 제41권3호
    • /
    • pp.247-270
    • /
    • 2009
  • This paper reviews studies on information searching behavior in process control systems and discusses some implications learned from previous studies for use in human factors studies on nuclear power plants (NPPs) main control rooms (MCRs). Information searching behavior in NPPs depends on expectancy, value, salience, and effort. The first quantitative scanning model developed by Senders for instrument panel monitoring considered bandwidth (change rate) of instruments as a determining factor in scanning behavior. Senders' model was subsequently elaborated by other researchers to account for value in addition to bandwidth. There is also another type of model based on the operator's situation awareness (SA) which has been developed for NPP application. In these SA-based models, situation-event relations or rules on system dynamics are considered the most significant factor forming expectancy. From the review of previous studies it is recommended that, for NPP application, (1) a set of symptomatic information sources including both changed and unchanged symptoms should be considered along with bandwidth as determining factors governing information searching (or visual sampling) behavior; (2) both data-driven monitoring and knowledge-driven monitoring should be considered and balanced in a systematic way; (3) sound models describing mechanisms of cognitive activities during information searching tasks should be developed so as to bridge studies on information searching behavior and design improvement in HMI; (4) the attention-situation awareness (A-SA) modeling approach should be recognized as a promising approach to be examined further; and (5) information displays should be expected to have totally different characteristics in advanced control rooms. Hence much attention should be devoted to information searching behavior including human-machine interface (HMI) design and human cognitive processes.

Schema- and Data-driven Discovery of SQL Keys

  • Le, Van Bao Tran;Sebastian, Link;Mozhgan, Memari
    • Journal of Computing Science and Engineering
    • /
    • 제6권3호
    • /
    • pp.193-206
    • /
    • 2012
  • Keys play a fundamental role in all data models. They allow database systems to uniquely identify data items, and therefore, promote efficient data processing in many applications. Due to this, support is required to discover keys. These include keys that are semantically meaningful for the application domain, or are satisfied by a given database. We study the discovery of keys from SQL tables. We investigate the structural and computational properties of Armstrong tables for sets of SQL keys. Inspections of Armstrong tables enable data engineers to consolidate their understanding of semantically meaningful keys, and to communicate this understanding to other stake-holders. The stake-holders may want to make changes to the tables or provide entirely different tables to communicate their views to the data engineers. For such a purpose, we propose data mining algorithms that discover keys from a given SQL table. We combine the key mining algorithms with Armstrong table computations to generate informative Armstrong tables, that is, key-preserving semantic samples of existing SQL tables. Finally, we define formal measures to assess the distance between sets of SQL keys. The measures can be applied to validate the usefulness of Armstrong tables, and to automate the marking and feedback of non-multiple choice questions in database courses.

인공위성 원격 탐사 정보가 자료 기반 모형의 미계측 유역 하천유출 예측성능에 미치는 영향 분석 (Analysis of the Impact of Satellite Remote Sensing Information on the Prediction Performance of Ungauged Basin Stream Flow Using Data-driven Models)

  • 서지유;정하은;원정은;최시중;김상단
    • 한국습지학회지
    • /
    • 제26권2호
    • /
    • pp.147-159
    • /
    • 2024
  • 부족한 하천유출 관측 데이터는 모델 보정 작업을 어렵게 만들어 모델의 성능 향상을 제한한다. 위성 기반 원격탐사 자료는 수문 관련 데이터의 확보에 적극적으로 활용될 수 있으므로 새로운 대안이 될 수 있다. 최근에는 여러 연구를 통하여 기존의 개념적/물리적 모델보다는 인공지능을 이용한 해법이 더 적절하다는 평가를 받고 있다. 본 연구에서는 다양한 순환 신경망들과 의사결정나무 기반 알고리즘들을 결합한 자료 기반 접근 방식을 제안하였다. 또한 인공지능 학습을 위하여 인공위성 원격탐사 정보의 활용성을 조사하였다. 본 연구에서 위성영상은 MODIS와 SMAP의 자료가 사용된다. 공적으로 공개된 25개 유역의 자료를 사용하여 제안된 접근 방식을 검증하였다. 전통적인 지역화 접근법에서 착안하여 모든 유역의 자료를 통합하여 하나의 자료 기반 모델을 학습하는 전략을 채택하였으며, Leave-one-out cross-validation 지역화 설정을 이용하여 하나의 모델이 다양한 유역의 하천유출을 예측함으로써 제안된 접근 방식의 잠재력을 평가하였다. GRU + Light GBM 모델이 대상 유역에 적합한 모델 조합으로 판명되었으며(25개 미계측 유역 일 하천유량 예측 모형효율계수 평균 0.7187) 하천유출이 매우 작은 시기를 제외하면 우수한 미계측 유역의 하천유출 예측 성능을 보여주었다. 인공위성 원격탐사 정보의 영향력은 최대 10% 정도로 파악되었으며, 위성 정보의 추가 적용이 풍수기 또는 평수기보다는 저수기 또는 갈수기의 하천유출 예측에 더 큰 영향을 미쳤다.

효율적 공간 형상화 및 건물성능분석을 위한 스케치 정보 기반 BIM 모델 자동생성 프레임워크 개발 (A Framework Development for Sketched Data-Driven Building Information Model Creation to Support Efficient Space Configuration and Building Performance Analysis)

  • 공병찬;정운성
    • 한국건설관리학회논문집
    • /
    • 제25권1호
    • /
    • pp.50-61
    • /
    • 2024
  • 사용자의 공간 요구사항 중심의 평면계획에 대한 수요가 증가함에 따라 소형 주택시장이 지속적으로 성장하고 있다. 하지만 건축주는 공간 구성이나 비용 견적과 같은 근거를 기반으로 평면요구사항을 개진하는데 매우 제한적인 수단을 활용하고 있어 건축가와 같은 전문가들과의 소통에 많은 어려움을 겪고 있다. 본 연구의 목적은 스케치 정보 기반의 공간 요구사항을 BIM 모델의 3D 건물구성요소로 자동 변환하여 사용자의 공간에 대한 이해를 돕고, 초기 설계단계에서 예산 산정을 지원하기 위한 건물성능분석 정보를 제공할 수 있는 프레임워크 개발에 있다. 본 연구의 방법론은 프로세스 모델 개발, 프레임워크 구현 및 검증단계로 구성되었다. 프로세스 모델 개발은 프레임워크의 데이터 흐름을 묘사하고 프레임워크에 필요한 기능을 정의하는 단계이며, 프레임워크 구현은 프로세스 모델을 기반으로 시스템 인터페이스와 사용자 인터페이스를 개발하고, 이종 시스템 간의 연동 방식을 정의하는 단계이다. 검증단계는 개발된 프레임워크가 스케치 정보로 표현된 공간 요구사항을 BIM 모델의 벽, 바닥, 지붕과 같은 건물 구성요소 객체들로 자동 변환할 수 있는가를 검증하였다. 또한 프레임워크가 BIM 모델을 기반으로 재료 및 에너지 비용을 자동으로 산출할 수 있는가를 검증하였다. 프레임워크를 통해 사용자는 스케치 정보를 기반으로 3D 건물 구성요소를 효율적으로 생성할 수 있으며, 생성된 BIM 모델을 통해 공간을 이해하고 건물성능분석 정보를 제공받을 수 있다.

A Comparative Study on Requirements Analysis Techniques using Natural Language Processing and Machine Learning

  • Cho, Byung-Sun;Lee, Seok-Won
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권7호
    • /
    • pp.27-37
    • /
    • 2020
  • 본 연구의 목적은 다양한 도메인에 대한 소프트웨어 요구사항 명세서로부터 수집된 요구사항을 데이터로 활용하여 데이터 중심적 접근법(Data-driven Approach)의 연구를 통해 요구사항을 분류한다. 이 과정에서 기존 요구사항의 특징과 정보를 바탕으로 다양한 자연어처리를 이용한 데이터 전처리와 기계학습 모델을 통해 요구사항을 기능적 요구사항과 비기능적 요구사항으로 분류하고 각 조합의 결과를 제시한다. 그 결과로, 요구사항을 분류하는 과정에서, 자연어처리를 이용한 데이터 전처리에서는 어간 추출과 불용어제거와 같은 토큰의 개수와 종류를 감소하여 데이터의 희소성을 좀 더 밀집형태로 변형하는 데이터 전처리보다는 단어 빈도수와 역문서 빈도수를 기반으로 단어의 가중치를 계산하는 데이터 전처리가 다른 전처리보다 좋은 결과를 도출할 수 있었다. 이를 통해, 모든 단어를 고려하여 가중치 값은 기계학습에서 긍정적인 요인을 볼 수 있고 오히려 문장에서 의미 없는 단어를 제거하는 불용어 제거는 부정적인 요소로 확인할 수 있었다.

초기 소량 데이터와 RNN을 활용한 루머 전파 추적 기법 (Initial Small Data Reveal Rumor Traits via Recurrent Neural Networks)

  • 권세정;차미영
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.680-685
    • /
    • 2017
  • 온라인 소셜미디어의 등장으로 방대한 사용자 데이터가 수집되고 이는 루머의 탐지와 같은 복잡하고 도전적인 사회 문제를 자료 기반 기법으로 해결할 수 있게끔 한다. 최근 딥러닝 기반 모델들이 이러한 문제를 해결하기 위한 빠르고 정확한 기법 중의 하나로서 소개되었다. 하지만 기존에 제시된 모델들은 전파 종료 후 작동하거나 오랜 관찰기간을 필요로 하여 활용성이 제한된다. 이 연구에서는 초기 소량 데이터만을 활용하는 recurrent neural networks (RNNs) 기반의 빠른 루머 분류 알고리즘을 제안한다. 제시된 모델은 소셜미디어 스트림을 시계열 자료로 변환하여 사용하며, 이 때 시계열 데이터는 팔로워 수와 같이 정보 전파자 관련 정보는 물론 주어진 컨텐츠에서 추론한 언어심리학적 감성의 점수로 구성된다. 수백만의 트윗을 포함하는 498개의 실제 루머 및 494개의 비루머 사례 분석을 통해 이 연구는 제안하는 RNN 기반 모델이 초기 30개의 트윗 만으로도 (초기 수시간) 0.74 F1의 높은 성능을 보임을 확인한다. 이러한 결과는 실제 응용가능한 수준의 빠르고 효율적인 루머 분류 알고리즘 개발의 초석이 된다.

데이터 기반 학교 운영을 위한 사물인터넷(IoT) 활용 환경 설계 (Designing a data based school with Internet of Things)

  • 계보경
    • 교육녹색환경연구
    • /
    • 제20권3호
    • /
    • pp.25-32
    • /
    • 2021
  • 본 연구는 사물인터넷(IoT) 기술을 학습에 활용한 문헌과 사례를 분석하고, 관련 분야 전문가, 현장 교사, 기술 전문가 대상 FGI를 통해 IoT가 학습 개선을 위해 활용될 수 있는 학습환경 데이터와 유형별 활용 시나리오 모델을 정의하였다. 더불어 이를 바탕으로 개발된 프로토타입을 실제 학습환경에 시범 적용하여 실시간 데이터의 수집 및 분석과 활용 관점에서 검증함으로써 학교 현장에서 IoT 기술을 활용할 수 있는 실천적인 방안을 도출하였다. 본 연구는 실제 학교현장의 제약사항을 고려한 IoT를 활용한 학습 및 학습환경을 실제 구축하고 적용한 선험적 사례로서 의의가 있다.

Systems-Level Analysis of Genome-Scale In Silico Metabolic Models Using MetaFluxNet

  • Lee, Sang-Yup;Woo, Han-Min;Lee, Dong-Yup;Choi, Hyun-Seok;Kim, Tae-Yong;Yun, Hong-Seok
    • Biotechnology and Bioprocess Engineering:BBE
    • /
    • 제10권5호
    • /
    • pp.425-431
    • /
    • 2005
  • The systems-level analysis of microbes with myriad of heterologous data generated by omics technologies has been applied to improve our understanding of cellular function and physiology and consequently to enhance production of various bioproducts. At the heart of this revolution resides in silico genome-scale metabolic model, In order to fully exploit the power of genome-scale model, a systematic approach employing user-friendly software is required. Metabolic flux analysis of genome-scale metabolic network is becoming widely employed to quantify the flux distribution and validate model-driven hypotheses. Here we describe the development of an upgraded MetaFluxNet which allows (1) construction of metabolic models connected to metabolic databases, (2) calculation of fluxes by metabolic flux analysis, (3) comparative flux analysis with flux-profile visualization, (4) the use of metabolic flux analysis markup language to enable models to be exchanged efficiently, and (5) the exporting of data from constraints-based flux analysis into various formats. MetaFluxNet also allows cellular physiology to be predicted and strategies for strain improvement to be developed from genome-based information on flux distributions. This integrated software environment promises to enhance our understanding on metabolic network at a whole organism level and to establish novel strategies for improving the properties of organisms for various biotechnological applications.