• 제목/요약/키워드: SHAP

검색결과 102건 처리시간 0.022초

머신러닝 기반의 유튜브 먹방 콘텐츠 인기 예측 모델 (A Machine Learning-based Popularity Prediction Model for YouTube Mukbang Content)

  • 서범근;이한준
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.49-55
    • /
    • 2023
  • 본 연구에서는 유튜브 먹방 콘텐츠의 인기를 예측하는 모형을 제안하고 사후 분석을 통하여 먹방 콘텐츠의 인기에 영향을 주는 요인들을 식별하였다. 이를 위해 API와 Pretty Scale을 활용하여 구독자수 상위 먹방 채널들로부터 22,223개 콘텐츠의 정보를 수집하고 Random Forest, XGBoost 및 LGBM 등의 머신러닝 알고리즘을 기반으로 조회수와 좋아요수 예측모델을 구축하였다. SHAP 분석 결과 조회수 예측 모형에서는 구독자수가 예측에 가장 큰 영향을 미치는 반면, 좋아요수 예측 모형에서는 크리에이터의 매력도가 중요변수로 도출되는 등 콘텐츠 조회와 좋아요 반응에 대한 선행요인이 다름을 확인할 수 있었다. 본 연구는 대량의 온라인 콘텐츠를 분석하여 실증 분석을 진행하였다는 점에서 학술적 의의가 있으며 먹방 크리에이터들에게 시청자들의 콘텐츠 소비 경향을 알려주고 상품성 높은 콘텐츠 제작의 가이드를 제공한다는 점에서 실무적인 의의를 지닌다.

Development of AI-based Smart Agriculture Early Warning System

  • Hyun Sim;Hyunwook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.67-77
    • /
    • 2023
  • 본 연구는 스마트팜 환경에서 진행된 혁신적인 연구로, 딥러닝을 기반으로 한 질병 및 해충 탐지 모델을 개발하고, 이를 지능형 사물인터넷(IoT) 플랫폼에 적용하여 디지털 농업 환경 구현의 새로운 가능성을 탐색하였다. 연구의 핵심은 Pseudo-Labeling, RegNet, EfficientNet 등 최신 ImageNet 모델과 전처리 방식을 통합하여, 복잡한 농업 환경에서 다양한 질병과 해충을 높은 정확도로 탐지하는 것이었다. 이를 위해 앙상블 학습 기법을 적용하여 모델의 정확도와 안정성을 극대화했으며, 평균 정밀도(mAP), 정밀도, 재현율, 정확도, 박스 손실 등의 다양한 성능 지표를 통해 모델을 평가하였다. 또한, SHAP 프레임워크를 활용하여 모델의 예측 기준에 대한 깊은 이해를 도모하였고, 이를 통해 모델의 결정 과정을 보다 투명하게 만들었다. 이러한 분석은 모델이 어떻게 다양한 변수들을 고려하여 질병 및 해충을 탐지하는지에 대한 중요한 통찰력을 제공하였다.

빅데이터 기반 2형 당뇨 예측 알고리즘 개발 (Development of Type 2 Prediction Prediction Based on Big Data)

  • 심현;김현욱
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.999-1008
    • /
    • 2023
  • 당뇨병과 같은 만성 질환의 조기 예측은 중요한 이슈이며, 그중에서도 당뇨 예측의 정확도 향상은 매우 중요하다. 당뇨 예측을 위한 다양한 기계 학습 및 딥 러닝 기반 방법론을 도입하고 있으나, 이러한 기술들은 다른 방법론보다 더 우수한 성능을 위해 대량의 데이터를 필요로 하며, 복잡한 데이터 모델 때문에 학습 비용이 높다. 본 연구에서는 pima 데이터셋과 k-fold 교차 검증을 사용한 DNN이 당뇨 진단 모델의 효율성을 감소시킨다는 주장을 검증하고자 한다. 의사 결정 트리, SVM, 랜덤 포레스트, 로지스틱 회귀, KNN 및 다양한 앙상블 기법과 같은 기계 학습 분류 방법을 사용하여 어떤 알고리즘이 최상의 예측 결과를 내는지 결정하였다. 모든 분류 모델에 대한 훈련 및 테스트 후 제안된 시스템은 ADASYN 방법과 함께 XGBoost 분류기에서 최상의 결과를 제공하였으며, 정확도는 81%, F1 계수는 0.81, AUC는 0.84였다. 또한 도메인 적응 방법이 제안된 시스템의 다양성을 보여주기 위해 구현되었다. LIME 및 SHAP 프레임워크를 사용한 설명 가능한 AI 접근 방식이 모델이 최종 결과를 어떻게 예측하는지 이해하기 위해 구현되었다.

Edge Computing Model based on Federated Learning for COVID-19 Clinical Outcome Prediction in the 5G Era

  • Ruochen Huang;Zhiyuan Wei;Wei Feng;Yong Li;Changwei Zhang;Chen Qiu;Mingkai Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권4호
    • /
    • pp.826-842
    • /
    • 2024
  • As 5G and AI continue to develop, there has been a significant surge in the healthcare industry. The COVID-19 pandemic has posed immense challenges to the global health system. This study proposes an FL-supported edge computing model based on federated learning (FL) for predicting clinical outcomes of COVID-19 patients during hospitalization. The model aims to address the challenges posed by the pandemic, such as the need for sophisticated predictive models, privacy concerns, and the non-IID nature of COVID-19 data. The model utilizes the FATE framework, known for its privacy-preserving technologies, to enhance predictive precision while ensuring data privacy and effectively managing data heterogeneity. The model's ability to generalize across diverse datasets and its adaptability in real-world clinical settings are highlighted by the use of SHAP values, which streamline the training process by identifying influential features, thus reducing computational overhead without compromising predictive precision. The study demonstrates that the proposed model achieves comparable precision to specific machine learning models when dataset sizes are identical and surpasses traditional models when larger training data volumes are employed. The model's performance is further improved when trained on datasets from diverse nodes, leading to superior generalization and overall performance, especially in scenarios with insufficient node features. The integration of FL with edge computing contributes significantly to the reliable prediction of COVID-19 patient outcomes with greater privacy. The research contributes to healthcare technology by providing a practical solution for early intervention and personalized treatment plans, leading to improved patient outcomes and efficient resource allocation during public health crises.

지반 조건과 TBM 운영 파라미터를 고려한 디스크 커터 마모 예측 (Prediction of Disk Cutter Wear Considering Ground Conditions and TBM Operation Parameters)

  • 강윤성;고태영
    • 터널과지하공간
    • /
    • 제34권2호
    • /
    • pp.143-153
    • /
    • 2024
  • TBM 공법은 발파 공법에 비해 굴착 중 소음과 진동 수준이 낮고, 안정성이 높은 터널 굴착 공법이며, 전세계적으로 터널 프로젝트에 TBM 공법을 적용하는 사례가 증가하는 추세이다. 디스크 커터는 TBM의 커터헤드에 장착되는 굴착 도구로 지속적으로 막장면 지반과 상호작용하며, 이때 필연적으로 마모가 발생한다. 본 연구에서는 지질 조건과 TBM 운영파라미터, 머신러닝 알고리즘들을 이용하여 디스크 커터 마모를 정량적으로 예측하였다. 디스크커터 마모 예측의 입력변수 중 UCS 데이터의 수가 다른 기계 데이터 및 마모 데이터에 비해 매우 부족하기 때문에, 먼저 TBM 기계 데이터를 이용하여 전체 구간에 대한 UCS 추정을 진행하고, 완성된 전체 데이터로 마모율 계수 예측을 수행하였다. 마모율 계수 예측 모델의 성능을 비교해 본 결과 XGBoost 모델의 성능이 가장 높게 나타났으며, 복잡한 예측 모델의 해석을 위해 SHapley Additive exPlanation (SHAP) 분석을 진행하였다.

설명가능한 인공지능을 활용한 수학교육 연구의 영향력 분석 (Analysis of the impact of mathematics education research using explainable AI)

  • 오세준
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제62권3호
    • /
    • pp.435-455
    • /
    • 2023
  • 본 연구는 수학 교육 분야에서 중요한 영향을 미치는 논문을 판별하고 분석하기 위한 설명가능한 인공지능(XAI) 모델을 개발하였다. 29개 국내외 수학교육 학술지의 논문 메타정보를 활용하여 수학교육 학술연구 네트워크를 구축하였다. 구축된 네트워크는 '논문과 다른 논문의 인용 네트워크', '논문과 저자 네트워크', '논문과 학술지 네트워크', '공동 저자 네트워크', '저자와 소속기관 네트워크' 등 총 5개의 세부 네트워크로 구성되었다. 랜덤포레스트 기계학습 모델을 사용하여 네트워크 내의 개별 논문의 영향력을 평가하였으며, SHAP을 이용해 영향력 있는 논문의 판별 기준을 분석하였다. '논문 네트워크 PageRank', '논문당 인용횟수의 변화량', '총 인용횟수', '저자의 h-index 변화량', '학술지의 논문당 인용횟수' 등이 중요한 판별 요인으로 나타났다. 국내와 국외 수학교육 연구의 판별 패턴을 비교 분석한 결과, 국내 연구에서는 '공동 저자 네트워크 PageRank'의 중요성이 도드라졌다. 본 연구의 XAI 모델은 논문의 영향력 판별 도구로써 연구자에게 논문 작성 시 전략적인 방향성을 제공할 수 있게 해준다. 논문 네트워크 확장, 학술대회 발표, 공동 저술 활동을 통한 저자 네트워크 활성화 등이 논문의 영향력 증진에 크게 기여한다는 결과를 얻었다. 이를 통해 연구자는 학계에서 자신의 연구가 어떠한 평가 기준에 따라 어떻게 인식되고 있는지, 그리고 그 평가에 기여하는 주요 요인이 무엇인지를 명확히 파악할 수 있을 것이다. 본 연구는 설명가능한 인공지능을 활용하여 전통적으로 많은 시간과 비용이 필요하던 수학교육 논문의 영향력 평가 방식을 혁신하였다. 이 방법은 수학교육 연구 뿐만 아니라 다른 학문 분야에서도 활용될 수 있으며, 연구활동의 효율성과 효과성을 향상시킬 것으로 기대된다.

3D 프린팅 소재 화학물질의 독성 예측을 위한 Data-centric XAI 기반 분자 구조 Data Imputation과 QSAR 모델 개발 (Data-centric XAI-driven Data Imputation of Molecular Structure and QSAR Model for Toxicity Prediction of 3D Printing Chemicals)

  • 정찬혁;김상윤;허성구;;신민혁;유창규
    • Korean Chemical Engineering Research
    • /
    • 제61권4호
    • /
    • pp.523-541
    • /
    • 2023
  • 3D 프린터의 활용이 높아짐에 따라 발생하는 화학물질에 대한 노출 빈도가 증가하고 있다. 그러나 3D 프린팅 발생 화학물질의 독성 및 유해성에 대한 연구는 미비하며, 분자 구조 데이터의 결측치로 인해 in silico 기법을 사용한 독성예측 연구는 저조한 실정이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 결측치를 보간하여 3D 프린팅의 독성 및 유해성을 예측한 Data-centric QSAR 모델을 개발하였다. 먼저 MissForest 알고리즘을 사용해 3D 프린팅으로 발생되는 유해물질의 분자표현자 결측치를 보완하였으며, 서로 다른 4가지 기계학습 모델(결정트리, 랜덤포레스트, XGBoost, SVM)을 기반으로 Data-centric QSAR 모델을 개발하여 생물 농축 계수(Log BCF)와 옥탄올-공기분배계수(Log Koa), 분배계수(Log P)를 예측하였다. 또한, 설명 가능한 인공지능(XAI) 방법론 중 TreeSHAP (SHapley Additive exPlanations) 기법을 활용하여 Data-centric QSAR 모델의 신뢰성을 입증하였다. MissForest 알고리즘 기반 결측지 보간 기법은, 기존 분자구조 데이터에 비하여 약 2.5배 많은 분자구조 데이터를 확보할 수 있었다. 이를 바탕으로 개발된 Data-centric QSAR 모델의 성능은 Log BCF, Log Koa와 Log P를 각각 73%, 76%, 92% 의 예측 성능으로 예측할 수 있었다. 마지막으로 Tree-SHAP 분석결과 개발된 Data-centric QSAR 모델은 각 독성치와 물리적으로 상관성이 높은 분자표현자를 통하여 선택함을 설명할 수 있었고 독성 정보에 대한 높은 예측 성능을 확보할 수 있었다. 본 연구에서 개발한 방법론은 다른 프린팅 소재나 화학공정, 그리고 반도체/디스플레이 공정에서 발생 가능한 오염물질의 독성 및 인체 위해성 평가에 활용될 수 있을 것으로 사료된다.

바퀴(Blattella germanica L.)의 생물학적 제어를 위한 토양세균의 분리 및 동정 (Isolation and indentification of soil bacteria for biocontrol the Cockroach(Blattella germanica L.))

  • 이광배;몽룡곤
    • 환경위생공학
    • /
    • 제8권1호
    • /
    • pp.129-138
    • /
    • 1993
  • The marked spread of the cockraches of recent years has raised a great social problem in urban areas. The cockroach have to remove1 because transmit a disease to human as pest insect, but particulars are not yet reported on biological control agent for the cockroach removal. This study was tried for the first time on biological control for the cockroach removal. The obtained results were as follows : 1. The isolated were spore-forming bacillus 1098 strain in soil. The No. 109(TH 109) strain of the among spore-forming bacillus was showed the poisonous against Cockroach. 2. The biological characteristics and flagella antigenicity of the strain is similar to Bacillus thur-ingiensis subsp. indiana. 3. TH 109 strain have the delta-endotoxin of cuboid shap. 4. This delta-endotoxin of product by TH 109 strain was toxic to the cockroach(Blattella gemzanica. L).

  • PDF

토로이드형 공심 초전도 변압기의 특성 (CHARACTERISTICS OF A SUPERCONDUCTING AIR-CORE TRANSFORMER OF TOROIDAL SHAP)

  • 최경달;한송엽
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1991년도 하계학술대회 논문집
    • /
    • pp.27-30
    • /
    • 1991
  • With the recent development of high performance AC superconducting wire of very small ac loss and large current carrying capacity, the possibility of superconducting air core transformer is being studied. The air core transformer has merits of no iron loss, no insulation to the core and no harmonics. But the air core transformer has large exciting current and low magnetic coupling factor. To increase the coupling factor, the transformer of toroidal shape is proposed and designed. (10KVA, 110/220V) Compared with air core transformer of solenoidal shape, the performance is improved. The exciting current occupies about 22% of the rated current.

  • PDF

휘싱 트래클 릴 프레임홀 면의 디버링특성 (Deburring Characteristics of Frame Hole in Fishing Trackle Reel)

  • 김정두
    • 한국공작기계학회:학술대회논문집
    • /
    • 한국공작기계학회 1998년도 춘계학술대회 논문집
    • /
    • pp.203-208
    • /
    • 1998
  • Materials of the Frame hole in fishing trackle reel is made up a number large and small holes. Thus, it is difficult to effective machining. Abrasive flow machining(AFM) is useful to polish a internal or external surface of the 3-dimensional shape parts, which are used in many fields such as aerospace, automative, semi-conductor, and medical component industries. The machining process is that two hydraulic cylinders, which are located face to face, enforce abrasive media to the passage between workpiece and tooling parts alternately, and then the abrasives include in the media pass the passage and polish the surface of workpiece. The media which is made of polymer and abrasives plays the role of the tool for deburring or polishing complex shap workpiece by its viscoelastic characteristics. In this study, the abrasive media for abrasive flow machining was made by mixing viscielastic polymer with alunina and silicon carbide abrasive. Also, we present AFM device design and preliminary results of an investigation in to some aspects of the AFM process performance in fishing trackle reel.

  • PDF