• 제목/요약/키워드: 데이터 모델 평가

검색결과 2,530건 처리시간 0.029초

딥러닝 기반 80대·90대·100대 남녀 대상 폐암 진단 후 사망률 예측에 관한 연구 (A Study on the Prediction of Mortality Rate after Lung Cancer Diagnosis for Men and Women in 80s, 90s, and 100s Based on Deep Learning )

  • 변경근;이덕규;이세영
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권2호
    • /
    • pp.87-96
    • /
    • 2023
  • 최근 의학계에서도 딥러닝 기술을 이용한 질병의 치료결과 예측 연구가 활발하다. 그러나, 소규모 환자 데이터와 특정한 딥러닝 알고리즘을 선택·활용, 연구를 진행하여 특정 조건 아래에서 의미 있는 결과를 보여주었다. 본 연구에서는 연구 결과의 일반화를 위하여 환자 대상을 좀 더 확대·세분화하여 80대·90대·100대 남녀 대상으로 폐암 진단 후 사망률 예측 연구 결과를 도출하였다. 건강보험심사평가원의 대규모 진료 정보와 다종의 딥러닝 알고리즘을 제공하는 AutoML을 이용, 80대·90대·100대 남녀의 폐암 진단 후 84개월간의 사망률 예측을 위해 Decision Tree, Random Forest, Gradient Boosting, XGBoost, Logistic Regression 등 5개 알고리즘별 모델을 생성하고 이를 통해 예측 성능을 비교하고 사망률에 영향을 미치는 요인에 대한 분석도 추진하였다. 연구 결과, 80대와 90대에서 남성이 여성보다 사망 예측률이 더 높았으며 100대에서는 여성의 사망 예측률이 남성보다 높게 나타났다. 그리고 사망률에 가장 큰 영향을 미치는 요인으로는 치료기간으로 분석되었다.

인공지능 기법을 이용한 조영제 부작용 예측 연구 (Contrast Media Side Effects Prediction Study using Artificial Intelligence Technique)

  • 김상현
    • 한국방사선학회논문지
    • /
    • 제17권3호
    • /
    • pp.423-431
    • /
    • 2023
  • 본 연구의 목적은 환자의 신체정보와 인공지능 기법을 활용하여 부작용에 영향을 미치는 인자들을 분석하고 조영제 부작용의 정도를 예측하여 이를 완화하는 기초자료로 활용되고자 한다. 연구에 사용한 데이터는 서울 소재 종합병원의 검진을 시행한 CT 검사 58,000건 중 조영제 부작용이 발생한 1,235건 중 과거력 조사에서 조영제 부작용이 없었던 606명의 검사자를 대상자로 하였다. 606개 샘플 중 70%는 훈련 셋으로 사용하고 나머지 30%는 검증을 위한 테스트 셋으로 사용하였다. 나이, BMI(Body Mass Index), GFR(Glomerular Filtration Rate), BUN(Blood Urea Nitrogen), GGT(Gamma Glutamyl Transgerase), AST(Aspartate Amino Transferase,), and ALT(Alanine Amiono Transferase)의 feature를 독립변수로 조영제 중증도를 목표변수로 사용하였다. AdaBoost, Tree, Neural network, SVM, Random foest 알고리즘을 통해 AUC(Area under curve), CA(Classification Accuracy), F1, Precision, Recall을 파악하였다. 분류 예측에 사용된 알고리즘 중 가장 높은 평가지표를 나타내 것은 AdaBoost와 Random Forest이다. 모든 모델의 예측에서 가장 큰 요인은 GFR, BMI, GGT 이였다. 이는 신장 여과 기능, 비만에 따라 주입되는 조영제 양의 차이와 대사증후군의 여부에 따라 조영제 부작용 중증도에 영향을 미치는 것을 알 수 있었다.

머신러닝 기반의 신약 재창출 관련 연구 동향 분석 (Analysis of Research Trends Related to drug Repositioning Based on Machine Learning)

  • 유소연;임규건
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.21-37
    • /
    • 2022
  • 신약을 개발하는 한 가지 방법의 하나인 신약 재창출(Drug Repositioning)은 이미 사람들에게 사용할 수 있도록 승인된 약물들이 다른 용도로 사용되도록 하여 새로운 적응증을 발견하는 유용한 방법이다. 최근에는 머신러닝 기술의 발달로 방대한 생물학적 정보를 분석하여 신약 개발에 활용하는 경우가 증가하고 있다. 신약 재창출에 머신러닝 기술을 활용하면 효과적인 치료법을 신속하게 찾아내는 데 도움을 줄 것이다. 현재 심각한 급성 호흡기 증후군인 코로나바이러스(COVID-19)에 의한 신종 질병으로 전 세계가 힘든 시간을 보내고 있다. 이미 임상적으로 승인된 약물의 용도를 변경하는 신약 재창출은 COVID-19 환자를 치료하기 위한 치료제의 대안이 될 수 있다. 본 연구는 머신러닝 기법을 활용하여 신약 재창출 분야에 대한 연구 동향을 살펴보고자 한다. Pub Med에서 웹 스크래핑 기법을 사용하여 'Drug Repositioning'이라는 키워드로 총 4,821건의 논문을 수집하였다. 데이터 전처리 후, 4,419건의 논문을 대상으로 빈도분석, LDA 기반 토픽모델링, Random Forest 분류 분석 및 예측 성능평가를 수행하였다. Word2vec 모델을 기반으로 연관어를 분석하였고, PCA 차원 축소 후 K-Means 군집화하여 레이블을 생성한 후, t-SNE 알고리즘을 이용하여 논문이 형성하고 있는 그룹을 시각화하고, LDA 결과에 계층적 군집화를 적용하여 히트맵으로 시각화하였다. 본 연구는 신약 재창출과 관련된 연구 주제가 무엇인지를 파악하고, 머신러닝 알고리즘을 사용하여 대량의 문헌에서 의미 있는 주제를 도출하고 시각화하는 방법을 제시하였다. 향후 신약 재창출 분야의 연구나 개발 전략을 수립하기 위한 기초자료로 활용되는 데 도움을 줄 것이라고 기대한다.

CNN 기반 스펙트로그램을 이용한 자유발화 음성감정인식 (Spontaneous Speech Emotion Recognition Based On Spectrogram With Convolutional Neural Network)

  • 손귀영;권순일
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.284-290
    • /
    • 2024
  • 음성감정인식(Speech Emotion Recognition, SER)은 사용자의 목소리에서 나타나는 떨림, 어조, 크기 등의 음성 패턴 분석을 통하여 감정 상태를 판단하는 기술이다. 하지만, 기존의 음성 감정인식 연구는 구현된 시나리오를 이용하여 제한된 환경 내에서 숙련된 연기자를 대상으로 기록된 음성인 구현발화를 중심의 연구로 그 결과 또한 높은 성능을 얻을 수 있지만, 이에 반해 자유발화 감정인식은 일상생활에서 통제되지 않는 환경에서 이루어지기 때문에 기존 구현발화보다 현저히 낮은 성능을 보여주고 있다. 본 논문에서는 일상적 자유발화 음성을 활용하여 감정인식을 진행하고, 그 성능을 향상하고자 한다. 성능평가를 위하여 AI Hub에서 제공되는 한국인 자유발화 대화 음성데이터를 사용하였으며, 딥러닝 학습을 위하여 1차원의 음성신호를 시간-주파수가 포함된 2차원의 스펙트로그램(Spectrogram)로 이미지 변환을 진행하였다. 생성된 이미지는 CNN기반 전이학습 신경망 모델인 VGG (Visual Geometry Group) 로 학습하였고, 그 결과 7개 감정(기쁨, 사랑스러움, 화남, 두려움, 슬픔, 중립, 놀람)에 대해서 성인 83.5%, 청소년 73.0%의 감정인식 성능을 확인하였다. 본 연구를 통하여, 기존의 구현발화기반 감정인식 성능과 비교하면, 낮은 성능이지만, 자유발화 감정표현에 대한 정량화할 수 있는 음성적 특징을 규정하기 어려움에도 불구하고, 일상생활에서 이루어진 대화를 기반으로 감정인식을 진행한 점에서 의의를 두고자 한다.

수평 배관의 메탄 폭발특성에 있어서 불균일성 혼합기의 영향 (Influence of Mixture Non-uniformity on Methane Explosion Characteristics in a Horizontal Duct)

  • 한우섭;최이락;김형욱;임진호
    • Korean Chemical Engineering Research
    • /
    • 제62권1호
    • /
    • pp.27-35
    • /
    • 2024
  • 메탄, 프로판 등을 주성분으로 하는 연료가스는 폭발위험장소에서 사용될 수 있으며, 누출로 인한 공정조건의 영향으로 불균일한 혼합기를 형성할 수 있다. 균일한 혼합기를 대상으로 측정된 문헌 데이터를 이용한 화재 폭발 위험성 평가, 손상 예측은 가스 누출에 의한 실제 폭발 사고와 다른 결과를 얻을 수 있다. 본 연구에서는 가스 누출시 나타날 수 있는 농도 변화에 있어서 불균일성 혼합기의 폭발압력, 화염속도 등의 폭발특성을 조사하였다. 길이 0.82 m의 스테인리스 재질의 밀폐 배관에서 수행하였으며 컬러 초고속 카메라 및 압력 센서를 사용하여 관찰하였다. 또한 배관 내의 시간에 따른 농도차이 변화에 대해 회귀분석 모델을 사용하여 불균일 혼합물의 정량화 방법을 제안하였다. 본 연구의 농도 불균일성 조건에 있어서 메탄 폭발 시 전파화염은 불균일성 농도가 높아짐에 따라 화염 면적의 증가가 관찰되었고 이는 난류 화염의 주름진 화염 구조와 유사하였다. 메탄의 최대압력까지 걸리는 소요시간은 불균일성이 클수록 감소하였고, 폭발압력은 불균일성이 클수록 증가하였다. 농도가 불균일한 메탄의 KG(폭연지수)의 범위는 1.30~1.58 [MPa·m/s]으로서 메탄의 농도가 균일성에서 불균일성로 변화하면서 17.7% 증가하였다.

PCA-DEA 모델을 기반으로 한 중국 주요연안 항만의 운영 효율성 평가 (Evaluation of the operational efficiency of major coastal ports in China based on the PCA-DEA model)

  • 장해청;이향숙
    • 한국항만경제학회지
    • /
    • 제40권1호
    • /
    • pp.87-118
    • /
    • 2024
  • 국내 운송을 담당하는 연안항들은 국가와 도시의 발전에 필수적인 역할을 하고 있다. 항만 효율성은 항만 경쟁력을 확보하기 위한 중요한 요소로, 이에 대한 연구는 기존 문헌에서 지속적으로 진행되었다. 중국의 경우 주로 지방의 항만 클러스터에 대한 연구에 초점을 맞추고 있는데, 미시적 관점에서만 접근하고 있으며, 최신 자료도 부재한 상황이다. 따라서 본 연구에서는 최신 자료를 활용하여 중국 상위 17개 연안항의 운영 효율성을 종합적으로 분석하고자 한다. 본 연구에서는 컨테이너 처리량을 산출변수로 선정하고, 크게 토지, 자본, 노동, 인프라에 속하는 13개 지표로부터 PCA(Principal Component Analysis) 분석을 통해 4개의 투입변수를 최종 선정하였다.그런 다음 17개 항구의 운영 효율성을 DEA (데이터 포위 분석)로 분석했습니다. 분석 결과, 상하이, 닝보-저우산, 광저우, 샤먼, 둥관의 5개 항만이 효율적인 반면, 나머지 12개의 항만은 상대적으로 비효율적인 것으로 나타났다. 본 연구는 중국의 연안항을 보다 거시적 관점에서 비교·분석한 것으로 이를 통해 상대적 비교가 가능하며, 향후 항만의 발전 전략 및 정책 수립을 위한 기초자료로 활용할 수 있을 것이다.

Learning Progression을 적용한 중·고등학생의 '물질의 입자성'에 관한 지식과 미시적 표상에 대한 특성 분석 (Using a Learning Progression to Characterize Korean Secondary Students' Knowledge and Submicroscopic Representations of the Particle Nature of Matter)

  • 신남수;고은정;최취임;정대홍
    • 한국과학교육학회지
    • /
    • 제34권5호
    • /
    • pp.437-447
    • /
    • 2014
  • Learning Progressions(학습진행과정, 이하 LP)은 "과학의 핵심 아이디어(core idea) 혹은 과학 활동(scientific practices) 이해 과정을 상대적으로 단순한 체계에서 전문가의 지식체계로 논리적이고, 순차적인 단계로 정교하게 설명한 틀"로서, 한 교과 내 및 다른 과학영역들(물리, 지구과학, 생물, 화학)과 연결하여 연계적 교육과정을 구성하는 이론적 기반을 제공한다. 학습은 개개인의 선지식, 선경험, 교과교육과정, 교육과정 등의 여러 요소에 영향을 받는 복잡한 이해 과정으로, LP 단계를 모든 학생들이 동일하게 이동하지 않는다. 학생과 학습환경의 특성에 따른 이동 가능한 학습경로의 서술을 위해서는 다양한 학생데이터의 수집과 분석이 필요하다. 이러한 과정을 통해서 가설의 LP는 과학적으로 증명된 LP로 규명되며. 비로소 교과과정 개발의 틀(framework)로 역할을 할 수 있다. 본 연구는 미시간 대학 연구팀이 개발한 "물질의 본성(nature of matter)" 주요 개념에서, 하위개념인 "물질의 입자성(particule nature of matter)과 입자적 표상(submicroscophic representation)"의 LP와 관련 평가지를 우리나라 과학교육과정과 연계, 수정하여 개발하였다. 수정된 평가지와 LP는 124명의 중고등학생의 LP 경로 특성을 분석하는데 사용되었다. 학생들의 입자적 개념과 표상의 이해도, 개념과 표상 이해도 연관성을 중점으로 분석하여 관련 과학교육과정과 현장 수업의 문제점과 시사점을 도출하였다. 본 연구결과를 종합해 보면, 높은 레벨 문항의 정답을 고른 빈도수는 낮은 레벨 문항을 모두 정답으로 고른 경우에 높았으며 이는 학생들이 본 연구팀이 개발한 LP 경로로 이해과정을 정교화시킴을 알 수 있다. 하지만, 대부분의 학생들, 특히 고등학생들은 초등학교 수준의 거시적 물질의 본성 개념 LP 단계에 머물고 있으며, 중학교 수준인 미시적 표상 LP 단계에 있다. 입자적 개념과 표상 이해 실패의 주요 원인은 1) 과학적 모델의 본질, 2) 관련 선지식, 3) 미립자 표상의 이해부족으로 정리된다. 본 연구결과는 물질의 입자성과 관련된 개념, 과학활동(특히 모델링)을 증진시키고 개개인 특성에 맞는 맞춤형 학습환경 제공을 위한 학습, 교수, 평가자료 개발에 기여하는 바가 크다. 더 나아가 '물질의 본성'에 대한 LP연구와 과학적 소양 증진에 긍정적 역할을 할 것으로 기대한다.

텅스텐 화학적-기계적 연마 공정에서 부식방지막이 증착된 금속 컨디셔너 표면의 전기화학적 특성평가 (Electrochemical Characterization of Anti-Corrosion Film Coated Metal Conditioner Surfaces for Tungsten CMP Applications)

  • 조병준;권태영;김혁민;;박문석;박진구
    • 마이크로전자및패키징학회지
    • /
    • 제19권1호
    • /
    • pp.61-66
    • /
    • 2012
  • 반도체 산업에서 회로의 고집적화와 다층구조를 형성하기 위해 화학적-기계적 연마(CMP: Chemical-Mechanical Planarization) 공정이 도입되었으며 반도체 패턴의 미세화와 다층화에 따라 화학적-기계적 연마 공정의 중요성은 더욱 강조되고 있다. 화학적-기계적 연마공정이란 화학적 반응과 기계적 힘을 동시에 이용하여 표면을 평탄화하는 공정으로, 화학적-기계적 연마 공정은 압력, 속도 등의 공정조건과, 화학적 반응을 유도하는 슬러리(Slurry), 기계적 힘을 위한 패드 등에 의해 복합적으로 영향을 받는다. 패드 컨디셔닝이란 컨디셔너가 화학적-기계적 연마 공정 중에 지속적으로 패드 표면을 연마하여 패드의 손상된 부분을 제거하고 새로운 표면을 노출시켜 패드의 상태를 일정하게 유지시키는 것을 말한다. 한편, 금속박막의 화학적-기계적 연마 공정에 사용되는 슬러리는 금속박막과 산화반응을 하기 위하여 산화제를 포함하는데, 산화제는 금속 컨디셔너 표면을 산화시켜 부식을 야기한다. 컨디셔너의 표면부식은 반도체 수율에 직접적인 영향을 줄 수 있는 스크래치(Scratch) 등을 발생시킬 뿐만 아니라, 컨디셔너의 수명도 저하시키게 되므로 이를 방지하기 위한 노력이 매우 중요하다. 본 연구에서는 컨디셔너 표면에 슬러리와 컨디셔너 표면 간에 일어나는 표면부식을 방지하기 위하여 유기박막을 표면에 증착하여 부식을 방지하고자 하였다. 컨디셔너 제작에 사용되는 금속인 니켈과 니켈 합금을 기판으로 하고, 증착된 유기박막으로는 자기조립단분자막(SAM: Self-Assembled Monolayer)과 불화탄소(FC: FluoroCarbon) 박막을 증착하였다. 자기조립단분자막은 2가지 전구체(Perfluoroctyltrichloro silane(FOTS), Dodecanethiol(DT))를 사용하여 기상 자기조립 단분자막 증착(Vapor SAM) 방법으로 증착하였고, 불화탄소막은 10 nm, 50 nm, 100 nm 두께로 PE-CVD(Plasma Enhanced-Chemical Vapor Deposition, SRN-504, Sorona, Korea) 방법으로 증착하여 표면의 부식특성을 평가하였다. 표면 부식 특성은 동전위분극법(Potentiodynamic Polarization)과 전기화학적 임피던스 측정법(Electrochemical Impedance Spectroscopy(EIS)) 등의 전기화학 분석법을 사용하여 평가되었다. 또한 측정된 임피던스 데이터를 전기적 등가회로(Electrical Equivalent Circuit) 모델에 적용하여 부식 방지 효율을 계산하였다. 동전위분극법과 EIS의 결과 분석으로부터 유기박막이 증착된 표면의 부식전류밀도가 감소하고, 임피던스가 증가하는 것을 확인하였다.

토양유효수분율 공간분포와 기상인자와의 상관관계 분석을 통한 콩 재배기간 밭가뭄 특성 및 변동성 평가 (Assessment for Characteristics and Variations of Upland Drought by Correlation Analysis in Soil Available Water Content with Meteorological Variables and Spatial Distribution during Soybean Cultivation Period)

  • 이세인;옥정훈;허승오;오부영;손정우;황선아
    • 한국농림기상학회지
    • /
    • 제26권2호
    • /
    • pp.127-139
    • /
    • 2024
  • 기후변화에 따라 폭염, 폭우 및 가뭄을 포함하여 극단적인 기상 현상의 빈도가 증가하고 있다. 가뭄은 다른 자연재해와 달리 점진적으로 진행되고 장시간에 걸쳐 피해가 증가하는 특징을 갖고 있기 때문에 가뭄 발생의 특징을 이해하는 것이 매우 중요하다. 농업 가뭄, 특히 밭가뭄은 토양 수분의 부족으로 인해 농작물이 필요로 하는 물의 공급이 부족해짐으로써 발생한다. 이에 농업 가뭄에 영향을 미치는 주요 변수로 토양 수분을 활용하고 있다. 본 연구는 토양, 기상 및 작물 데이터를 통합한 모델을 활용하여 토양유효수분율을 산정함으로써 한반도 가뭄의 시공간적 분포와 경향성을 분석하였다. 또한, 기상인자와 토양유효수분율의 상관관계를 분석하여 기상 특성이 가뭄 발생 특성에 미치는 영향을 평가하였다. 콩 재배기간 동안의 평균 토양유효수분율은 2018년에 88.6%로 가장 낮았으며, 2021년에는 103.2%로 가장 높았다. 콩 생육단계별 토양유효수분율 공간 분포를 분석한 결과, 2018년 개화기(S3), 2019년 잎 경엽신장기(S2), 2020년 유묘기(S1), 2021년 개화기(S3)와 2022년 유묘기(S1)에 가장 낮았다. 콩 생육단계별 평균 토양유효수분율을 기준으로 밭가뭄 빈도수를 평가한 결과 2018년 개화기(S3)에 22회로 빈도수가 가장 높았다. 토양유효수분율이 가장 낮을 때는 강우량과 증발산량과의 가장 큰 부(-)의 상관관계를 나타낸 반면, 토양유효수분율이 가장 높을 때는 강우량과 상대습도와 가장 큰 정(+)의 상관관계를 보였으며, 기준증발산량과는 가장 큰 부(-)의 상관관계를 나타냈다.

다이내믹 토픽 모델링의 의미적 시각화 방법론 (Semantic Visualization of Dynamic Topic Modeling)

  • 연진욱;부현경;김남규
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.131-154
    • /
    • 2022
  • 최근 방대한 양의 텍스트 데이터에 대한 분석을 통해 유용한 지식을 창출하는 시도가 꾸준히 증가하고 있으며, 특히 토픽 모델링(Topic Modeling)을 통해 다양한 분야의 여러 이슈를 발견하기 위한 연구가 활발히 이루어지고 있다. 초기의 토픽 모델링은 토픽의 발견 자체에 초점을 두었지만, 점차 시기의 변화에 따른 토픽의 변화를 고찰하는 방향으로 연구의 흐름이 진화하고 있다. 특히 토픽 자체의 내용, 즉 토픽을 구성하는 키워드의 변화를 수용한 다이내믹 토픽 모델링(Dynamic Topic Modeling)에 대한 관심이 높아지고 있지만, 다이내믹 토픽 모델링은 분석 결과의 직관적인 이해가 어렵고 키워드의 변화가 토픽의 의미에 미치는 영향을 나타내지 못한다는 한계를 갖는다. 본 논문에서는 이러한 한계를 극복하기 위해 다이내믹 토픽 모델링과 워드 임베딩(Word Embedding)을 활용하여 토픽의 변화 및 토픽 간 관계를 직관적으로 해석할 수 있는 방안을 제시한다. 구체적으로 본 연구에서는 다이내믹 토픽 모델링 결과로부터 각 시기별 토픽의 상위 키워드와 해당 키워드의 토픽 가중치를 도출하여 정규화하고, 사전 학습된 워드 임베딩 모델을 활용하여 각 토픽 키워드의 벡터를 추출한 후 각 토픽에 대해 키워드 벡터의 가중합을 산출하여 각 토픽의 의미를 벡터로 나타낸다. 또한 이렇게 도출된 각 토픽의 의미 벡터를 2차원 평면에 시각화하여 토픽의 변화 양상 및 토픽 간 관계를 표현하고 해석한다. 제안 방법론의 실무 적용 가능성을 평가하기 위해 DBpia에 2016년부터 2021년까지 공개된 논문 중 '인공지능' 관련 논문 1,847건에 대한 실험을 수행하였으며, 실험 결과 제안 방법론을 통해 다양한 토픽이 시간의 흐름에 따라 변화하는 양상을 직관적으로 파악할 수 있음을 확인하였다.