• 제목/요약/키워드: 데이터 구축

검색결과 8,534건 처리시간 0.05초

연속형 변수 회귀분석을 통한 열수송관 파손빈도 분석 (Continuous Variable Regression Analysis for Frequency of Damage Analysis in Heat Pipe)

  • 공명식;강재모;이성열
    • 한국지반환경공학회 논문집
    • /
    • 제24권12호
    • /
    • pp.47-52
    • /
    • 2023
  • 지역난방사업자가 운영하는 열수송관의 효율적인 유지관리를 위해 사업자가 구축한 설비이력 및 파손이력 데이터를 활용하여 파손발생과 연관성을 가지는 주요 독립변수를 확인한 후, 파손빈도와의 상관관계를 분석하고, 파손빈도 추정을 위한 기본모델을 도출하였다. 국내외 지역난방사업자가 기존에 활용 중인 사용기간 기반의 추정 모델과의 연관성을 고려하여 사용기간 뿐만 아니라 관경, 매설깊이, 감시시스템 절연레벨 등 연속형 변수와 파손빈도의 상관성이 가장 높은 독립변수로 단순회귀분석 기본모델을 제시하였으며, 나머지 독립변수는 기본모델을 수정, 보완하는 인자로 반영하였다. 분석 결과 기존 연구사례와 마찬가지로 사용기간과 파손빈도간 분석 모델의 적합성과 두 변수간 상관성이 가장 높은 것으로 확인되어 기본모델로 활용 가능하다. 관경, 매설깊이, 감시시스템 절연레벨 정보 역시 파손빈도와의 상관성이 확인되어 기본모델을 보완하기 위한 인자로 활용 가능하다.

기록관리 분야 국가연구개발사업 현황 분석 (An Analysis of the Status of National Research and Development Projects in Records Management)

  • 정회명;김순희
    • 한국기록관리학회지
    • /
    • 제23권4호
    • /
    • pp.137-157
    • /
    • 2023
  • 기술혁신을 통한 국가경쟁력 강화를 목적으로 연구개발 투자 규모가 증가하고 있으며, 투자 효율성에 대한 관심이 높아지고 있다. 기록관리 분야에서는 국가기록원이 2008년부터 국가연구개발사업을 주도하고 있다. 이에 본 연구는 2008년부터 2022년까지의 국가기록원 용역 연구과제 111건을 대상으로 수행주체, 성과, 주제 등의 측면에서 기록관리 분야 연구개발사업을 분석하였다. 분석 결과, 연구 수행주체는 중소기업, 연구성과는 학술발표가 가장 많았으며, 연구보고서의 성과와 실제 성과 간 일부 차이가 있었다. 연구 주제 측면에서 기록물 형태는 종이문서, 국가기록원 업무 중에서는 전자적 관리체계 구축, 기록관리 업무 과정과 연구과제별 중심단어 빈도 기준으로는 보존에 대한 연구가 주로 수행된 것으로 나타났다. 디지털 전환 관련 빅데이터 활용과 지능형 기술 개발의 측면에서는 111개 과제 중 9%인 10건이 해당하는 것으로 나타났다. 따라서 연구 사업 종료 후에도 성과에 대한 사후 관리를 통해 연구개발사업의 효과성을 높여야 할 것이며, 연구 주제에 있어서는 보존 이외의 이관, 분류, 평가, 생산, 수집 등에 대한 연구와 디지털 전환에 대응하는 연구의 필요성을 확인하였다.

머신러닝 기반 대학생 중도 탈락 예측 모델의 성능 비교 (Performance Comparison of Machine Learning based Prediction Models for University Students Dropout)

  • 정석봉;김두연
    • 한국시뮬레이션학회논문지
    • /
    • 제32권4호
    • /
    • pp.19-26
    • /
    • 2023
  • 전국 대학생의 중도 탈락 비율의 증가는 학생 개인 뿐만 아니라 대학과 사회에 심각한 부정적 영향을 끼친다. 본 연구에서는 중도 탈락이 예상되는 학생을 사전에 식별하기 위하여, 각 대학의 학사관리 시스템에서 손쉽게 얻을 수 있는 학적 데이터를 기반으로 머신러닝 분야의 결정트리, 랜덤 포레스트, 로지스틱 회귀 및 딥러닝 기반의 중도 탈락 예측 모델을 구축하고, 그 성능을 비교·분석하였다. 분석 결과 로지스틱 회귀 기반 예측 모델의 재현율이 가장 높았으나 f-1 및 auc 값이 낮은 한계를 보였고, 랜덤 포레스트 기반의 예측 모델의 경우 재현율을 제외한 다른 모든 지표에서 가장 우수한 성능을 보였다. 또한 예측 기간에 따른 예측 모델의 성능을 확인하기 위하여 예측 기간을 단기(1개 학기 이내), 중기(2개 학기 이내) 및 장기(3개 학기 이내)로 나누어 분석해 본 결과, 장기 예측 시 가장 높은 예측력을 보였다. 본 연구를 통해 각 대학은 중도 탈락이 예상되는 학생들을 조기에 식별하고, 이들에 대한 집중 관리를 통해 중도 탈락 비율을 줄이며 나아가 대학 재정 안정화에 기여할 수 있을 것으로 기대된다.

커터수명지수 예측을 위한 다중선형회귀분석과 트리 기반 머신러닝 기법 적용 (Application of Multiple Linear Regression Analysis and Tree-Based Machine Learning Techniques for Cutter Life Index(CLI) Prediction)

  • 홍주표;고태영
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.594-609
    • /
    • 2023
  • TBM 공법은 굴착면 안정성 확보 및 주변환경에 비치는 영향을 최소화하기 때문에 도심지나 하·해저터널 등에서 적용 사례가 증가하는 추세이다. 디스크 커터의 수명을 예측하는 대표적인 모델 중 NTNU모델은 커터수명지수(Cutter Life Index, CLI)를 주요 매개 변수로 활용하지만 복잡한 시험절차와 시험장비의 희귀성으로 측정에 어려움이 있다. 본 연구에서는 다중선형회귀분석과 트리 기반의 머신러닝 기법으로 암석물성을 활용하여 CLI를 예측하였다. 문헌 조사를 통해 암석의 일축압축강도, 압열인장강도, 등 가석영함량과 세르샤 마모지수 등을 포함한 데이터베이스를 구축하였고 파생변수를 계산하여 추가하였다. 다중선형회귀분석은 통계적 유의성과 다중공선성을 고려하여 입력 변수를 선정하였고 머신러닝 예측 모델은 변수 중요도를 기반으로 입력 변수를 선정하였다. 학습용과 검증용 데이터를 8:2로 나누어 모델 간 예측 성능을 비교한 결과 XGBoost가 최적의 모델로 선정되었다. 본 연구에서 도출된 다중선형회귀모델과 XGBoost모델을 선행 연구와 예측 성능을 비교하여 타당성을 확인하였다.

GPT를 활용한 개인정보 처리방침 안전성 검증 기법 (Safety Verification Techniques of Privacy Policy Using GPT)

  • 심혜연;권민서;윤다영;서지영;이일구
    • 정보보호학회논문지
    • /
    • 제34권2호
    • /
    • pp.207-216
    • /
    • 2024
  • 4차 산업혁명으로 인해 빅데이터가 구축됨에 따라 개인 맞춤형 서비스가 급증했다. 이로 인해 온라인 서비스에서 수집하는 개인정보의 양이 늘어났으며, 사용자들의 개인정보 유출 및 프라이버시 침해 우려가 높아졌다. 온라인 서비스 제공자들은 이용자들의 프라이버시 침해 우려를 해소하기 위해 개인정보 처리방침을 제공하고 있으나, 개인정보 처리방침은 길이가 길고 복잡하여 이용자가 직접 위험 항목을 파악하기 어려운 문제로 인해 오남용되는 경우가 많다. 따라서 자동으로 개인정보 처리방침이 안전한지 여부를 검사할 수 있는 방법이 필요하다. 그러나 종래의 블랙리스트 및 기계학습 기반의 개인정보 처리방침 안전성 검증 기법은 확장이 어렵거나 접근성이 낮은 문제가 있다. 본 논문에서는 문제를 해결하기위해 생성형 인공지능인 GPT-3.5 API를 이용한 개인정보 처리방침 안전성 검증 기법을 제안한다. 새로운 환경에서도 분류 작업을 수행할 수 있고, 전문 지식이 없는 일반인이 쉽게 개인정보 처리방침을 검사할 수 있다는 가능성을 보인다. 실험에서는 블랙리스트 기반 개인정보 처리방침과 GPT 기반 개인정보 처리방침이 안전한 문장과 안전하지 않은 문장의 분류를 얼마나 정확하게 하는지와 분류에 소요된 시간을 측정했다. 실험 결과에 따르면, 제안하는 기법은 종래의 블랙리스트 기반 문장 안전성 검증 기법보다 평균적으로 10.34% 높은 정확도를 보였다.

UAV 기반 도시 공간의 열 쾌적성 평가기법 개발 (Development of a UAV-Based Urban Thermal Comfort Assessment Method)

  • 김성현;송봉근;박경훈
    • 한국지리정보학회지
    • /
    • 제27권2호
    • /
    • pp.61-77
    • /
    • 2024
  • 본 연구는 무인항공기(Unmanned Aerial Vehicle, UAV) 기반 데이터를 사용하여 도시 열 쾌적성을 신속하게 진단하는 방법을 개발하는 것을 목표로 수행하였다. 연구 대상지는 경상남도 창원시에 위치한 창원대학교 공과대학 부지 및 용지공원을 대상으로 수행하였으며, 기초자료 구축에는 현장측정 및 UAV를 활용하였다. 세부적으로 현장측정 기반 열 쾌적성 지수 PET, UTCI를 산출하였으며, UAV를 활용하여 식생지수(NDVI), 하늘시계지수(SVF) 및 지표면 온도(LST) 영상을 제작 후 분석에 활용하였다. 연구결과, UAV 기반 예측된 PET와 UTCI는 각 유의수준 1% 이내에서 0.662, 0.721의 높은 상관관계를 보이는 것을 확인하였다. 예측 모델의 설명력은 PET 43.8%, UTCI 52.6%로 도출되었으며, RMSE는 PET 6.32℃, UTCI 3.16℃로 나타나 UAV 기반 열 쾌적성 평가 시 UTCI 지수를 활용하는 것이 더 적합한 것으로 도출되었다. 본 연구에서 개발된 방법은 기존 접근 방식에 비해 상당한 시간 절약 이점을 제공하여 실시간 도시 열 쾌적성 평가 및 완화 계획에 활용될 수 있을 것으로 판단된다.

관광객 공유한 사진 및 머신 러닝을 활용한 도시 색채 특성 분석 연구 - 중국 대리시를 대상으로 - (Research on Characterizing Urban Color Analysis based on Tourists-Shared Photos and Machine Learning - Focused on Dali City, China -)

  • 인샤오옌;정태열
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.39-50
    • /
    • 2024
  • 색채는 중요한 시각적 요소로서 도시 이미지와 사람들의 인식 형성에 중요한 영향을 미친다. 도시환경에서 색채를 정량적으로 분석하는 작업은 복잡한 과정을 필요로 하여 과거에는 실행하기가 어려웠다. 그러나 최근 머신 러닝 기술의 급속한 발전으로 관광객이 공유한 사진을 이용하여 도시 색채를 분석하는 것이 가능해졌다. 본 연구는 중국의 인기 관광지인 대리시를 사례로 선정하여 관광객이 공유한 대리시의 사진을 수집하였으며, 머신 러닝 기술을 결합하여 대규모 도시 색채를 측정하는 방법을 탐색하였다. 구체적으로는 먼저 DeepLabv3+ 모델을 사용하여 ADE20k 데이터 셋을 기반으로 관광객이 공유한 사진의 의미 분할을 수행하여 사진에서 인공 요소를 분리했다. 다음으로 K-means 클러스터링 알고리즘을 사용하여 대리시의 인공 요소의 주요 색상을 추출하고, 이러한 색상 간의 상관관계를 분석하기 위해 인접 매트릭스를 구축했다. 연구 결과에 따르면 대리시의 인공 요소의 주요 색상은 주황-회색이 가장 높은 비율을 차지한다. 또한, 회색 계열의 색상이 다른 색상과 자주 조합되어 사용되는 경향이 있다. 분석에 따르면 대리시의 인공 요소의 색채 특성은 지역의 민족 문화와 불교 문화의 영향을 받는 것으로 나타났다. 본 연구는 색채 분석을 위한 새로운 접근 방법을 제공하며, 연구 결과는 대리시가 관광객의 기대에 부합하는 도시 색채 이미지를 형성하는 데 도움이 될 뿐만 아니라 향후 대리시의 색채 계획을 위한 참고 자료를 제공하고자 한다.

로지스틱 회귀분석 기반 노인 보행자 교통사고 요인 분석 (Analysis-based Pedestrian Traffic Incident Analysis Based on Logistic Regression)

  • 김시원;길정원;권재경;황재성;이철기
    • 한국ITS학회 논문지
    • /
    • 제23권2호
    • /
    • pp.15-31
    • /
    • 2024
  • 초고령화 사회로 진입하고 있는 대한민국 노인 인구의 상황을 반영하여 노인 교통사고의 특성을 파악하고, 이항형 변수를 활용하여 노인 보행자 교통사고에서 발생한 중상 이상의 교통사고와 경상 이하의 교통사고를 구분하여 독립변수와 종속변수의 관계를 분석하였다. 도로교통공단 교통사고분석시스템(TAAS)에서 지난 10년간('3년~'22년)의 노인 보행자 교통사고 자료를 구득하여 데이터 수집, 가공, 변수 선정을 수행하였으며, 기초 통계 및 사고 요인별 분석을 실시하였다. 로지스틱 회귀분석 모형을 적용하여 총 15개의 영향 변수를 도출하였고 노인 보행자 중상이상의 교통사고 발생 확률에 가장 큰 영향을 미치는 영향 변수들을 도출하였다. 이후, 로지스틱 모형의 정확도 분석을 위해 통계적 검정을 수행하였으며, 노인 보행자 교통사고에 영향을 미치는 변수를 도출 및 예측모형 구축에 따른 교통사고 발생확률 예측 방법을 제시하였다.

수변 만족도를 향상시키는 요인에 관한 연구: 도쿄 임해지역 집합주택 거주자를 대상으로 (A Study on Factors that Improve Waterfront Satisfaction: Targeting Residents of Apartment Houses in the Tokyo's Coastal Area)

  • 김주홍;오세경
    • 토지주택연구
    • /
    • 제15권1호
    • /
    • pp.117-134
    • /
    • 2024
  • 본 연구는 도쿄 임해지역에 있어서 거주자의 수변 만족도를 향상시키는 요인을 세대별로 파악해 두는 것이 중요하다는 관점에서 도쿄 임해지역의 집합주택 거주자를 대상으로 설문조사를 실시하였다. 설문조사를 기반으로 수변 이용에 수반하는 수변 만족도의 향상과 수변 인식에 수반하는 수변 만족도의 향상에 대한 관계성의 세대차를 분석했다. 연구의 데이터 구축을 위해 선행연구를 참고하여, 수변 만족도를 향상시키는 요인으로서 수변의 이용 및 인식에 주목했다. 구체적으로는 수변의 이용에 관해서는 수변까지의 거리・수변에 체재하는 시간・수변을 방문하는 횟수를 선정했다. 또, 수변의 인식에 관해서는, 공간・행위・관리 상태를 선정했다. 이상을 토대로 세대별 수변의 이용 및 인식과 수변 만족도에 대한 상관분석을 실시하여, 수변 만족도를 향상시키는 요인은 세대별로 다르다는 것을 밝혔다. 분석결과를 바탕으로 도쿄 임해지역에 있어서의 수변 만족도를 향상시키기 위한 거주 환경의 정비로서 3가지를 들 수 있다. 첫째, 청년 세대와 노년 세대의 수변 만족도를 향상시키고 싶은 경우에는, 방문 횟수를 증가시키기 위해 수변으로의 연결로 개통에 수반하는 보행하기 쉬운 액세스 정비를 실시하는 것이 필요하다고 사료된다. 둘째, 중년 세대와 노년 세대는 거주지 인접에 수변을 배치하는 등 이동거리를 단축하는 개선을 통해 시간 거리를 줄여 수변 이용을 촉진하는 정비 방법을 고려할 수 있다. 셋째, 모든 세대에 있어서 수변 만족도를 향상시키기 위해 휴식성・위생성・정비성이 고려된 수변을 조성하여 위생적으로 정비된 수변 휴식 공간을 모색하는 것도 중요하다.

다중 입력 딥러닝을 이용한 서리 발생 추정 (Estimation of Frost Occurrence using Multi-Input Deep Learning)

  • 김용석;허지나;김응섭;심교문;조세라;강민구
    • 한국농림기상학회지
    • /
    • 제26권1호
    • /
    • pp.53-62
    • /
    • 2024
  • 본 연구에서는 딥러닝을 이용한 모형을 이용해서 우리나라 지역에 대한 서리 발생 예측 모형을 구축하였다. 딥러닝 모형의 학습 데이터로 다양한 기상인자들(최저기온, 풍속, 상대습도, 구름량, 강수량)을 사용하였으며, 기상인자들에 대한 통계적 분석 결과, 서리가 발생한 날과 서리가 발생하지 않은 날에 대해 각 요소별로 유의한 차이가 있는 것을 볼 수 있었다. 단일 딥러닝 모형 3가지와 다중 입력 딥러닝 모형 3가지를 이용하여 서리발생을 추정한 결과, 평균적으로 MLP가 가장 정확도가 낮았으며, LSTM, GRU 순으로 정확도가 높게 나타났고, 다중 입력 딥러닝 모형의 경우 3가지 모형이 거의 비슷한 결과가 나타났지만 그 중 평균적으로 GRU와 MLP를 이용한 모형이 가장 정확도가 높았다. 또한, 단일 딥러닝이 다중 입력 딥러닝에 비해 샘플에 따라 정확도 편차도 더 컸다. 이에 따라 결과적으로 단일 딥러닝 기반의 서리발생 예측 모형보다 다중 입력 딥러닝 기반의 서리발생 예측 모형이 안정성과 정확도와 재현율 측면에서 다소 우수한 것을 확인할 수 있었다.