• 제목/요약/키워드: cross validation

검색결과 1,017건 처리시간 0.023초

연관지식의 효율적인 표현 및 추론이 가능한 지식그래프 기반 지식지도 (Knowledge graph-based knowledge map for efficient expression and inference of associated knowledge)

  • 유기동
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.49-71
    • /
    • 2021
  • 문제해결을 위해 지식을 활용하는 사용자는 내용 면에서 관련된 또 다른 지식, 즉 연관지식에 대한 교차적이고 순차적인 탐색을 진행한다. 지식지도는 관리하는 지식의 현황을 보여주는 도식이자 지식저장소의 분류체계로서, 지식 간 연관성에 기반한 사용자의 지식 탐색을 지원하는 도구이다. 따라서 지식지도는 지식 간 연관성에 의한 네트워크 형식으로 표현되며, 이를 정의 및 추론하는 데에 최적화된 기술을 접목하여 구현되어야 한다. 이를 위해 본 연구는 관리하는 개체와 개체 간 관계를 표현 및 추론하는 데에 최적화된 기능성을 발휘하는 것으로 알려진 그래프DB를 이용하여 지식그래프 기반 지식지도를 개발하는 방법론을 제시한다. 제시된 방법론의 유효성을 확인하기 위하여, 선행 연구의 온톨로지 기반 지식지도 구축 사례 데이터를 그래프DB에 적용하여 지식그래프 기반 지식지도를 구현하고, 구현된 지식 네트워크의 유효성과 Class 자동 구성 능력을 선행 연구의 결과와 비교하는 성능 테스트를 진행한다. 성능 테스트 결과, 본 연구의 지식그래프 기반 지식지도는 선행 연구의 온톨로지 기반 지식지도와 동일한 수준의 성능을 나타냈으며, 지식 및 지식 간 관계 정의 및 추론을 더욱 효율적으로 진행할 수 있음을 확인하였다. 본 연구의 결과는 연관지식에 대한 사용자의 인지과정을 반영한 지식 탐색 기능의 구현에 활용될 수 있으며, 추론에 의한 새로운 연관지식의 발견을 통해 자율적으로 확장되는 지능적 지식베이스의 개발에 응용될 수 있다.

고등학교 「식품안전과 건강」 워크북 개발 및 타당도 검증 (Development and Validation of the 'Food Safety and Health' Workbook for High School)

  • 박미정;정난희;유난숙;최성연
    • 한국가정과교육학회지
    • /
    • 제34권1호
    • /
    • pp.59-80
    • /
    • 2022
  • 본 연구는 「식품안전과 건강」과목의 수업과 평가를 지원할 수 있는 워크북을 개발하고 타당도를 검증하는 데 목적이 있다. 워크북 개발은 「식품안전과 건강」교육과정과 식생활 교육자료, 워크북 관련 선행연구를 분석하여 워크북의 개발 방향을 설정하고, 영역별 활동 아이디어를 도출하여 전체 구성을 설계하였다. 이후 초안을 개발하고 3차에 걸쳐서 교차 검토와 식품의약품안전처의 검토와 수정을 반복하여 편집본을 개발하였고, 9인의 전문가와 44인의 가정과교사들에게 타당도 검증을 받아 수정·보완하여 최종적으로 워크북을 완성하였다. 워크북은 4개 영역으로 '식품선택' 영역의 학습 주제 10개 36차시, '식중독과 식품 관리' 영역의 학습 주제 10개 36차시, '식품의 조리' 영역의 학습 주제 11개 43차시, '건강한 식사' 영역의 학습 주제 11개 55차시로 총 42개 학습 주제 170차시로 구성하였다. 워크북은 실천적 문제해결 역량, 생활자립 역량, 창의적사고 역량, 공동체 역량을 고루 배양할 수 있도록 하였으며, 문제를 인식하고 실험을 통해 문제를 해결하거나 발견학습을 통해 학습과제를 수행하고, 실험한 내용에 대해 심화 탐구학습을 진행하며, 평가를 통해 자가진단을 할 수 있도록 맥락적으로 구성하였다. 워크북의 타당도를 검증한 결과 학생 참여형 수업과 평가를 운영하고, 실험·실습을 강화하여 탐구하는 수업 분위기를 형성하는데 매우 적절한 것으로 평가되었다. 본 연구는 고교학점제 시행과 개별 학생의 학습 선택권이 강조되는 시점에서 가정계열 선택과목의 외연을 확장하고, 탐구 중심으로 학생이 주도하는 교실 수업을 구현하는데 기여할 것이다.

차원축소를 활용한 해외제조업체 대상 사전점검 예측 모형에 관한 연구 (Preliminary Inspection Prediction Model to select the on-Site Inspected Foreign Food Facility using Multiple Correspondence Analysis)

  • 박혜진;최재석;조상구
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.121-142
    • /
    • 2023
  • 수입식품의 수입 건수와 수입 중량이 꾸준히 증가함에 따라 식품안전사고 방지를 위한 수입식품의 안전관리가 더욱 중요해지고 있다. 식품의약품안전처는 통관단계의 수입검사와 더불어 통관 전 단계인 해외제조업소에 대한 현지실사를 시행하고 있지만 시간과 비용이 많이 소요되고 한정된 자원 등의 제약으로 데이터 기반의 수입식품 안전관리 방안이 필요한 실정이다. 본 연구에서는 현지실사 전 부적합이 예상되는 업체를 사전에 선별하는 기계학습 예측 모형을 마련하여 현지실사의 효율성을 높이고자 하였다. 이를 위해 통합식품안전정보망에 수집된 총 303,272건의 해외제조가공업소 기본정보와 2019년도부터 2022년 4월까지의 현지실사 점검정보 데이터 1,689건을 수집하였다. 해외제조가공업소의 데이터 전처리 후 해외 제조업소_코드를 활용하여 현지실사 대상 데이터만 추출하였고, 총 1,689건의 데이터와 103개의 변수로 구성되었다. 103개의 변수를 테일유(Theil-U) 지표를 기준으로 '0'인 변수들을 제거하였고, 다중대응분석(Multiple Correspondence Analysis)을 적용해 축소 후 최종적으로 49개의 특성변수를 도출하였다. 서로 다른 8개의 모델을 생성하고, 모델 학습 과정에서는 5겹 교차검증으로 과적합을 방지하고, 하이퍼파라미터를 조정하여 비교 평가하였다. 현지실사 대상업체 선별의 연구목적은 부적합 업체를 부적합이라고 판정하는 확률인 검측률(recall)을 최대화하는 것이다. 머신러닝의 다양한 알고리즘을 적용한 결과 Recall_macro, AUROC, Average PR, F1-score, 균형정확도(Balanced Accuracy)가 가장 높은 랜덤포레스트(Random Forest)모델이 가장 우수한 모형으로 평가되었다. 마지막으로 모델에 의해서 평가된 개별 인스턴스의 부적합 업체 선정 근거를 제시하기 위해 SHAP(Shapley Additive exPlanations)을 적용하고 현지실사 업체 선정 시스템에의 적용 가능성을 제시하였다. 본 연구결과를 바탕으로 데이터에 기반한 과학적 위험관리 모델을 통해 수입식품 관리체계의 구축으로 인력·예산 등 한정된 자원의 효율적 운영방안 마련에 기여하길 기대한다.

도심형 수요응답 교통서비스의 통행목적별 만족도 영향요인 비교연구: 세종특별자치시 셔클(Shucle)을 중심으로 (A Comparative Study on Factors Affecting Satisfaction by Travel Purpose for Urban Demand Response Transport Service: Focusing on Sejong Shucle)

  • 김원철;한우진;박준태
    • 한국ITS학회 논문지
    • /
    • 제23권2호
    • /
    • pp.132-141
    • /
    • 2024
  • 본 연구에서는 수요응답 교통서비스를 이용한 통행목적을 통근·통학과 쇼핑·여가로 구분하고 통행목적별 만족도와 영향변수의 차이를 비교한다. 세종특별자치시 '셔클(Shucle)' 이용자를 대상으로 실시한 만족도 설문조사 자료를 활용하고, 다중선형모델의 과적합(overfitting) 문제점을 최소화하기 위해 LASSO 회귀분석을 적용한다. 분석 결과, 수요응답 교통서비스 도입으로 기존 대중교통 사각지역의 공백이 해소되고, 자가용 이용 감소로 저탄소 및 대중교통 활성화 정책을 유인할 수 있으며, 간헐적인 통행행태를 갖는 행위자(예컨대 고령자, 주부 등)에게 최적의 이동 서비스를 제공할 수 있는 가능성이 확인되었다. 또한, 차량 호출 후 대기시간, 탑승 후 이동시간, 앱이용 편리성, 예상 출/도착 시간의 정시성, 승·하차 지점의 위치 요인은 통근·통학과 쇼핑·여가 통행 시 수요응답 교통서비스 만족도에 긍정적인 영향을 미치는 공통요인으로 나타났다. 한편, 타 교통수단과의 환승은 통근·통학의 경우에만 만족도에 영향을 미치고 쇼핑·여가의 경우는 미치지 않는 것으로 나타났다. 수요응답 교통서비스를 활성화하기 위해서는 분석된 5개의 영향요인에 대한 고려뿐만 아니라 통근·통학과 쇼핑·여가의 차별화 요인 즉, 통근·통학의 경우 행위자는 시간가치를 중요하게 여기므로 총 통행시간을 줄이기 위한 타교통수단과의 환승 편의를 도모하고, 쇼핑·여가 통행의 경우 이용자가 승·하차 지점의 위치를 쉽고 편하게 지정하여 이용할 수 있는 이용편의 조성방안의 고려가 필요할 것으로 사료된다.

한중영문중국판 한국애국가 악보의 분석 및 보존 - 밝은 청색안료 분석과 보존처리를 중심으로 - (Analysis and Conservation of Sheet Music Featuring the National Anthem of Korea with Lyrics in Korean, Chinese, and English - Focusing on Light Blue Pigment Analysis and Conservation Treatment -)

  • 배수빈;박세린;이한형;정희원
    • 헤리티지:역사와 과학
    • /
    • 제57권3호
    • /
    • pp.104-114
    • /
    • 2024
  • 한중영문중국판 한국애국가 악보는 종이 1장을 반으로 접어 4면으로 이루어진 악보로 1945년 11월 12일 임시정부 주석 김구에 의해 국내에 처음 알려졌다. 악보는 3개 국어로 출판되었으며, 애국가의 변천 과정과 역사성 연구에 있어 가치가 높은 기록물이다. 당시에는 다량으로 출판된 악보지만 현재 국내에서 유일본으로 알려져 국가등록유산으로 지정되어 관리되었다. 악보는 크게 손상된 곳은 없으나 변색과 물리적 손상으로 보존처리의 필요성이 제기되었다. 처리 전 보존 상태를 조사한 결과, 기록물 보관 필름에 보관된 상태로 유물을 인계받았으나 오랜 기간 반으로 접어 보관된 악보는 접힌 부분의 상·하단 찢김과 가장자리 영역에서 부분적인 마모와 결실로 취약한 상태였다. 또한 양면에 사용된 안료의 전색제 영향으로 반대 면에 변색 및 전사되는 상태였다. 휴대용 X-선 형광분석을 실시하여 악보 표지에 사용된 적색, 흑색, 밝은 청색 안료를 분석하였으며, 분말형 채색층이 형성된 밝은 청색에서 티타늄(Ti) 성분을 확인할 수 있었다. 인쇄 형태의 나머지 색상에서는 시료 채취가 어려워 추가 분석이 불가능했다. 밝은 청색에서 나온 시료를 중점으로 XRD, SEM-EDS 및 라만 분광분석을 실시하고, 결과를 바탕으로 유물의 연대와 해당 안료에 대한 사료를 바탕으로 교차 검증했다. 1945년에 제작된 악보의 밝은 청색은 루타일(Rutile)이 아닌 아나타제(Anatase) 백색 안료를 사용하였음을 추정할 수 있으며, 청색 안료는 1936년에 처음 만들어진 프탈로사이아닌 블루(Phthalocyanine blue)를 혼합하여 사용된 것으로 추정하였다. 또한 바탕 종이의 섬유분석 결과, 마섬유의 횡문(Longitudinal striation)과 면섬유의 꼬임(twist)이 관찰되어 면섬유와 마섬유를 혼합하여 제조된 종이로 확인되었다. 상태조사 결과를 바탕으로 유물의 보존처리는 최소한의 수분을 가하여 종이에 무리를 주지 않으면서 물리적으로 취약한 부분을 중심으로 보강하는 것에 중점을 두었다. 유물 바탕에 맞게 보강지를 염색하고 보강지(Pre-coated Repair paper)를 이용하여 보존처리를 진행하였으며, 처리 후 알맞은 폴더와 상자를 제작하여 보관할 수 있도록 했다. 본 연구는 근·현대기록물에 사용된 재료들에 대한 중요한 기초자료가 될 것으로 판단된다.

상추잎 너비와 길이 예측을 위한 합성곱 신경망 모델 비교 (Comparison of Convolutional Neural Network (CNN) Models for Lettuce Leaf Width and Length Prediction)

  • 송지수;김동석;김효성;정은지;황현정;박재성
    • 생물환경조절학회지
    • /
    • 제32권4호
    • /
    • pp.434-441
    • /
    • 2023
  • 식물의 잎의 크기나 면적을 아는 것은 생장을 예측하고 실내 농장의 생산성의 향상에 중요한 요소이다. 본 연구에서는 상추 잎 사진을 이용해 엽장과 엽폭을 예측할 수 있는 CNN기반 모델을 연구하였다. 데이터의 한계와 과적합 문제를 극복하기 위해 콜백 함수를 적용하고, 모델의 일반화 능력을 향상시키기 위해 K겹교차 검증을 사용했다. 또한 데이터 증강을 통한 학습데이터의 다양성을 높이기 위해 image generator를 사용하였다. 모델 성능을 비교하기 위해 VGG16, Resnet152, NASNetMobile 등 사전학습된 모델을 이용하였다. 그 결과 너비 예측에서 R2 값0.9436, RMSE 0.5659를 기록한 NASNetMobile이 가장 높은 성능을 보였으며 길이 예측에서는 R2 값이 0.9537, RMSE가 0.8713로 나타났다. 최종 모델에는 NASNetMobile 아키텍처, RMSprop 옵티마이저, MSE 손실 함수, ELU 활성화함수가 사용되었다. 모델의 학습 시간은 Epoch당평균73분이 소요되었으며, 상추 잎 사진 한 장을 처리하는 데 평균0.29초가 걸렸다. 본 연구는 실내 농장에서 식물의 엽장과 엽폭을 예측하는 CNN 기반 모델을 개발하였고 이를 통해 단순한 이미지 촬영만으로도 식물의 생장 상태를 신속하고 정확하게 평가할 수 있을 것으로 기대된다. 또한 그 결과는 실시간 양액 조절 등의 적절한 농작업 조치를 하는데 활용됨으로써 농장의 생산성 향상과 자원 효율성을 향상시키는데 기여할 것이다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.