• 제목/요약/키워드: Ensemble system

검색결과 366건 처리시간 0.027초

부가 정보를 활용한 비전 트랜스포머 기반의 추천시스템 (A Vision Transformer Based Recommender System Using Side Information)

  • 권유진;최민석;조윤호
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.119-137
    • /
    • 2022
  • 최근 추천 시스템 연구에서는 사용자와 아이템 간 상호 작용을 보다 잘 표현하고자 다양한 딥 러닝 모델을 적용하고 있다. ONCF(Outer product-based Neural Collaborative Filtering)는 사용자와 아이템의 행렬을 외적하고 합성곱 신경망을 거치는 구조로 2차원 상호작용 맵을 제작해 사용자와 아이템 간의 상호 작용을 더욱 잘 포착하고자 한 대표적인 딥러닝 기반 추천시스템이다. 하지만 합성곱 신경망을 이용하는 ONCF는 학습 데이터에 나타나지 않은 분포를 갖는 데이터의 경우 예측성능이 떨어지는 귀납적 편향을 가지는 한계가 있다. 본 연구에서는 먼저 NCF구조에 Transformer에 기반한 ViT(Vision Transformer)를 도입한 방법론을 제안한다. ViT는 NLP분야에서 주로 사용되던 트랜스포머를 이미지 분류에 적용하여 좋은 성과를 거둔 방법으로 귀납적 편향이 합성곱 신경망보다 약해 처음 보는 분포에도 robust한 특징이 있다. 다음으로, ONCF는 사용자와 아이템에 대한 단일 잠재 벡터를 사용하였지만 본 연구에서는 모델이 더욱 다채로운 표현을 학습하고 앙상블 효과도 얻기 위해 잠재 벡터를 여러 개 사용하여 채널을 구성한다. 마지막으로 ONCF와 달리 부가 정보(side information)를 추천에 반영할 수 있는 아키텍처를 제시한다. 단순한 입력 결합 방식을 활용하여 신경망에 부가 정보를 반영하는 기존 연구와 달리 본 연구에서는 독립적인 보조 분류기(auxiliary classifier)를 도입하여 추천 시스템에 부가정보를 보다 효율적으로 반영할 수 있도록 하였다. 결론적으로 본 논문에서는 ViT 의 적용, 임베딩 벡터의 채널화, 부가정보 분류기의 도입을 적용한 새로운 딥러닝 모델을 제안하였으며 실험 결과 ONCF보다 높은 성능을 보였다.

마이크로프로세서를 이용한 자동청력검사 시스템 개발 (Development of A-ABR System Using a Microprocessor)

  • 노형욱;이탁형;김남현;김수찬;차은종;김덕원
    • 전자공학회논문지SC
    • /
    • 제46권2호
    • /
    • pp.15-21
    • /
    • 2009
  • 난청은 가장 흔한 선천성 장애이다. 이 질병의 발생 빈도는 신생아 1000명 출생 당 $1{\sim}3$명 정도로 상당히 높다. 이러한 청력 장애가 조기에 발견된다면 수술적인 치료 등으로 예방할 수 있으나, 그렇지 못할 경우 언어와 학습장애를 초래하게 된다. 이런 관점을 근거로 신생아를 대상으로 한 선천성 난청의 선별검사는 큰 의미를 가지며 난청환자의 조기발견을 위한 노력이 필수적이라 할 수 있다. 기존의 수동 청력검사 시스템은 신생아 청력 평가 시 검사자의 주관성에 의존하게 되므로, 청성뇌간 반응의 뇌파 분석이 잘못될 가능성이 커진다. 따라서 본 연구에서는 난청여부를 자동으로 판독하여 결과를 나오도록 개발하고자 하였으며, 또한 기존 제품들과 차별화하기 위하여 휴대용으로 개발하여 차폐실이 아닌 일반 병실에서도 검사가 가능하도록 함에 따라 유소아의 청각 장애를 극복시키는데 기여하고자 하였다.

효율적 수입식품 검사를 위한 머신러닝 기반 부적합 건강기능식품 탐지 방법 (A Method of Machine Learning-based Defective Health Functional Food Detection System for Efficient Inspection of Imported Food)

  • 이경수;박예린;신윤종;손권상;권오병
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.139-159
    • /
    • 2022
  • 코로나19 이후 건강기능식품의 관심이 높아짐에 따라 수입 식품 안전성 검사의 중요성도 더욱 커지고 있다. 그러나 매년 증가하는 건강기능식품 수입량과 반대로 식품 검사에 필요한 예산과 인력은 한계점에 다다르고 있다. 따라서 본 연구의 목적은 수출입 식품 중 건강기능식품을 대상으로 데이터의 특성을 살펴보고, 판별의 정확성과 결과의 설명 가능성을 고려하여 효율적으로 부적합 식품을 탐지할 수 있는 기계학습 모델 기반 자동화 시스템 설계 방안을 제시하는 것이다. 이를 위해 첫째, 부적합 판정에 영향을 미치는 식품 검사 데이터로부터 부적합 판정에 유의한 파생변수를 생성하며, 둘째, 건강기능식품 수출입 검사 데이터에 대한 탐색적 분석을 통해 클래스 불균형과 비선형성 등을 고려하여 영향변수를 선정하며, 셋째, 다양한 머신러닝 기법을 적용하여 모델 별 성능과 해석가능성에 대해 비교를 수행하고자 한다. 성능 분석 결과, 앙상블 모델이 가장 우수하였으며, 본 연구에서 제안하는 파생변수 및 모델이 수출입 식품 검사에서 활용하고 있는 시스템에 도움이 될 수 있음을 확인하였다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

후정해변 고파랑 조건하에서 파랑유속 방향전환점에서 발생하는 난류성분의 측정 (Measurement of Turbulence Properties at the Time of Flow Reversal Under High Wave Conditions in Hujeong Beach)

  • 장연식;도종대;김선신;안경모;진재율
    • 한국해안·해양공학회논문집
    • /
    • 제29권4호
    • /
    • pp.206-216
    • /
    • 2017
  • 교란운동에너지(TKE)와 레이놀즈 응력의 수직성분($-{\bar{u^{\prime}w^{\prime}}}$)에 대한 한 주기 파장 안에서의 시간변화를 관측자료를 사용하여 분석하였다. 관측자료는 동해에서 온대성저기압이 발달하였던 2017년 1월 14일부터 18일까지 동해안 후정해변에서 측정한 파랑자료를 사용하였다. 이 기간 동안 관측된 모든 파랑자료들 중에서 비슷한 형태를 갖는 수백 개의 규칙파들을 구분하였으며 이 자료를 토대로 Ensemble Average 기법을 사용하여 이 기간 파랑특성을 대표하는 세 개의 평균파를 계산하였다. 그리고 이 평균파를 기준으로 각 파의 요동을 측정하여 한 주기 동안의 교란운동에너지와 레이놀즈 응력을 계산하였다. 이렇게 계산된 자료들을 분석한 결과 교란운동에너지는 파랑의 평균유속과 비슷한 분포를 나타내었으나(즉 유속이 최대값을 나타낼 때 교란운동에너지도 최대값을 나타내었다), $-{\bar{u^{\prime}w^{\prime}}}$는 파랑의 수평유속 방향이 전환되는 '방향전환점'에서 가파르게 증가하는 경향을 나타내었다. 이러한 $-{\bar{u^{\prime}w^{\prime}}}$의 독특한 분포는 Nielsen(1992)에 의해 제안된 난류 convection 현상을 뒷받침하는 발견으로 퇴적물과 같은 물질들의 부유현상이 파랑의 '방향전환점(한 주기 안에서 파랑의 횡단방향 유속 부호가 바뀌는 시점)'에서 촉진될 수 있음을 보여준다. 이렇게 관측된 난류에너지 분포 특성을 CADMAS-SURF 모델을 사용하여 구현해 보았다. 그 결과 교란운동에너지의 경우 모델결과와 관측치 사이에 유사성이 발견되었으나 레이놀즈 응력($-{\bar{u^{\prime}w^{\prime}}}$)의 경우 모델이 '방향전환점'에서의 증가현상을 구현해 내지 못하였다. 이는 CADMAS-SURF와 같은 Reynolds-Averaged Navier-Stokes(RANS) 모델들이 가지는 한계점으로 RANS 모델의 경우 레이놀즈 응력과 같은 난류에너지가 평균유속의 분포에 강한 영향을 받기 때문인 것으로 판명되었다.

중장기 유량예측 향상을 위한 국내 기후정보의 이용 (Use of Climate Information for Improving Extended Streamflow Prediction in Korea)

  • 이재경;김영오;정대일
    • 한국수자원학회논문집
    • /
    • 제39권9호
    • /
    • pp.755-766
    • /
    • 2006
  • 중장기 기후예보는 기후역학모형의 비약적인 발전과 ENSO등의 기후현상에 대한 규명으로, 전세계적으로 정확성이 크게 향상되고 있어 중장기 유량예측의 중요한 실마리가 되고 있다. 본 연구에서는 우선 중장기 유량예측 향상을 위하여 국내에서 사용 가능한 기후정보, 즉 월간산업기상정보와 GDAPS(Global Data Assimilation and Prediction System)를 조사하고 그 정확성을 평가하였다. 월간산업기상정보와 GDAPS의 순별 예보에서 모두 초보예측보다 정확하였고 특히 갈수기보다는 홍수기에 정확성이 더 높게 나와 이 기간에는 기후예보로서 유효함을 확인하였다. 다음으로 기후예보를 이용하여 충주댐 유역에 대하여 유량예측을 수행하였다. 월간산업기상정보에서는 전체 시나리오, 교집합 시나리오, 합집합 시나리오로 나누어 유량예측에 적용하였다. 세 경우 모두 초보예측보다 평균예측점수가 높아 예측으로서 유효하였으며, 특히 홍수기에 교집합 및 합집합 시나리오의 평균예측점수가 전체 시나리오보다 높게 나타났다. GDAPS를 이용한 순별 유량예측의 경우에도 역시 갈수기보다 홍소기에 더 높은 정확성이 나타났다. 따라서 본 연구에서는 홍수기에 보다 정확한 기후예보를 사용하여 기상학적 불확실성을 줄인다면 월 유량예측의 정확성을 향상시킬 수 있음을 증명하였다.

기계학습을 이용한 식품위생점검 체계의 효율성 개선 연구 (Improving Efficiency of Food Hygiene Surveillance System by Using Machine Learning-Based Approaches)

  • 조상구;조승용
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.53-67
    • /
    • 2020
  • 본 연구는 가공식품의 제조·가공 업소를 대상으로 기계학습 분야의 지도학습(Supervised Learning) 예측 모형을 적용하여 부적합이 예상되는 업체를 사전에 적발하는 단속 선별시스템을 마련하여 단속 활동의 효율성을 높이고자 하였다. 본 연구에서는 머신러닝의 예측 모델링을 위한 목적 정의, 데이터의 기초 분석과 시각화, 특성 변수 도출 및 예측 모형의 선정 및 예측 등으로 기계학습 수행의 표준적인 절차에 따라 연구를 수행하였다. 종속변수는 2014년도부터 2018년까지 과거 5년 동안 지도점검 적발 건수로 설정하였고, 목적함수는 실제 부적합업체를 사전에 판정하여 단속활동이 이루어지는 것을 최대화하는 것으로 하였다. 제조가공업소의 매출액, 영업일수, 종업원 수 등 기본속성뿐만 아니라 과거 지도점검 단속 이력 정보를 반영하여 자료를 재구성하였다. 특성 변수 추출 방법을 적용하여 부적합 판정에 영향을 미치는 업체 위험, 품목 위험, 환경 위험 및 과거 위반 이력 등을 특성 변수로 도출하여 머신러닝 알고리즘을 데이터에 적용하였다. 랜덤포레스트 모형이 식품의약품안전처 지도점검 업무 목적에 가장 적합한 것으로 나타났다. 본 연구결과를 바탕으로 식품안전 관리 국가 사무가 데이터기반의 과학적인 행정 체계로 발전할 수 있는 기반이 되기를 기대한다.

비대면 미디 수업의 문제점과 개선 방안 연구 (A Study on Problems and Improvement Plans of Non-Face-to-Face Midi Classes)

  • 백성현
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권4호
    • /
    • pp.267-277
    • /
    • 2021
  • 코로나 바이러스의 영향으로 교수자와 학습자는 비대면 수업을 해야 하는 상황이 되었다. 갑작스러운 상황에 충분한 준비를 하지 못한 상태에서 비대면 수업이 진행되었고 여러 가지 문제점들이 발생했다. 본 연구는 비대면 미디 수업 시 생기는 문제점을 파악하여 개선하고자 하였다. 연구 결과는 다음과 같다. 첫째, 대면과 비대면 수업 시 사용할 수 있는 기자재의 차이로 인한 문제점이 있었다. 이에 컴퓨터 운영 체제에 상관없이 설치 가능하고 기능에 제한 없이 무료 사용할 수 있는 DAW인 리퍼(Reaper)를 사용하는 것으로 개선 방안을 찾을 수 있었다. 둘째, 줌(Zoom)의 화면 공유 기능을 사용할 시 DAW에서 오디오 인터페이스의 드라이버를 선택할 수 없어 레이턴시(Latency)를 줄일 수 없는 문제점이 있었다. 교수자 관점에서는 오디오 아웃풋을 인풋으로 다시 받아 송출하는 방식으로 개선하였다. 또한 Windows 운영체제를 사용하며 오디오 인터페이스가 없는 학습자는 실습 시 레이턴시로 인한 불편함이 생기는데 Asio4all을 설치하여 레이턴시를 줄일 수 있었다. 셋째, 컴퓨터의 리소스 부족으로 화질 저하 및 화면 끊김 현상이 있었다. 이를 개선하기 위해 캡처 보드를 사용하여 2대의 컴퓨터를 연결하여 리소스를 분산하여 고화질을 유지하면서 화면 끊김 현상을 개선할 수 있었으며, 비엔나 앙상블 프로를 사용하여 1대의 컴퓨터를 더 연결하여 추가 리소스를 확보하여 더 많은 플러그인을 사용하면서 비대면 미디 수업을 할 수 있는 시스템 구축에 성공하였다. 연구 결과 비대면 미디 수업의 문제점을 파악하고 개선할 수 있었다.

Water Level Prediction on the Golok River Utilizing Machine Learning Technique to Evaluate Flood Situations

  • Pheeranat Dornpunya;Watanasak Supaking;Hanisah Musor;Oom Thaisawasdi;Wasukree Sae-tia;Theethut Khwankeerati;Watcharaporn Soyjumpa
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.31-31
    • /
    • 2023
  • During December 2022, the northeast monsoon, which dominates the south and the Gulf of Thailand, had significant rainfall that impacted the lower southern region, causing flash floods, landslides, blustery winds, and the river exceeding its bank. The Golok River, located in Narathiwat, divides the border between Thailand and Malaysia was also affected by rainfall. In flood management, instruments for measuring precipitation and water level have become important for assessing and forecasting the trend of situations and areas of risk. However, such regions are international borders, so the installed measuring telemetry system cannot measure the rainfall and water level of the entire area. This study aims to predict 72 hours of water level and evaluate the situation as information to support the government in making water management decisions, publicizing them to relevant agencies, and warning citizens during crisis events. This research is applied to machine learning (ML) for water level prediction of the Golok River, Lan Tu Bridge area, Sungai Golok Subdistrict, Su-ngai Golok District, Narathiwat Province, which is one of the major monitored rivers. The eXtreme Gradient Boosting (XGBoost) algorithm, a tree-based ensemble machine learning algorithm, was exploited to predict hourly water levels through the R programming language. Model training and testing were carried out utilizing observed hourly rainfall from the STH010 station and hourly water level data from the X.119A station between 2020 and 2022 as main prediction inputs. Furthermore, this model applies hourly spatial rainfall forecasting data from Weather Research and Forecasting and Regional Ocean Model System models (WRF-ROMs) provided by Hydro-Informatics Institute (HII) as input, allowing the model to predict the hourly water level in the Golok River. The evaluation of the predicted performances using the statistical performance metrics, delivering an R-square of 0.96 can validate the results as robust forecasting outcomes. The result shows that the predicted water level at the X.119A telemetry station (Golok River) is in a steady decline, which relates to the input data of predicted 72-hour rainfall from WRF-ROMs having decreased. In short, the relationship between input and result can be used to evaluate flood situations. Here, the data is contributed to the Operational support to the Special Water Resources Management Operation Center in Southern Thailand for flood preparedness and response to make intelligent decisions on water management during crisis occurrences, as well as to be prepared and prevent loss and harm to citizens.

  • PDF

정규크리깅을 이용한 우리나라 주변해역 일평균 해수면온도 격자지도화 및 내삽정확도 분석 (Ordinary Kriging of Daily Mean SST (Sea Surface Temperature) around South Korea and the Analysis of Interpolation Accuracy)

  • 안지혜;이양원
    • 한국측량학회지
    • /
    • 제40권1호
    • /
    • pp.51-66
    • /
    • 2022
  • 해수면온도는 지구 시스템에서 가장 중요한 메커니즘의 하나인 대기-해양의 상호작용을 단적으로 나타내며, 기후변화를 이해하는 데 필수적인 해양 기상요소이다. 이에, 공백 없이 시공간해상도가 일정한 격자자료는 해수면온도연구에 있어 그 활용도가 매우 높다. 이 논문에서는 2020년 해양 실측자료 137개 지점으로부터 최적화된 베리오그램을 도출하고 이를 이용한 정규크리깅을 통해 우리나라 주변해역의 일평균 해수면온도 격자지도를 산출하고 그 정확도를 평가하였다. 베리오그램 최적화는 가중최소제곱법을 이용하였고, 내삽정확도 검증을 위하여 공간적인 치우침이 없도록 객관적인 샘플링 기준을 적용하여 암맹평가를 수행하였다. 4회에 걸친 암맹평가 결과, 평균제곱근오차 0.995~1.035℃, 상관계수 0.981~0.982의 상당히 높은 정확도를 나타냈다. 계절별로는 여름철의 정확도가 상대적으로 약간 낮게 나타났는데, 이는 태풍의 영향으로 인한 급격한 수온 변동 때문으로 사료된다. 또한 가까운 바다보다 먼 바다에서, 동해, 남해보다 서해에서 상대적으로 정확도가 높게 나타났는데, 이는 가까운 바다에서 종종 반폐쇄해 지형으로 인해 해수의 물리적인 특성에 차이가 발생할 수 있기 때문인 것으로 보인다. 향후에는 계절별, 해역별 특성을 반영하는 SST 추정기법의 개선이 필요할 것이며, 개선된 자료는 우리나라 주변해역의 고품질 SST 합성장을 산출하는 앙상블 멤버로 활용될 수 있을 것으로 기대한다.