• 제목/요약/키워드: 앙상블평균

검색결과 122건 처리시간 0.028초

전력소비행위 변화를 위한 전력소비패턴 분석 및 적용 (Analysis and Application of Power Consumption Patterns for Changing the Power Consumption Behaviors)

  • 장민석;남광우;이연식
    • 한국정보통신학회논문지
    • /
    • 제25권4호
    • /
    • pp.603-610
    • /
    • 2021
  • 본 논문에서는 사용자의 전력소비패턴을 추출하고 사용자의 환경 및 감성을 적용한 최적 소비패턴을 모델링한 후, 이 두 가지의 패턴을 비교 적용하여 사용자의 전력소비행위 변화를 통한 전력의 효율적 사용 방법을 제시한다. 유의미한 소비패턴을 추출하기 위하여 벡터 표준화 및 이진 데이터 변환방법을 사용하고, k-평균 군집화를 적용한 앙상블의 합집합에 대한 학습과 k값에 따른 지지도를 적용하였으며, 최적 전력소비패턴 모델은 상대적 평균 소비량이 적은 앙상블 합집합에 대한 학습 결과를 기준으로 강제 및 감성 제어를 적용하여 생성하였다. 실험을 통하여 전력소비행위 변화 유도대상 추출 시 클러스터의 수와 일치율 간의 상관관계를 파악함으로써, 사용자의 의도에 따라 강제 및 감성 기반의 제어가 가능하도록 클러스터의 수나 크기 조절을 통한 다양한 윈도우에 적용할 수 있음을 검증하였다.

앙상블 경험적 모드 분해법을 이용한 우리나라 봄 시작일에 관한 연구 (A Study on the Timing of Spring Onset over the Republic of Korea Using Ensemble Empirical Mode Decomposition)

  • 권재일;최영은
    • 대한지리학회지
    • /
    • 제49권5호
    • /
    • pp.675-689
    • /
    • 2014
  • 본 연구에서는 앙상블 경험적 모드 분해법을 우리나라에 적용하여 봄 시작일을 정의하고, 이에 대한 시 공간적인 변화를 분석하였으며, 봄 시작일의 변동성을 분석하여, 봄 시작일에 영향을 미치는 요인을 파악하였다. 우리나라 평균 봄 시작일은 3월 11일로 나타났고, 연구기간 동안 2.6일/10년으로 빨라졌다. 봄 시작일은 일반적으로 위도와 고도가 높아짐에 따라, 그리고 해안에서 내륙으로 갈수록 늦게 나타났다. 우리나라 봄 시작일에 영향을 미치는 요인을 파악하기 위해 상관분석을 수행하였고, 전구평균기온, 북극진동(Arctic Oscillation, AO), 시베리아 고기압이 우리나라 봄 시작일과 유의한 상관관계를 나타냈다. 봄 시작일에 영향을 미치는 지수들을 대상으로 다중회귀분석을 수행하였고, 세 가지 변수가 모두 입력된 모형은 64.7%의 설명력을 나타냈다. 다중회귀분석의 결과 봄 시작일에 미치는 영향은 전구평균기온이 가장 크고, AO가 그 다음으로 나타났다. 우리나라 봄 시작일에 영향을 미치는 종관적인 요인을 파악하기 위해 기압장 및 바람장을 분석한 결과, 시베리아 고기압, 알류샨 저기압, 상층 기압골의 강도 및 위치에 따른 북풍계열 바람의 강도가 봄 시작일을 결정하는 주요 원인인 것으로 나타났다.

  • PDF

지구평균온도 상승에 따른 확률 적설심 변화 추정 (Estimation of changes in probability snow depth due to the rising global average temperature)

  • 박희성;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.274-274
    • /
    • 2023
  • 기후변화의 영향으로 겨울철 적설의 양상이 과거와는 많이 달라진 것으로 보인다. 따라서 미래의 적설이 어떤 확률로 발생할 것인지도 과거에 비해 많이 달라질 것으로 예상된다. 하지만 어떤 정도로 달라질 것인지는 정확하게 알 수가 없다. 본 연구에서는 이를 합리적으로 추정하기 위해 일본에서 수행한 대규모 기후 앙상블 모의실험 결과로 생성된 d4PDF(Data for Policy Decision Making for Future Change) 자료 중 적설과 기온 자료를 이용하여 일 최심적설심을 모의하고 연최대치계열을 작성하여 과거의 최심적설심 연최대치분포와 비교하여 분위사상법을 통해 모형의 오차를 보정한 후 미래 지구평균온도 상승 시의 기후모의 결과에 적용함으로써 지구평균온도 상승 정도에 따라 우리나라의 적설양상과 확률적설심이 어떻게 변화할 것인지 추정해 보았다. 연구의 결과는 미래 적설과 관련된 설계와 방재 목적에 참고적으로 활용될 수 있을 것이다.

  • PDF

경향성 변화에 대응하는 딥러닝 기반 초미세먼지 중기 예측 모델 개발 (Development of a Deep Learning-based Midterm PM2.5 Prediction Model Adapting to Trend Changes)

  • 민동준;김혜림;이상근
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.251-259
    • /
    • 2024
  • 초미세먼지, 특히 지름이 2.5㎛ 이하인 PM2.5는 인체 건강과 경제에 큰 피해를 주는 오염물질이다. 본 연구는 대한민국 서울 지역을 중심으로, 2017년부터 2022년까지 자료를 수집하여 PM2.5 데이터 분석 및 데이터 경향성 변화 추이를 분석하고, PM2.5 중기 예측 모델을 개발하는 것을 목표로 한다. 수집, 생산된 대기질 및 기상 데이터, 재분석 데이터, 수치모델 예측 데이터를 바탕으로, 모델을 학습하고 이를 통합한 경향성 변화에도 대응할 수 있는 앙상블 기법을 제안한다. 본 연구에서 제안하는 앙상블 기법은 PM2.5 농도 예측 성능 면에서 기존 모델 대비 미래 D+3~D+6 예측일 F1 Score 기준 평균 2019년 약 42.16%, 2021년 약 58.92%, 2022년 약 34.79% 높은 성능을 보였다. 제안한 모델은 변화하는 환경 조건에도 성능을 유지함으로써 안정적인 예측을 가능하게 하며, 기존 딥러닝 기반 PM2.5 단기 예측보다 먼 예측을 수행하는 중기 예측 모델을 제시한다.

Focal Loss와 앙상블 학습을 이용한 야생조류 소리 분류 기법 (Wild Bird Sound Classification Scheme using Focal Loss and Ensemble Learning)

  • 이재승;유제혁
    • 한국산업정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.15-25
    • /
    • 2024
  • 효과적인 동물 생태계 분석을 위해서는 동물 서식 현황을 자동으로 파악할 수 있는 동물 관제 기술이 중요하다. 특히 울음소리로 종을 판별하는 동물 소리 분류 기술은 영상을 통한 판별이 어려운 환경에서 큰 주목을 받고 있다. 기존 연구들은 단일 딥러닝 모델을 사용하여 동물 소리를 분류하였으나, 야외 환경에서 수집된 동물 소리는 많은 배경 잡음을 포함하여 단일 모델의 판별력을 악화시키며, 종에 따른 데이터 불균형으로 인해 모델의 편향된 학습을 야기한다. 이에, 본 논문에서는 클래스의 데이터 수를 고려하여 페널티를 부여하는 Focal Loss를 사용한 여러 분류 모델의 예측결과를 앙상블을 통해 결합하여 잡음이 많은 동물 소리를 효과적으로 분류할 수 있는 기법을 제안한다. 공개 데이터 셋을 사용한 실험에서, 제안된 기법은 단일 모델의 평균 성능에 비해 Recall 기준으로 최대 22.6%의 성능 개선을 달성하였다.

인경신경망을 이용한 한국프로야구 관중 수요 예측에 관한 연구 (A Study on Prediction of Attendance in Korean Baseball League Using Artificial Neural Network)

  • 박진욱;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권12호
    • /
    • pp.565-572
    • /
    • 2017
  • 본 연구는 기존의 수요 예측 등의 시계열 연구에서 주로 사용되는 ARIMA 모형의 어려움을 극복하고자 인공신경망(Artificial neural network) 모형을 이용하여 한국 프로 야구 관중 수를 예측하였다. 훈련 자료로는 2015년 3월부터 9월까지의 일별 KBO 관중 수 자료를 대상으로 하였다. 전방향 신경망(Feedforward neural network)의 모형 훈련 과정에서, 그리드 탐색(Grid search)을 적용하여 최적의 초모수(Hyperparameter)를 찾고자 하였다. 그 결과, 그리드 탐색법의 최적 모형을 이용한 평균 절대 백분율 오차(MAPE)는 평균 20.9% 였다. 앙상블 기법을 이용한 모형의 MAPE는 평균 20.0%였다. 이는 다중회귀와 비교해보았을 때, 평균적으로 각각 26.3%, 30.3% 높은 예측력을 보인다.

직사각형 단면을 갖는 $90^{\circ}C$ 급곡관 내의 3차원 난류유동에 관한 실험적 연구 (Experimental Study of Three-Dimensional Turbulent Flow in a $90^{\circ}C$ Rectanglar Cross Sectional Strongly Curved Duct)

  • 맹주성;류명석;양시영;장용준
    • 대한기계학회논문집
    • /
    • 제15권1호
    • /
    • pp.262-273
    • /
    • 1991
  • 본 연구에서는 벽면에서의 압력은 압력측정 정치를 제작하여 측정하였으며 평 균유동 및 난류량들은 열선 유속계(hot wire system)을 사용하여 측정하였다.

빅데이터를 활용한 국내 도서의 해외 판매시 굿셀러 예측 (Prediction of Good Seller in Overseas sales of Domestic Books Using Big Data)

  • 김나연;김도영;김미려;정지영;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.401-404
    • /
    • 2022
  • 한국 문학이 세계로 뻗어나감에 따라 해외 시장에서 자리를 잡는 것이 중요해진 시점이다. 본 연구에서는 2016 년도부터 2020 년도까지 최근 5 년간 해외 출간된 도서들 중에서 굿셀러로 분류되는 누적 5 천부 이상 판매 여부를 예측하고자 했다. 굿셀러로 분류되는 도서는 전체 번역 도서 중 적은 비율을 차지하여 데이터 불균형이 발생하였으며, 본 연구에서는 SMOTE 기법과 앙상블 알고리즘을 적용하여 데이터 불균형 문제를 해결하였다. 그 결과, 데이터 클래스 비율이 1:1 에 가까울수록 성능 개선 효과가 나타났으며 LightGBM 모델이 99.83%의 AUC 값을 얻어 다른 앙상블 알고리즘에 비해 가장 좋은 예측 성능을 보임을 검증하였다. 또한 누적 5 천부 이상 판매 여부 예측에 있어 큰 영향을 미치는 변수로는 작가가 가장 중요한 요인으로 나타났으며 출간 국가, 그리고 평점 평균, 평점 참여자 수 같은 온라인 요인도 판매 예측에 유의미한 변수로 나타난 것을 확인할 수 있었다.

약물유전체학에서 약물반응 예측모형과 변수선택 방법 (Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics)

  • 김규환;김원국
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.153-166
    • /
    • 2021
  • 약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.

미래의 강수 특성 변화 분석을 위한 대규모 기후 앙상블 모의자료의 적용 (Application of the large-scale climate ensemble simulations to analyze future changes of precipitation characteristics)

  • 김영규;손민우;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.325-325
    • /
    • 2022
  • 본 연구는 용담댐 유역을 대상으로 현재 기후조건 대비 미래 기후조건에서의 강우 특성의 변화 분석을 목적으로, 대규모 기후 앙상블 모의실험 기반으로 생성된 d4PDF(Data for Policy Decision Making for Future Change)를 적용하였다. d4PDF 자료는 현재 기후조건에서 3000 개의 연 강수 자료를 제공하고, RCP 8.5 시나리오를 따르는 미래 기후조건에서 5400 개의 연 강수자료를 제공하기 때문에, 각 기후조건에서 대규모 표본크기를 이용하는 것이 가능하다. 이는 현재 기후조건과 미래 기후조건 사이의 강수 특성의 변화를 합리적으로 분석할 수 있도록 한다. 연평균강수량 및 계절별 평균강수량은 미래 기후조건에서 10% 이상 증가하였다. 10 mm 이상의 규모를 나타내는 호우의 발생일 수는 3 일에서 4 일 증가하였다. 본 연구는 연 최대 일강우량의 변화 및 특정 장기간 재현기간을 나타내는 확률강우량의 변화도 분석하였다. 그 결과, 미래 기후조건에서 더 높은 평균 및 표준편차를 나타냈다. 이 결과는 미래 기후조건에서 연 최대 일강우량 계열들이 더 높은 규모를 나타내고, 더 넓은 분포 형태를 나타내는 것을 의미한다. 이와 같은 특징은 미래 기후조건의 특정 재현기간을 나타내는 확률강우량의 규모 증가에 영향을 주었다. 현재 기후조건 대비 미래 기후조건의 확률강우량은 재현기간 10 년, 20 년, 50 년, 100 년, 200 년, 400 년에서 약 20% 증가하였다. 이 결과는 특정 규모에서 강우의 재현기간이 미래 기후조건에서 더 짧아지는 것을 의미하며, 또한 극한 규모의 강우량의 발생가능성이 미래 기후조건에서 증가한다는 것을 의미한다. 결과적으로, d4PDF 는 미래 기후에 따른 기존 강우의 특성 및 극한강우량의 변화 분석에 충분히 유용한 자료로 사용될 수 있을 것이다.

  • PDF