• 제목/요약/키워드: 서포트 벡터 머신 회귀

검색결과 62건 처리시간 0.034초

인공지능과 국토정보를 활용한 노인복지 취약지구 추출방법에 관한 연구 (A Study on the Methodology of Extracting the vulnerable districts of the Aged Welfare Using Artificial Intelligence and Geospatial Information)

  • 박지만;조두영;이상선;이민섭;남한식;양혜림
    • 지적과 국토정보
    • /
    • 제48권1호
    • /
    • pp.169-186
    • /
    • 2018
  • 급속한 고령화 사회에서 노인인구가 갖는 사회적 영향력은 더욱 가속화될 것이다. 본 연구에서는 인공지능 방법론 중 머신러닝, 인공신경망, 국토정보 분석을 통해 노인복지 취약지구를 추출하는 방법론을 정립하는데 목적을 두었다. 분석방향 정립을 위해 65세 이상 노인, 공무원, 노인복지 시설물 담당자와 인터뷰 후 방향을 설정하였다. 경기도 용인시를 대상으로 500 m 공간단위 벡터 기반 격자에 15분 이내 지리적 거리 수용력, 노인복지 향유도, 공시지가, 이동통신 기반 노인활동을 지표로 설정하였다. 10단계 군집형성 후 모의학습 결과 RBF 커널 알고리즘을 활용한 머신러닝 서포트 벡터머신에서 83.2%의 예측정확도가 나타났다. 그리고 역전파 알고리즘을 활용한 인공신경망에서 높은 상관성 결과(0.63)가 나타났다. 변수간 공간적 자기상관성을 분석하기 위해 지리적 가중회귀분석을 수행했다. 분석결과 결정계수가 70.1%로 모형으로 나타나 설명력이 우수한 것으로 나타났다. 변수의 공간적 이상값 여부와 분포패턴을 검토하기 위해 국지적인 공간적 자기상관성 지수인 Moran's I 계수와 Getis-Ord Gi 계수를 분석하였다. 분석결과 용인시 신도시인 수지 기흥구에서 노인복지 취약지구가 발생하는 특성을 보였다. 본 연구의 인공지능 모의방법과 국토정보 분석의 연계는 최근 정부의 지역여건을 고려한 노인복지 불균형을 해결하는데 활용될 수 있을 것이다.

기상 데이터와 미세먼지 데이터를 활용한 머신러닝 기반 미세먼지 예측 모형 (Machine learning-based Fine Dust Prediction Model using Meteorological data and Fine Dust data)

  • 김혜림;문태헌
    • 한국지리정보학회지
    • /
    • 제24권1호
    • /
    • pp.92-111
    • /
    • 2021
  • 미세먼지는 질병, 산업·경제에 부정적인 영향을 미치고 있어 국민들은 미세먼지에 대해 예민하게 반응하고 있다. 따라서 미세먼지의 발생을 예측할 수 있다면, 미리 대응책을 마련할 수 있어 생활과 경제에 도움이 될 수 있다. 미세먼지의 발생은 기상과 미세먼지 배출원의 밀집 정도에 영향을 받는다. 산업부문은 미세먼지 배출량이 가장 많으며, 그 중에 산단은 공장들이 미세먼지 배출원이 되어 더 많은 미세먼지를 배출하는 문제가 있다. 본 연구는 지방도시에서 노후산업단지가 있는 지역을 선정하여, 미세먼지를 일으키는 요인을 탐색하고, 미세먼지 발생을 예측할 수 있는 예측모형을 개발하고자 한다. 기상 데이터와 미세먼지 관련 데이터를 활용하였고, 다중회귀분석을 통해 미세먼지 발생에 영향을 미치는 변수를 추출하였다. 이를 토대로 머신러닝 회귀학습기 모형으로 학습하여 예측력이 높은 모형을 추출하였고, 검증용 데이터를 이용하여 예측 모형의 성능을 검증하였다. 그 결과, 예측력이 높은 모형은 선형회귀모형, 가우스 과정 회귀모형, 서포트 벡터 머신으로 나타났으며, 훈련용 데이터의 비율과 예측력은 비례하지 않은 것으로 나타났다. 또한 예측치와 실측치 차이의 평균치는 크지 않지만, 미세먼지 실측치가 높을 때, 예측력이 다소 떨어지는 것으로 나타났다. 본 연구의 결과는 지자체 데이터 허브를 통해 기상데이터와 관련 도시 빅데이터를 결합함으로써 보다 체계적이고 정밀한 미세먼지 예측 서비스로 개발이 가능할 것이며, 스마트산단의 발전을 촉진하는 계기가 될 것이다.

실제 컨버터 출력 데이터를 이용한 특정 지역 태양광 장단기 발전 예측 (Prediction of Short and Long-term PV Power Generation in Specific Regions using Actual Converter Output Data)

  • 하은규;김태오;김창복
    • 한국항행학회논문지
    • /
    • 제23권6호
    • /
    • pp.561-569
    • /
    • 2019
  • 태양광 발전은 일사량만 있으면 전기에너지를 얻을 수 있기 때문에, 새로운 에너지 공급원으로 용도가 급증하고 있다. 본 논문은 실제 태양광 발전 시스템의 컨버터 출력을 이용하여 장단기 출력 예측을 하였다. 예측 알고리즘은 다중선형회귀와 머신러닝의 지도학습 중 분류모델인 서포트 벡터 머신 그리고 DNN과 LSTM 등 딥러닝을 이용하였다. 또한 기상요소의 입출력 구조에 따라 3개의 모델을 이용하였다. 장기 예측은 월별, 계절별, 연도별 예측을 하였으며, 단기 예측은 7일간의 예측을 하였다. 결과로서 RMSE 측도에 의한 예측 오차로 비교해 본 결과 다중선형회귀와 SVM 보다는 딥러닝 네트워크가 예측 정확도 측면에서 더 우수하였다. 또한, DNN 보다 시계열 예측에 우수한 모델인 LSTM이 예측 정확도 측면에서 우수하였다. 입출력 구조에 따른 실험 결과는 모델 1보다 모델 2가 오차가 적었으며, 모델 2보다는 모델 3이 오차가 적었다.

Prediction of drowning person's route using machine learning for meteorological information of maritime observation buoy

  • Han, Jung-Wook;Moon, Ho-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-12
    • /
    • 2022
  • 해양조난사고 발생 시 해상 익수자의 안전과 생명 보장을 위해 구조자산을 활용한 신속한 탐색 및 구조작전은 매우 중요하다. 본 연구는 해양관측부이에서 수집되는 기상정보에 다중선형회귀분석, 의사결정나무, 서포트벡터머신, 벡터자기회귀, 순환신경망의 LSTM을 활용하여 울릉도 북서해역의 표층해류를 분석하고 유향과 유속에 대한 각각의 예측모형을 구축하여 예측된 유향과 유속정보를 통해 해상 익수자의 이동경로를 예측하는 모형들을 제안한다. 본 연구에서 적용한 다양한 기계학습 모형을 MAE와 RMSE의 성능 평가척도로 비교해 볼 때 LSTM이 가장 우수한 성능을 보였다. 또한, 익수자 이동지점과 예측모형의 예측지점 간 거리 차이에 있어서도 LSTM이 다른 모형들에 비해 탁월한 성능을 나타내었다.

머신러닝 기반 신체 계측정보를 이용한 CT 피폭선량 예측모델 비교 (Comparison of CT Exposure Dose Prediction Models Using Machine Learning-based Body Measurement Information)

  • 홍동희
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제43권6호
    • /
    • pp.503-509
    • /
    • 2020
  • This study aims to develop a patient-specific radiation exposure dose prediction model based on anthropometric data that can be easily measurable during CT examination, and to be used as basic data for DRL setting and radiation dose management system in the future. In addition, among the machine learning algorithms, the most suitable model for predicting exposure doses is presented. The data used in this study were chest CT scan data, and a data set was constructed based on the data including the patient's anthropometric data. In the pre-processing and sample selection of the data, out of the total number of samples of 250 samples, only chest CT scans were performed without using a contrast agent, and 110 samples including height and weight variables were extracted. Of the 110 samples extracted, 66% was used as a training set, and the remaining 44% were used as a test set for verification. The exposure dose was predicted through random forest, linear regression analysis, and SVM algorithm using Orange version 3.26.0, an open software as a machine learning algorithm. Results Algorithm model prediction accuracy was R^2 0.840 for random forest, R^2 0.969 for linear regression analysis, and R^2 0.189 for SVM. As a result of verifying the prediction rate of the algorithm model, the random forest is the highest with R^2 0.986 of the random forest, R^2 0.973 of the linear regression analysis, and R^2 of 0.204 of the SVM, indicating that the model has the best predictive power.

근적외선 분광법 기반 비침습식 혈당 수치 추정 알고리즘 연구 (Research on a Non-invasive Blood Glucose level Estimation Algorithm based on Near- infrared Spectroscopy)

  • 강영만;한순희
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1353-1362
    • /
    • 2023
  • 혈당 수치를 확인하기 위해 사용하는 채혈식 혈당 측정기의 불편함을 해소하기 위한 다양한 방법이 시도되고 있다. 본 논문에서는 근적외선 센서를 이용하여 획득한 스펙트럼 데이터로부터 머신러닝 기술을 사용하여 비침습적으로 혈당 수치를 추정하고자 하였다. 연구에 사용한 비침습식 혈당측정기는 가시광선을 포함하여 총 6개로 구성된 근적외선 발광부와 이를 수신하는 수광부를 가지는데, 손가락과 같은 인체의 특정 부위에 대한 스펙트럼 데이터를 수집하기 위해 만든 기기이다. 혈당 수치에 따라 유의미한 차이가 있는지를 검증하기 위해 머신 러닝 알고리즘들을 통해 혈당 수치 추정을 시도하였다. 수집한 데이터에 5가지 머신 러닝 알고리즘 기법을 적용하면서 다양한 하이퍼 파라미터를 조정한 결과, 서포트 벡터 회귀 알고리즘이 가장 좋은 성능을 나타냄을 확인하였다.

기계학습을 이용한 돈사 급수량 예측방안 개발 (Prediction of Water Usage in Pig Farm based on Machine Learning)

  • 이웅섭;류종열;반태원;김성환;최희철
    • 한국정보통신학회논문지
    • /
    • 제21권8호
    • /
    • pp.1560-1566
    • /
    • 2017
  • 최근 사물 인터넷 센서가 설치된 스마트 돈사의 보급을 통해 돈사 관련 빅데이터 축적이 가능해졌고, 다양한 기계 학습방안들이 수집된 데이터에 적용되어 축산농가의 생산성을 향상시키고 있다. 본 연구에서는 다양한 기계학습 방안을 이용하여 돈사관리에서 가장 중요한 요소 중 하나인 급수량을 예측하였다. 구체적으로 실제 돈사에서 수집된 데이터에 회귀 방안인 선형회귀, 회귀트리 및 아다부스트 회귀 방안과 분류 방안인 로지스틱 분류, 결정트리 및 서포트 벡터 머신 (SVM) 분류방안을 적용하여 돈사의 온도와 습도를 기반으로 급수량을 예측하였다. 성능 분석을 통해서 제안한 방안이 높은 정확도로 급수량을 예측하는 것을 확인할 수 있었다. 제안한 방안은 돈사의 급수시설 이상을 조기에 파악하는데 활용되어 가축을 폐사를 막고 돈사 생산성을 높이는데 활용될 수 있다.

컴퓨팅 사고 교육 게임 데이터를 사용한 게임 점수 예측 모델 성능 비교 연구 (A Comparative Study on Game-Score Prediction Models Using Compuational Thinking Education Game Data)

  • 양영욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.529-534
    • /
    • 2021
  • 컴퓨팅 사고는 21세기에 필요한 중요한 소양 중 하나로 여겨지면서 여러 국가에서 컴퓨팅 사고 교육 과정을 도입하여 시행하고 있다. 컴퓨팅 사고 교육 방법 중 교육용 게임 기반 방법은 학생들의 참여와 동기를 증대시키고 컴퓨팅 사고에 대한 접근성을 높여준다. Autothinking은 학습자들에게 컴퓨팅 사고 교육을 제공하기 위한 목적으로 개발한 교육용 게임으로 학습자들에게 동적으로 피드백을 제공하고, 학습자의 컴퓨팅 사고 능력에 따라서 난이도를 자동으로 조절하는 적응적 시스템이다. 하지만 규칙기반으로 게임을 디자인하여 지능적으로 학습자들의 컴퓨팅 사고를 고려하거나 피드백을 주지 못한다. 본 연구에서는 Autothikning을 통해 수집한 게임 데이터를 소개하고, 이를 활용하여 해당 게임의 적응성을 높이기 위해 컴퓨팅 사고를 반영하는 게임 점수의 예측을 수행한다. 이 문제를 해결하기 위해 회귀 문제에 가장 많이 사용되는 선형 회귀, 결정 트리, 렌덤 포레스트, 서포트 벡터 머신 알고리즘에 대한 비교연구를 수행하였다. 연구 수행결과 선형회귀 방법이 게임 점수 예측에 가장 좋은 성능을 보여주었다.

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

서포트 벡터 머신 기반 비선형 외인성 자귀회귀를 이용한 비선형 조음 모델링 (Nonlinear Speech Production Modeling using Nonlinear Autoregressive Exogenous based on Support Vector Machine)

  • 장승진;김효민;박영철;최홍식;윤영로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.113-116
    • /
    • 2007
  • In this paper, our proposed Nonlinear Autoregressive Exogenous (NARX) based on Least Square-Support Vector Regression (LS-SVR) is introduced and tested for producing natural sounds. This nonlinear synthesizer perfectly reproduce voiced sounds, and also conserve the naturalness such as jitter and shimmer, compared to LPC does not keep these naturalness. However, the results of some phonation are quite different from the original sounds. These results are assumed that single-band model can not afford to control and decompose the high frequency components. Therefore multi-band model with wavelet filterbank is adopted for substituting single band model. As a results, multi-band model results in improved stability. Finally, nonlinear speech modeling using NARX based on LS-SVR can successfully reconstruct synthesized sounds nearly similar to original voiced sounds.