• 제목/요약/키워드: 가능성 기반 서포트 벡터머신

검색결과 16건 처리시간 0.02초

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

GIS와 기계학습을 이용한 지하수 가능성도 작성 연구 현황 (Status of Groundwater Potential Mapping Research Using GIS and Machine Learning)

  • 이사로
    • 대한원격탐사학회지
    • /
    • 제36권6_1호
    • /
    • pp.1277-1290
    • /
    • 2020
  • 지표수와 지하수로 이루어진 수자원은 세계적으로 가장 중요한 천연자원 중 하나로 여겨진다. 지난 세기 이후 급속한 산업화와 급증하는 인구로 인해, 생활용, 산업용, 농업용수 수요가 급증하고 있으며, 이에 대한 지하수 수요도 급증하고 있다. 따라서 지하수에 대한 지속 가능한 개발과 관리를 위해서는 정확한 위치기반의 지하수 가능성도 작성이 필수적이다. 최근에는 기계학습과 지리정보시스템 통합이 지하수 가능성도 작성에 효과적인 방법이 되고 있다. 이러한 통합접근법의 현황 파악을 위해 6년(2015~2020년) 동안 94편의 직접 관련 논문에 대한 체계적 검토를 실시했다. 문헌 검토에 따르면, 매년 발간되는 연구의 수는 시간이 지남에 따라 급격히 증가했다. 전체 연구 분야는 15개국에 걸쳐 있으며, 85%의 연구가 이란, 인도, 중국, 한국, 이라크에 집중되었다. 지하수 산출 가능성 조사에는 20개의 변수가 자주 사용된 것으로 조사되었으며, 이 중 지형고도, 경사, 경사방향, 지형습도지수, 지질, 토지 이용 피복, 하천 밀도, 강과의 거리, 강우량 등이 자주 사용되는 것으로 나타났다. 기계학습 모델에 있어 랜덤 포레스트, 서포트벡터머신, 부스트 회귀트리 등의 방법이 많이 사용되었다. 이러한 문헌 연구는 최적의 결과를 위해 지하수 가능성도를 저비용 대체물이 아닌 현장 작업을 보완하는 도구로 사용해야 한다는 것을 보여준다. 마지막으로, 향후, 지하수 가능성도 작성의 표준화 및 정확성을 개선하기 위해 더 많은 연구가 진행되어야 할 것이다.

Hi, KIA! 기계 학습을 이용한 기동어 기반 감성 분류 (Hi, KIA! Classifying Emotional States from Wake-up Words Using Machine Learning)

  • 김태수;김영우;김근형;김철민;전형석;석현정
    • 감성과학
    • /
    • 제24권1호
    • /
    • pp.91-104
    • /
    • 2021
  • 본 연구에서는 승용차에서 사람들이 기기를 사용하기 위해 사용하는 기동어인 "Hi, KIA!"의 감성을 기계학습을 기반으로 분류가 가능한가에 대해 탐색하였다. 감성 분류를 위해 신남, 화남, 절망, 보통 총 4가지 감정별로 3가지 시나리오를 작성하여, 자동차 운전 상황에서 발생할 수 있는 12가지의 사용자 감정 시나리오를 제작하였다. 시각화 자료를 기반으로 총 9명의 대학생을 대상으로 녹음을 진행하였다. 수집된 녹음 파일의 전체 문장에서 기동어 부분만 별도로 추출하는 과정을 거쳐, 전체 문장 파일, 기동어 파일 총 두 개의 데이터 세트로 정리되었다. 음성 분석에서는 음향 특성을 추출하고 추출된 데이터를 svmRadial 방법을 이용하여 기계 학습 기반의 알고리즘을 제작해, 제작된 알고리즘의 감정 예측 정확성 및 가능성을 파악하였다. 9명의 참여자와 4개의 감정 카테고리를 통틀어 기동어의 정확성(60.19%: 22~81%)과 전체 문장의 정확성(41.51%)을 비교했다. 또한, 참여자 개별로 정확도와 민감도를 확인하였을 때, 성능을 보임을 확인하였으며, 각 사용자 별 기계 학습을 위해 선정된 피쳐들이 유사함을 확인하였다. 본 연구는 기동어만으로도 사용자의 감정 추출과 보이스 인터페이스 개발 시 기동어 감정 파악 기술이 잠재적으로 적용 가능한데 대한 실험적 증거를 제공할 수 있을 것으로 기대한다.

서포트 벡터 머신을 이용한 NCAM-LAMP 고해상도 중기예측시스템 지점 시계열 자료의 통계적 보정 (A Statistical Correction of Point Time Series Data of the NCAM-LAMP Medium-range Prediction System Using Support Vector Machine)

  • 권수영;이승재;김만일
    • 한국농림기상학회지
    • /
    • 제23권4호
    • /
    • pp.415-423
    • /
    • 2021
  • NCAM-LAMP 중기예측 자료의 통계적 후처리와 개선을 위하여 R 기반의 지점 시계열 자료 검증 체계를 구축하였다. 이 시계열 검증체계를 이용하여 기상청 AWS 관측 자료와 NCAM-LAMP, KMA GDAPS 중기예측 모델 자료를 비교하였다. 이를 위해 관측 지점에 가장 근접한 모델 위도 및 경도 자료를 추출하여 총 9개 지점을 선정하였다. 각 지점에 대해 NCAM-LAMP, GDAPS 모델의 기온, 강수량, 풍속 일평균 예측 자료를 관측과 비교한 결과, 모델들은 풍속의 과대예측 경향을 뚜렷이 보였으며, 기온과 강수의 경우에는 두 모델의 예측력이 월별 및 변수별로 다르게 나타났다. 이를 바탕으로 본 연구에서는 통계적 기법을 개발하여 NCAM-LAMP가 가지고 있는 오차를 줄이고자 하였다. 모델 오차를 줄이기 위해 일반적으로 쓰이는 MOS(Model Output Statistics)기법 중에 인공지능 SVM(Support vector machine) 방식을 8~10월 기간에 적용한 결과, 8월에 비해서 10월이, 기온 변수에 비해서 바람과 강수 변수가 개선된 효과를 보여주었다. 이러한 결과는 풍속의 과대예측을 줄이고, 농림 가뭄지수와 산사태 예측 등을 개선시키며, 지역 수치예보 모델이 시간 적분됨에 따라 영역 내 예측가능성이 점점 저하되는 현상을 완화시키는데 SVM 방법이 일정 부분 기여할 수 있음을 가리키며, 현업 표출 중인 NCAM Agro-Meteogram 개선에도 도움을 줄 것으로 기대된다.

KOMPSAT-3A 위성영상과 토지피복도를 활용한 산림식생의 임상 분류법 개발 (Development of a Classification Method for Forest Vegetation on the Stand Level, Using KOMPSAT-3A Imagery and Land Coverage Map)

  • 송지용;정종철;이상훈
    • 한국환경생태학회지
    • /
    • 제32권6호
    • /
    • pp.686-697
    • /
    • 2018
  • 오늘날 원격탐지기술의 발달로 인해, 산림지역과 같이 피복 분류작업이 난해한 지역을 비롯한 광범위한 지역에서의 세밀한 변화탐지를 위한 고해상도 위성영상 취득이 가능해졌다. 하지만, 고해상도 영상에 대한 시계열분석의 과정에서 많은 양의 지상 관측 데이터가 요구된다. 본 연구에서는 토지피복도를 지상 관측데이터로 활용한 위성영상 분류 방법의 가능성을 시험하였다. 연구대상지는 강원도 원주시이며, 산림지역과 시가화지역이 공존하는 공간이다. 연구 자료는 2015년 3월에 촬영된 KOMPSAT-3A 영상과 2017년도 토지피복도를 이용하여 분류를 시도하였다. 서포트벡터머신(SVM)과 랜덤포레스트(RF)의 두 가지 상이한 화소기반 분류기법을 적용하여 대상지에 대한 피복분류의 분류정확도를 비교 분석하였으며, SVM 분석의 경우 다수 분석(Majority analysis)을 후속 진행하였다. 분석대상은 산림식생만 포함한 지역과 연구대상지 전지역으로 구분하였고, 대상 면적이 협소한 습지는 분석과정에서 제외하였다. 분류 결과는 오차 행렬의 전체 정확도가 두 가지 분류대상에 대해 RF 기법이 SVM 기법보다 더 나은 것으로 나타났다. 산림지역만을 대상으로 한 경우, RF 기법이 SVM 기법에 비해 18.3% 높은 값을 나타낸 반면, 전체지역을 대상으로 한 경우는 둘 사이의 간격이 5.5%로 줄어들었다. SVM 기법에 다수 분석 (Majority analysis)을 추가로 실시한 경우, 1% 정도의 정확도 향상이 나타났다. RF 기법은 산림지역의 활엽수를 분석해 내는데 상당히 효과적이었지만, 다른 대상에 대해서는 SVM 기법이 더 나은 결과를 나타내었다. 본 연구는 고해상도 단일시기 영상에 대한 화소 기반의 분류기법을 시험한 것으로, 추후 시계열분석 및 객체기반 분류기법의 추가적인 적용으로 향상된 정확도와 신뢰도를 얻을 수 있을 것으로 판단된다. 이 연구의 방법론은 시공간적으로 고해상도 분석결과를 제공함으로써, 대면적의 토지계획에 유용할 것으로 기대된다.

중소기업 기술 유출에 대한 조기경보시스템 개발에 대한 연구 (Development on Early Warning System about Technology Leakage of Small and Medium Enterprises)

  • 서봉군;박도형
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.143-159
    • /
    • 2017
  • 급속한 IT의 발전으로 인해 개인정보뿐만 아니라 기업이 보유하고 있는 핵심 기술 및 정보에 대한 유출 위협이 중요한 이슈로 인식되고 있다. 기업에게 있어서 보유하고 있는 핵심 기술은 기업의 생존 및 지속적으로 경쟁 우위를 차지하기 위해 매우 중요한 부분이다. 최근 기술 침해 사례가 많이 일어나고 있는데, 기술 유출은 기업에게 있어서 주가하락 등의 막대한 재무적인 손실을 가져올 뿐만 아니라, 기업의 신뢰에 손상을 입게 되고, 기업의 발전을 지연시키게 되는 악영향을 미치게 된다. 특히, 대기업에 비해 핵심기술이 기업 내 중요한 많은 부분을 차지하는 중소기업에 있어서 기술 유출에 대한 대비는 기업의 존립에 있어서 필수적인 요소로 볼 수 있다. 이처럼 정보 보안 관리의 필요성과 중요성이 대두되면서 기업 입장에서 조기에 기술 침해 위협에 대해 확인하고 대비할 필요가 있다. 본 연구에서는 기술 유출에 영향을 미치는 요인들을 탐색하는 실증 분석을 수행하고, 인공지능 알고리즘을 통해 기술유출 조기경보시스템을 개발하고자 한다. 구체적으로 본 연구에서는 중소기업이 보유한 기술 유출에 영향을 미치는 요인들을 로지스틱 회귀분석을 통해 확인해보고, 통계분석을 통해 검증된 요인들을 기반으로 인공지능 여러 기법들 중 하나인 Support Vector Machine을 활용하여 기술침해 가능성을 조기에 알려주는 모형을 개발하였다. 본 연구에서 제안하는 기술 유출 가능성에 대한 조기 경보 모형을 통해 기업 및 정부 관점에서 기술 유출을 미리 예방할 수 있는 기회를 제공할 수 있을 것으로 기대된다.