• Title/Summary/Keyword: 시스템 식별 방법

검색결과 933건 처리시간 0.022초

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

영상분석기법을 활용한 사육밀도에 따른 급이·급수 및 휴식공간별 육계의 행동특성 분석 (Analysis of Behavioral Characteristics of Broilers by Feeding, Drinking, and Resting Spaces according to Stocking Density using Image Analysis Technique)

  • 김현수;강환구;강보석;김찬호
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.558-569
    • /
    • 2020
  • 본 연구는 국내 육계농가의 사육규모 대형화에 따라 정밀축산(PLF)의 관점에서 ICT기반 영상분석기법을 활용하여 사육밀도에 따른 육계의 영역별 머무는 빈도(%)에 대해 평가하고, 일령별 육계의 정상적인 행동패턴을 이해하고자 수행하였다. 경기도 소재 육계농장 내 설치된 시험계사(3.3×2.7 m)에서 Ross308 육계를 공시축으로 이용하였다. 사육 밀도는 각각 9.5 수/㎡ (n=85), 19 수/㎡ (n=170)로 하였으며, 탑뷰(top view) 카메라를 이용해 급이·급수 및 휴식공간 영역별 머무는 빈도(%)를 모니터링 하였다. 사육밀도에 따라 개체 식별된 육계 3수에 대해 일령별(12, 16, 22, 27, 및 29일)로 6시간씩 영상이미지 데이터를 획득하였다. 수집된 영상데이터는 물체 추적(object tracking) 기법으로 초당 30프레임으로 약 64만장의 프레임을 연결하여 누적 이동경로를 기록하여 영역별 머무는 빈도(%)를 수치화하였다. 각 사육밀도에서 영역별 머무는 빈도(%)는 휴식공간, 급이영역, 급수영역 순으로 유의적인 차이를 나타내었다(p<0.001). 사육밀도(9.5 수/㎡)에서는 57.9, 24.2, 17.9%으로 나타났으며, 사육밀도(19 수/㎡)에서는 73.2, 16.8, 10.0%로 나타났다. 결과적으로 ICT기반 영상분석기법을 활용해 육계의 스트레스를 최소화하는 방법으로 사육밀도에 따른 육계의 영역별 머무는 빈도(%)를 평가할 수 있으며, 향후 본 연구결과는 실시간 모니터링을 통한 ICT기반 사양관리 시스템을 개발하는데 기초자료로 활용될 수 있을 것으로 기대된다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.