• 제목/요약/키워드: MovieNet

검색결과 16건 처리시간 0.024초

Predicting movie audience with stacked generalization by combining machine learning algorithms

  • Park, Junghoon;Lim, Changwon
    • Communications for Statistical Applications and Methods
    • /
    • 제28권3호
    • /
    • pp.217-232
    • /
    • 2021
  • The Korea film industry has matured and the number of movie-watching per capita has reached the highest level in the world. Since then, movie industry growth rate is decreasing and even the total sales of movies per year slightly decreased in 2018. The number of moviegoers is the first factor of sales in movie industry and also an important factor influencing additional sales. Thus it is important to predict the number of movie audiences. In this study, we predict the cumulative number of audiences of films using stacking, an ensemble method. Stacking is a kind of ensemble method that combines all the algorithms used in the prediction. We use box office data from Korea Film Council and web comment data from Daum Movie (www.movie.daum.net). This paper describes the process of collecting and preprocessing of explanatory variables and explains regression models used in stacking. Final stacking model outperforms in the prediction of test set in terms of RMSE.

의미연결망 분석을 활용한 영화 리뷰 시각화 (A Visualization of Movie Reviews based on a Semantic Network Analysis)

  • 김슬기;김장현
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.1-6
    • /
    • 2019
  • 본 연구는 <네이버 영화> 페이지의 리뷰 데이터를 수집하여, 출현 빈도가 높은 단어를 중심으로 영화 관람객의 반응을 시각화하는 작업을 수행하였다. 이를 위해 총 6편의 영화를 선정하여 데이터 수집 및 정제과정을 거쳤으며, 의미연결망 분석(Semantic network analysis)을 활용하여 단어 간 관계성을 파악하고자 하였다. 데이터 시각화 작업에는 UCINET과 함께 패키지화된 NetDraw가 사용되었다. 본 연구의 시사점은 문장으로 작성된 영화 관람객의 리뷰를 키워드 중심으로 시각화하여, 소비자들의 반응을 한 눈에 확인하는 리뷰 인터페이스 구현이 가능한지 탐색하였다는 점이다. 본 연구를 통해 영화 리뷰를 구성하는 키워드를 시각화하고, 리뷰 내용에서 영화별 특성의 차이를 확인하였다는 점에서 본 연구가 의미를 가진다고 하겠다. 후속 연구는 보다 많은 영화의 리뷰를 활용할 필요성이 제기되며, 각 영화별 리뷰의 수도 비슷한 양으로 맞추어 연구에 활용해야 할 것이다.

등장인물들의 시간적 관계 변화에 기초한 스토리 가시화에 관한 연구 (A Study of Story Visualization Based on Variation of Characters Relationship by Time)

  • 박승보;백영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권3호
    • /
    • pp.119-126
    • /
    • 2013
  • 본 논문에서는 영화나 소설과 같이 스토리를 갖는 콘텐츠에 대해 스토리를 가시화해서 보여주는 시스템에 대해 제안하고 설명한다. 스토리를 가시화 해주기 위해 등장인물들 간의 관계를 모형화 하는 Character-net 방법론을 스토리 모형으로 적용하였다. 하지만 Character-net은 전체 스토리를 누적된 형태로 표현하기 때문에 스토리 진행에 따른 변화를 보여주기 한계가 있다. 이의 개선을 위해 Character-net의 변화와 등장인물들의 변화를 분석하여 보여주는 시스템을 개발하였다. 시스템은 Character-net 변화 실행 및 분석창과 등장인물 중심성 변화 시계열 그래프 창으로 구성하였다. 두 가지 창을 통해 주요 등장인물들이 처음 등장하거나 처음 만나는 장면과 같은 등장인물들 사이에서 나타나는 주요 변화지점을 찾는 기능과 인디그리와 아웃디그리의 변화 패턴을 통해 등장인물의 성향이나 성향의 변화를 추적할 수 있도록 지원하는 기능을 구현하였다. 본 논문에서는 이러한 스토리 가시화 시스템에 대해 설명하고 추가적으로 필요한 사항들에 대해 논의한다.

의미연결망 분석을 활용한 영화 리뷰 시각화 (A Visualization of Movie Review based on a Semantic Network Analysis)

  • 김슬기;김장현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.197-200
    • /
    • 2018
  • 본 연구에서는 <네이버 영화> 페이지의 리뷰 데이터를 수집하여, 출현 빈도가 높은 단어를 중심으로 영화 관람객의 반응을 시각화하는 작업을 수행하였다. 이를 위해 총 6편의 영화를 선정하여 데이터 수집 및 정제과정을 거쳤으며, 의미연결망 분석(Semantic network analysis)을 활용하여 단어 간 관계성을 파악하고자 하였다. 데이터 시각화 작업에는 UCINET과 함께 패키지화된 NetDraw가 사용되었다. 본 연구의 시사점은 문장으로 작성된 영화 관람객의 리뷰를 키워드 중심으로 시각화하여, 소비자들의 반응을 한 눈에 확인하는 리뷰 인터페이스 구현이 가능한지 탐색하였다는 점이다.

  • PDF

Character-net을 이용한 스토리 가시화 시스템 (Story Visualization System using Character-net)

  • 박승보;백영태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.29-30
    • /
    • 2013
  • 본 논문에서는 영화나 소설과 같은 콘텐츠의 스토리를 가시화해서 보여주는 시스템에 대해 제안하고 설명한다. 스토리를 가시화 해주기 위해 등장인물들 간의 관계를 모형화하는 Character-net 방법론을 채용하였고 스토리 진행에 따른 Character-net 변화를 분석하여 보여주는 시스템을 개발하였다. 시스템은 Character-net 변화 실행창과 등장인물 중심성 시계열 그래프 창으로 구성하였다. 두 개 창을 통해 스토리 차원의 검색이 가능토록 하였다. 본 논문에서는 스토리 가시화 시스템에 대해 설명하고 추가적으로 필요한 사항들에 대해 논의한다.

  • PDF

스토리기반 저작물에서 감정어 분류에 기반한 등장인물의 감정 성향 판단 (Detection of Character Emotional Type Based on Classification of Emotional Words at Story)

  • 백영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.131-138
    • /
    • 2013
  • 본 논문에서는 등장인물이 대사에서사용한감정어를 이용하여 등장인물의 감정 유형을 분류하는 방법을 제안하고 성능을 평가한다. 감정 유형은 긍정, 부정, 중립의 3 종류로 분류하며, 등장인물이 사용한 감정어를 누적하여 3 종류의 감정 유형 중에 어디에 속하는지를 파악한다. 대사로부터 감정어를 추출하기 위해 WordNet 기반의 감정어 추출 방법을 제안하고 감정어가 가진 감정 성분을 벡터로 표현하는 방식을 제안한다. WordNet은 영어 단어 간에 상위어와 하위어, 유사어 등의 관계로 연결된 네트워크 구조의 사전이다. 이 네트워크 구조에서 최상위의 감정항목과의 거리를 계산하여 단어별감정량을 계산하여 대사를 30 차원의 감정벡터로 표현한다. 등장인물별로 추출된 감정 벡터 성분들을 긍정, 부정, 중립의 3가지 차원으로 축소하여 표현한 후, 등장인물의 감정 성향이 어떻게 나타나는지를 추출한다. 또한 감정 성향의 추출 성능에 대해 헐리우드 영화 4개의 영화에서 12명의 등장인물을 선정하여 평가하여 제안한 방법의 효율성을 측정하였다. 대사는 영어로 이루어진 대사만을 사용하였다. 추출된 감정 성향 판단 성능은 75%의 정확도로 우수한 추출 성능을 나타내었다.

스토리 기반의 정보 검색 연구 (Story-based Information Retrieval)

  • 유은순;박승보
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.81-96
    • /
    • 2013
  • 웹의 발전과 콘텐츠 산업의 팽창으로 비디오 데이터가 폭발적으로 증가함에 따라 데이터의 정보 검색은 매우 중요한 문제가 되었다. 그동안 비디오 데이터의 정보 검색과 브라우징을 위해 비디오의 프레임(frame)이나 숏(shot)으로부터 색채(color)와 질감(texture), 모양(shape)과 같은 시각적 특징(features)들을 추출하여 비디오의 내용을 표현하고 유사도를 측정하는 내용 기반(content-based)방식의 비디오 분석이 주를 이루었다. 영화는 하위 레벨의 시청각적 정보와 상위 레벨의 스토리 정보를 포함하고 있다. 저차원의 시각적 특징을 통해 내용을 표현하는 내용 기반 분석을 영화에 적용할 경우 내용 기반 분석과 인간이 인지하는 영화의 내용 사이에는 의미적 격차(semantic gap)가 발생한다. 왜냐하면 영화의 스토리는 시간의 진행에 따라 그 내용이 변하고, 관점에 따라 주관적 해석이 가능한 고차원의 의미정보이기 때문이다. 따라서 스토리 차원의 정보 검색을 위해서는 스토리를 모델링하는 정형화된 모형이 필요하다. 최근 들어 소셜 네트워크 개념을 활용한 스토리 기반의 비디오 분석 방법들이 등장하고 있다. 그러나 영화 속 등장인물들의 소셜 네트워크를 통해 스토리를 표현하는 이 방법들은 몇 가지 문제점들을 드러내고 있다. 첫째, 등장인물들의 관계에만 초점이 맞추어져 있으며, 스토리 진행에 따른 등장인물들의 관계 변화를 역동적으로 표현하지 못한다. 둘째, 등장인물의 정체성과 심리상태를 보여주는 감정(emotion)과 같은 심층적 정보를 간과하고 있다. 셋째, 등장인물 이외에 스토리를 구성하는 사건과 배경에 대한 정보들을 반영하지 못하고 있다. 따라서 본 연구는 기존의 스토리 기반의 비디오 분석 방법들의 한계를 살펴보고, 문제 해결을 위해 문학 이론에서 제시하고 있는 서사 구조에 근거하여 스토리 모델링에 필요한 요소들을 인물, 배경, 사건의 세 가지 측면에서 제시하고자 한다.

ConceptNet기반 장르별 감정분류를 적용한 협업 필터링 추천시스템 (A Collaborative Filtering Recommendation System using ConceptNet-based Mood Classification by Genre)

  • 최형탁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.216-219
    • /
    • 2011
  • 인터넷 기술이 빠르게 발전하고 변화하여 현재는 많은 수의 컨텐츠와 프로그램 채널이 IP 네트워크를 통해 제공되면서 컨텐츠 서비스 사업자들은 좀 더 향상된 추천시스템이 필요하게 되었다. 그리고 사용자 참여중심의 인터넷 환경인 Web 2.0 시대가 도래하면서 사용자가 직접 생성한 정보들을 활용하는 다양한 연구가 진행되고 있다. 본 논문에서는 타겟 아이템에 대해 인터넷 상에 수많은 사용자들이 생성한 정보들을 ConceptNet을 활용하여 감정벡터를 추출하고 장르별로 분류하는 방법을 결합한 새로운 형태의 영화 추천시스템을 제안한다. 공개용 영화 데이터인 MovieLens 데이터 셋을 이용하여 실험하였고 성능평가는 RMSE 방법과 다양한 추천평가방법으로 기존 협업 필터링 추천시스템과 비교하였으며 실험 결과 기존방식보다 향상된 성능을 보였다.

감정어 추출을 통한 등장인물 성향 가시화 연구 (Visualization Study of Character Type by Emotion Word Extraction)

  • 백영태;박승보
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.31-32
    • /
    • 2013
  • 본 논문에서는 영화의 등장인물의 성향을 파악하기 위해 시나리오의 대사로부터 감정어를 추출하고, 등장인물의 감정어들을 긍정, 부정, 중립의 3개로 단순화하여 등장인물의 성향을 가시화 시켜주는 방법을 제안한다. 대사로부터 감정어를 추출하기 위해 WordNet 기반의 감정어 추출 방법을 제안한다. WordNet은 단어 간에 상위어와 하위어, 유사어 등의 관계로 연결된 네트워크 구조의 사전이다. 이 네트워크 구조에서 최상위의 감정 항목과의 거리를 계산하여 단어별 감정량을 계산하여 대사를 30 차원의 감정 벡터로 표현한다. 등장인물별로 추출된 감정 벡터를 긍정, 부정, 중립의 3개의 차원으로 단순화 하여 등장인물의 성향을 표현한다.

  • PDF

영상 콘텐츠의 오디오 분석을 통한 메타데이터 자동 생성 방법 (Method of Automatically Generating Metadata through Audio Analysis of Video Content)

  • 용성중;박효경;유연휘;문일영
    • 한국항행학회논문지
    • /
    • 제25권6호
    • /
    • pp.557-561
    • /
    • 2021
  • 영상 콘텐츠를 사용자에게 추천하기 위해서는 메타데이터가 필수적인 요소로 자리 잡고 있다. 하지만 이러한 메타데이터는 영상 콘텐츠 제공자에 의해 수동적으로 생성되고 있다. 본 논문에서는 기존 수동으로 직접 메타데이터를 입력하는 방식에서 자동으로 메타데이터를 생성하는 방법을 연구하였다. 기존 연구에서 감정 태그를 추출하는 방법에 추가로 영화 오디오를 통한 장르와 제작국가에 대한 메타데이터 자동 생성 방법에 대해 연구를 진행하였다. 전이학습 모델인 ResNet34 인공 신경망 모델을 이용하여 오디오의 스펙트로그램으로부터 장르를 추출하고, 영화 속 화자의 음성을 음성인식을 통해 언어를 감지하였다. 이를 통해 메타데이터를 생성 인공지능을 통해 자동 생성 가능성을 확인할 수 있었다.