• 제목/요약/키워드: Box Office Prediction

검색결과 30건 처리시간 0.03초

영화 매출 예측 성능 향상을 위한 경쟁 분석 (Competition Analysis to Improve the Performance of Movie Box-Office Prediction)

  • 하귀갑;이수원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권9호
    • /
    • pp.437-444
    • /
    • 2017
  • 영화 매출에 대한 연구가 많이 있었지만 공통적인 핵심주제는 영화 매출에 대한 효율적인 예측모델을 훈련하는 것이다. 그러나 과거의 연구에서는 예측 오차를 발생시키는 요인에 대한 분석이 부족하여 이러한 오차를 줄이는 방법에 대한 연구가 이루어지지 않았다. 본 연구에서는 같은 시기에 개봉되고 있는 영화들 간의 영향이 예측 오차에 대한 주요인이라는 가정하에 한 영화가 다른 경쟁영화에서 영향을 받는 정도(경쟁값)를 분석하여 영화매출예측 성능을 향상시키는 것을 목표로 한다. 경쟁값을 예측하기 위하여, 먼저 경쟁값의 극성(양수/음수)에 대해 분류하고 양수의 확률과 음수의 확률을 계산한 다음 회귀분석을 이용하여 양수인 값과 음수인 값을 예측한다. 마지막으로, 확률값과 예측값을 통하여 경쟁값의 기댓값을 계산하여 초기 예측된 매출을 보정한다. 실험 결과에 의하면 제안 방법을 통하여 영화 매출 예측의 정확도가 향상됨을 알 수 있었다.

뇌과학 기반의 디즈니 애니메이션 흥행 예측 AI 모형 개발 연구 (A Study on Development of Disney Animation's Box-office Prediction AI Model Based on Brain Science)

  • 이종은;양은영
    • 디지털융복합연구
    • /
    • 제16권9호
    • /
    • pp.405-412
    • /
    • 2018
  • 영화 흥행의 예측이 필요한 시점은 영화 제작 전에 시나리오에 대한 투자를 결정하는 시점이다. 이런 요구에 따라 최근 인공지능 기반 시나리오 분석 서비스가 출시되었으나, 아직 그 알고리즘이 완벽하지는 않다. 본 연구의 목적은 인간의 뇌 작동 기작에 기반 하여, 영화 시나리오 흥행 예측 모형을 제시하는 것이다. 이를 위해 베버의 자극 반응 법칙과 뇌의 자극 기작 이론 등을 적용하여, 디즈니 애니메이션 흥행작의 시각, 청각, 인지적 자극의 타임 스펙트럼 패턴 도출을 시도한 결과는 다음과 같다. 첫째, 흥행작에서 나타난 뇌 자극의 빈도가 비 흥행작보다 약 1.79배가 많았다. 둘째로, 흥행작에서는 지각 자극 코드들이 타임 스펙트럼 상에 고른 분포를 보인 반면에 비흥행작에서는 집중 분포를 보였다. 셋째로, 흥행작에서는 인지적 부담이 큰 인지적 자극은 주로 단독적으로 등장한 반면에, 인지적 부담이 적은 시각적, 청각적 자극은 두 가지가 동시에 등장하였다.

공연예술에서 광고포스터의 이미지 특성을 활용한 딥러닝 기반 관객예측 (Deep Learning-Based Box Office Prediction Using the Image Characteristics of Advertising Posters in Performing Arts)

  • 조유정;강경표;권오병
    • 한국전자거래학회지
    • /
    • 제26권2호
    • /
    • pp.19-43
    • /
    • 2021
  • 공연예술 기관에서의 공연에 대한 흥행 예측은 공연예술 산업 및 기관에서 매우 흥미롭고도 중요한 문제이다. 이를 위해 출연진, 공연장소, 가격 등 정형화된 데이터를 활용한 전통적인 예측방법론, 데이터마이닝 방법론이 제시되어 왔다. 그런데 관객들은 공연안내 포스터에 의하여 관람 의도가 소구되는 경향이 있음에도 불구하고, 포스터 이미지 분석을 통한 흥행 예측은 거의 시도되지 않았다. 그러나 최근 이미지를 통해 판별하는 CNN 계열의 딥러닝 방법이 개발되면서 포스터 분석의 가능성이 열렸다. 이에 본 연구의 목적은 공연 관련 포스터 이미지를 통해 흥행을 예측할 수 있는 딥러닝 방법을 제안하는 것이다. 이를 위해 KOPIS 공연예술 통합전산망에 공개된 포스터 이미지를 학습데이터로 하여 Pure CNN, VGG-16, Inception-v3, ResNet50 등 딥러닝 알고리즘을 통해 예측을 수행하였다. 또한 공연 관련 정형데이터를 활용한 전통적 회귀분석 방법론과의 앙상블을 시도하였다. 그 결과 흥행 예측 정확도 85%를 상회하는 높은 판별 성과를 보였다. 본 연구는 공연예술 분야에서 이미지 정보를 활용하여 흥행을 예측하는 첫 시도이며 본 연구에서 제안한 방법은 연극 외에 영화, 기관 홍보, 기업 제품 광고 등 포스터 기반의 광고를 하는 영역으로도 적용이 가능할 것이다.

영화 관객 수 예측을 위한 기계학습 기법의 성능 평가 연구 (A Study on the Performance Evaluation of Machine Learning for Predicting the Number of Movie Audiences)

  • 정찬미;민대기
    • 한국전자거래학회지
    • /
    • 제25권2호
    • /
    • pp.49-63
    • /
    • 2020
  • 영화 제작에 막대한 비용이 투입되지만 관객수요는 매우 불확실하기 때문에 개선된 수요예측은 수익 개선을 위한 의사결정의 중요 수단으로 활용될 수 있다. 본 연구에서는 영화의 개봉 후 수요를 예측함에 있어 기계학습 기법의 적용 타당성을 예측 성능의 관점에서 검증하였다. 분석결과를 종합하면 다음과 같다. 첫째, 대안변수에 대한 통계적 검증 결과 기본 영화 특성(감독, 배우)과 함께 개봉 후 2주차까지의 스크린수, 상영횟수, 관객수, 주요 배우에 대한 관심도 등 시계열 자료가 수요예측에 유의미한 것을 확인하였다. 둘째, Random Forest Classifier와 SVM(Support Vector Machine) 등 분류 기반 기계학습 기법과 Random Forest Regressor와 k-NN Regressor와 같은 회귀모형 기반 기계학습 기법에 적용하여 예측 성능을 평가한 결과, Random Forest 기법이 우수한 결과를 보였다. 셋째, 누적관객수가 1분위보다 작은 영화에서 회귀모형 기반 기법은 낮은 예측 정확도를 보였으며, 분류기반 기법은 반대로 가장 우수한 결과를 얻었다. 즉, 영화 수요의 분포 특성에 따라서 차별화된 기계학습 기법을 적용하는 것이 필요하다.

개봉 전후 트윗 개수의 증감률과 영화 매출간의 상관관계 (A Study of Correlation Analysis between Increase / Decrease Rate of Tweets Before and After Opening and a Box Office Gross)

  • 박지윤;유인혁;강성우
    • 대한안전경영과학회지
    • /
    • 제19권4호
    • /
    • pp.169-182
    • /
    • 2017
  • Predicting a box office gross in the film industry is an important goal. Many works have analyzed the elements of a film making. Previous studies have suggested several methods for predicting box office such as a model for distinguishing people's reactions by using a sentiment analysis, a study on the period of influence of word-of-mouth effect through SNS. These works discover that a word of mouth (WOM) effect through SNS influences customers' choice of movies. Therefore, this study analyzes correlations between a box office gross and a ratio of people reaction to a certain movie by extracting their feedback on the film from before and after of the film opening. In this work, people's reactions to the movie are categorized into positive, neutral, and negative opinions by employing sentiment analysis. In order to proceed the research analyses in this work, North American tweets are collected between March 2011 and August 2012. There is no correlation for each analysis that has been conducted in this work, hereby rate of tweets before and after opening of movies does not have relationship between a box office gross.

Text Mining and Sentiment Analysis for Predicting Box Office Success

  • Kim, Yoosin;Kang, Mingon;Jeong, Seung Ryul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권8호
    • /
    • pp.4090-4102
    • /
    • 2018
  • After emerging online communications, text mining and sentiment analysis has been frequently applied into analyzing electronic word-of-mouth. This study aims to develop a domain-specific lexicon of sentiment analysis to predict box office success in Korea film market and validate the feasibility of the lexicon. Natural language processing, a machine learning algorithm, and a lexicon-based sentiment classification method are employed. To create a movie domain sentiment lexicon, 233,631 reviews of 147 movies with popularity ratings is collected by a XML crawling package in R program. We accomplished 81.69% accuracy in sentiment classification by the Korean sentiment dictionary including 706 negative words and 617 positive words. The result showed a stronger positive relationship with box office success and consumers' sentiment as well as a significant positive effect in the linear regression for the predicting model. In addition, it reveals emotion in the user-generated content can be a more accurate clue to predict business success.

Movie Box-office Prediction using Deep Learning and Feature Selection : Focusing on Multivariate Time Series

  • Byun, Jun-Hyung;Kim, Ji-Ho;Choi, Young-Jin;Lee, Hong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.35-47
    • /
    • 2020
  • 박스 오피스 예측은 영화 이해관계자들에게 중요하다. 따라서 정확한 박스 오피스 예측과 이에 영향을 미치는 주요 변수를 선별하는 것이 필요하다. 본 논문은 영화의 박스 오피스 예측 정확도 향상을 위해 다변량 시계열 데이터 분류와 주요 변수 선택 방법을 제안한다. 연구 방법으로 한국 영화 일별 데이터를 KOBIS와 NAVER에서 수집하였고, 랜덤 포레스트(Random Forest) 방법으로 주요 변수를 선별하였으며, 딥러닝(Deep Learning)으로 다변량 시계열을 예측하였다. 한국의 스크린 쿼터제(Screen Quota) 기준, 딥러닝을 이용하여 영화 개봉 73일째 흥행 예측 정확도를 주요 변수와 전체 변수로 비교하고 통계적으로 유의한지 검정하였다. 딥러닝 모델은 다층 퍼셉트론(Multi-Layer Perceptron), 완전 합성곱 신경망(Fully Convolutional Neural Networks), 잔차 네트워크(Residual Network)로 실험하였다. 결과적으로 주요 변수를 잔차 네트워크에 사용했을 때 예측 정확도가 약 93%로 가장 높았다.

데이터마이닝을 이용한 박스오피스 예측 (Prediction of box office using data mining)

  • 전성현;손영숙
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1257-1270
    • /
    • 2016
  • 본 연구는 영화 흥행의 척도로서 총 관객수의 예측을 다루었다. 의사결정나무, MLP 신경망모형, 다항로짓모형, support vector machine과 같은 데이터마이닝 분류 기법들을 사용하여 개봉 전, 개봉 일, 개봉 1주 후, 그리고 개봉 2주 후 시점 별로 예측이 이루어진다. 국적, 등급, 개봉 월, 개봉 계절, 감독, 배우, 배급사, 관객수, 그리고 스크린 수와 같은 영화의 내재적인 속성을 나타내는 변수 뿐만 아니라 포털의 평점과 평가자 수, 블로그 수, 뉴스 수와 같은 온라인 구전 변수들이 예측변수로 사용되었다. 10-중 교차 검증에서 신경망모형의 정확도는 개봉 전 시점에서도 90% 이상의 높은 예측력을 보였다. 또한 최종 온라인 구전 변수의 추정치를 예측변수로 추가함으로서 예측의 정확도가 더 높아짐을 볼 수 있다.

딥러닝을 이용한 음악흥행 예측모델 개발 연구 (A Study on Development of a Prediction Model for Korean Music Box Office Based on Deep Learning)

  • 이도연;장병희
    • 한국콘텐츠학회논문지
    • /
    • 제20권8호
    • /
    • pp.10-18
    • /
    • 2020
  • 본 연구에서는 콘텐츠 산업 중 음악 분야 2차 산업데이터를 활용하여 딥러닝 기법을 이용한 흥행 예측모델 구축 가능성을 살펴보았다. 본 연구를 통해 구축한 딥러닝 예측 모델은 17개 독립변인 -가수 파워, 가수 영향력, 피처링 가수 파워, 피처링 가수 영향력, 참여 가수 수, 참여 가수의 성별, 작사가 역량, 작곡가 역량, 편곡가 역량, 제작사 역량, 유통사 역량, 앨범의 타이틀 여부, 음원 스트리밍 플랫폼 좋아요 수, 음원 스트리밍 플랫폼 코멘트 수, 사전 홍보 기사 수, 티저 영상 조회 수, 초기 흥행성과를 기반으로 음원 흥행성과 -음원이 차트내 상주하는 기간을 예측하는 구조다. 추가적으로 본 연구가 딥러닝 기법을 콘텐츠 분야에 접목시킨 초기단계 연구임을 고려하여, 콘텐츠 흥행예측 선행연구에서 요인 추출을 위해 활용하는 선형회귀분석을 통해 변인 소거 후 구축한 DNN 예측모델과 예측률 비교를 진행하였다.

영화 흥행에 영향을 미치는 새로운 변수 개발과 이를 이용한 머신러닝 기반의 주간 박스오피스 예측 (Development of New Variables Affecting Movie Success and Prediction of Weekly Box Office Using Them Based on Machine Learning)

  • 송정아;최근호;김건우
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.67-83
    • /
    • 2018
  • 2013년 누적인원 2억명을 돌파한 한국의 영화 산업은 매년 괄목할만한 성장을 거듭하여 왔다. 하지만 2015년을 기점으로 한국의 영화 산업은 저성장 시대로 접어들어, 2016년에는 마이너스 성장을 기록하였다. 영화산업을 이루고 있는 각 이해당사자(제작사, 배급사, 극장주 등)들은 개봉 영화에 대한 시장의 반응을 예측하고 탄력적으로 대응하는 전략을 수립해 시장의 이익을 극대화하려고 한다. 이에 본 연구는 개봉 후 역동적으로 변화하는 관람객 수요 변화에 대한 탄력적인 대응을 할 수 있도록 주차 별 관람객 수를 예측하는데 목적을 두고 있다. 분석을 위해 선행연구에서 사용되었던 요인 뿐 아니라 개봉 후 역동적으로 변화하는 영화의 흥행순위, 매출 점유율, 흥행순위 변동 폭 등 선행연구에서 사용되지 않았던 데이터들을 새로운 요인으로 사용하고 Naive Bays, Random Forest, Support Vector Machine, Multi Layer Perception등의 기계학습 기법을 이용하여 개봉 일 후, 개봉 1주 후, 개봉 2주 후 시점에는 차주 누적 관람객 수를 예측하고 개봉 3주 후 시점에는 총 관람객 수를 예측하였다. 새롭게 제시한 변수들을 포함한 모델과 포함하지 않은 모델을 구성하여 실험하였고 비교를 위해 매 예측시점마다 동일한 예측 요인을 사용하여 총 관람객 수도 예측해보았다. 분석결과 동일한 시점에 총 관람객 수를 예측했을 경우 보다 차주 누적 관람객 수를 예측하는 것이 더 높은 정확도를 보였으며, 새롭게 제시한 변수들을 포함한 모델의 정확도가 대부분 높았으며 통계적으로 그 차이가 유의함으로써 정확도에 기여했음을 확인할 수 있었다. 기계학습 기법 중에는 Random Forest가 가장 높은 정확도를 보였다.