如何專業估算票房?
我真正做這個項目,大概是在中國電影票房開始爆發的2011年。試了壹遍又壹遍,最靠譜的算法還是多元線性回歸,預測目標是官方公布的壹部電影的最終票房值,當時R2達到70%以上。如果排除進口電影,R2可以提高到80%以上。主要是進口電影容易出現黑天鵝,比如《《阿凡達》》,這足以爆炸模式。多元線性回歸看起來很低吧?但是後來我看到壹篇關於預測電影票房的Google論文,意思是最好的票房預測模型還是多元線性回歸。但是這種模式後期的價值並不大,因為中國的電影市場正在超乎想象的蓬勃發展,票房上黑天鵝不斷出現,各種嚴重的票房刷票行為層出不窮,所以對於模式來說,真的是臣妾做不到。電影開拍前預測票房的題目也超過了模型的能力。最初的設計是在電影首映前壹個月開始預測,並定期修正預測值。多元線性回歸中使用的因子總結如下。用戶的期望。根據手機百度指數和微博等媒體的提及次數,搜索或提及次數越多,用戶的期待就越多,也就越容易轉化為票房。核心元素的影響。核心要素包括導演、主演以及是否有前序劇情,比如007系列或者馮小剛都是票房的保證。另壹方面,有些演員是票房毒藥。主要是收集豆瓣上的這些核心因素與電影評分和歷史票房的關系,最後可以歸結為對新電影票房的影響因素。競爭形勢。主要以同期上映影片數量來評價。同期上映的電影越多,競爭越激烈,就越難獲得更高的票房。更進壹步的規劃是加入同期上映影片的預測票房作為衡量競爭對手實力的權重,更準確地評估競爭態勢。簡單地說,與《阿凡達》同時被釋放比與諾言同時被釋放要悲慘得多。基本面主要是目前電影市場的整體情況,我們可以用電影上映前T12M(拖尾12個月)的總票房作為基本面。