刷分现象频发的IMDb,凭什么比豆瓣靠谱?

30年过去,创立于1990年的IMDb仍然是世界上最为权威的电影评分网站之一。

IMDb一开始只是一个资料库,字母名称含义是“互联网电影资料库”。做着做着,评分功能满足了影迷的需要,逐渐变得不可或缺。

以前观众只能通过看报纸上的影评或听其他人的说法来判断一部电影的好坏,在互联网时代,一个评分就可以直观反映出一部电影是否值得一看。

作为一个全民参与的评分系统,和豆瓣一样,IMDb一路以来也遭到了不少的质疑和非议,恶意刷分的现象络绎不绝。

不过,IMDb评分的影响力基本没受到影响。

为什么IMDb能够长期保持着江湖地位,始终是豆瓣评分的“老大哥”?

①评分机制

相比豆瓣简单粗暴的总分除以评价用户数量得出平均分,IMDb的评分机制要更复杂一些。

最明显的一个区别是,豆瓣只有一个分数,而IMDb有两个。

比如《教父》,常规页面的评分是9.2。

到了Top250却变成了9.1分。

豆瓣虽然模仿IMDb做了个Top250榜单,但其实只是简单地把所有电影按分数和评价人数两项指标做了个排名。评价人数的多少会影响排名,并不会影响分数,所以一些分数稍低的电影,有可能会比自己高分的电影排名更高。

IMDb Top250的分数却是“独立”的,与常规分数的计算方式不同。

一部电影的好坏需要经受时间的考验,因为哪怕是热门电影,也并不是所有的人都会第一时间去看。所以很多电影的评分都是越变越低。

为了保证Top250榜单不容易被新出来的热门电影颠覆,能尽可能代表单部电影的影史地位,IMDb为这个重要的榜单专门设置了一个公式算法,并对外公开。

Weighted Rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C。

简称贝叶斯统计算法。

影响公式结果WR的共有四个量,三个变量和一个定量。

第一个是v,意思是评价人数;

只有达到一定条件的用户,所提交的评分才会有效,才能成为变量v。

第二个是m,意思是基准票数;

这是一个定量,只有达到25000个评价,才有资格进入到统计之中。

第三个是R,意思是这部电影的平均分;

也就是按豆瓣算法计算出来的分数。

第四个是C,全站所有电影的平均分。

从公式可以看出,结果WR是由R和C分别乘以基准票数和评价人数所组成变量相加得出来的。

要特别注意的是两个由基准票数和评价人数所组成变量,v ÷ (v+m)和m ÷ (v+m)。

两个变量都有v+m,但分子是不同的。

如果v越大,也就是参与进来的评价人数越多,v ÷ (v+m)就越大,要乘以它的R数值也会越大,那WR的结果越是接近这部电影本来的平均分。

假设v的人数刚好就是25000,那么v ÷ (v+m)的结果就是0.5,就算这25000人的平均分是9分, 按(v ÷ (v+m)) × R算出来也只有4.5分。

如果全站所有电影的平均分C只有6分,(m ÷ (v+m)) × C算出来是3分,那么WR算出来只有7.5分。

C这一变量拉低了分数,所以Top250的分数都要比常规分数要低一些。

只有v的人数足够多的时候,WR的结果才能够更加受到R的影响。

这个设定防止了某部电影只有狂热粉丝投票,或是大量新注册用户刷票,导致分数虚高的问题。同时也使得冷门电影和热门电影有了可比性。

不管一部新出来的电影有多少欢迎,如果v的人数不够多,也很难在Top250榜单名列前茅。

只有随着时间的推移,参与评价的v或者成为v的用户越来越多,Top250榜单才会受到一定的影响。

反观豆瓣Top250榜单,《我不是药神》等口碑热门电影都很容易一下子就把一些经典电影挤下去,现在排名比《教父2》还要高,这并没有经过时间的验证,其权威性自然不及IMDb。

IMDb重视每一位用户的质量。

常规算法即便与Top250的有所不同,但其理念是一样的。

如果是刚刚注册的用户,所提交的评分可能并不会直接纳入到正式的统计当中;

提交过评价越多的用户,对正式统计的影响就会越大。

简单概括,就是“加权平均”。

豆瓣一直坚持着“尽力还原普通观影大众对一部电影的平均看法”的理念,拒绝赋予部分用户更高的“权重”,注定了豆瓣更加“亲民”,而非专业。

2002年,IMDb专门为行业专业用户增加了IMDb Pro的服务,可以看出网站是想要做到专业性的。

专业性的定位,决定了IMDb采取了限制性的评分政策。无论电影还是用户,都需要经过时间的考验。

这样一来,频发的恶意刷分现象至少得到了一定程度上的抑制,多数情况都不会影响整个评分系统的正常运转,不会像豆瓣那样每隔一段时间就会出现争议事件。

只有少数的极端情况下,评分的公正度,稳定性才会受到影响。

万一真的发生,IMDb只需采取有效措施便能解决问题。

②面对“挑战”

作为世界性的评分网站,IMDb所面临的挑战是巨大的。

因为很多影迷群体都希望自己喜欢的电影,能够成为IMDb的霸主。

虽然评分机制已经起到了限制作用,但极端的刷分事件还是会发生。

最为著名的,是2008年的《蝙蝠侠:黑暗骑士》

大量的DC粉丝为了让这部超级英雄神作登上Top250的头名,在疯狂提交满分评价的同时,还给原来的第一名《教父》打了大量差评。

由于有着大量的老用户参与,《蝙蝠侠:黑暗骑士》真的抢过了《教父》的宝座。

此后每有DC电影上映,就会有一大批DC粉丝到IMDb上无脑给出10分好评,这也导致了DC电影总是有着“开评9分”的“好成绩”。

还有2014年的《采访》,由于电影有些恶搞属性,影迷也发起了恶搞活动,在IMDb上统一给出了满分。

以至于这部之后提名金酸梅的电影,一度成为了唯一的“IMDb满分作品”。

面对这些有组织的极端刷分现象,IMDb的做法是,不怎么管。

毕竟这一部分的用户只是少数,等更多的其他用户参与进来,分数便会回归到相对理性的位置。

经过时间的磨砺​,《蝙蝠侠:黑暗骑士》还是被《教父》反超了回去。

只是受到当年被恶意打差评的影响,《教父》《肖申克的救赎》超越之后,就再也没有回到Top250的冠军宝座。

但这两部电影谁第一谁第二,其实也没有太大的区别。

令到IMDb不得不出手干涉的是,印度网友的疯狂刷分。

印度不愧为人口第二多的国家,印度人民为了让印度电影能在IMDb有一席之地,都努力成为了活跃用户,为他们自家的电影打出高分。

能在IMDb得到8分以上的电影一年可能只有不到10部,而达到8分的印度电影居然多达上百部。

为了防止这些“高分印度片”影响正常的评选,IMDb为只有印度影迷参评的电影专门设立了一个“Top Rated Indian Movies”榜单。

说白了,就是设立“小黑屋”,拉黑处理。

据说阿米尔·汗的《摔跤吧!爸爸》也曾进入过这个印度电影榜单,原因显然是前期参与评价的都是印度网友。

好在金子总会发光,等到越来越多非印度网友参与进来之后,《摔跤吧!爸爸》进入到了正式的Top250榜单,目前名列第94位。

近年IMDb做得比较大的一个调整是关闭了评论功能,避免了一些极端的撕逼评论影响大众对一部电影的评估。

评分的方式是基本不变的,个别的极端情况并不能直接证明,IMDb评分有着严重的漏洞和缺陷,不能真实反映一部电影的品质。

被广泛公认的电影分数都能坚挺,不被认可的电影哪怕分数再高,也会随着时间的推移而掉分,或者被拉进“小黑屋”,不能代表世界性的看法。

IMDb评分能够一直符合多数影迷的心理预期,也才能持续地保持着十足的影响力。