AI选出来的史上最佳电影Top 10,我居然都没有看过
原标题:AI选出来的史上最佳电影Top 10,我居然都没有看过
大学时候有个朋友跟我吹,
说什么 IMDb 百大电影全都看过。
我问他肖申克是谁,
他却支支吾吾……
开个玩笑。
虽说电影这件事见仁见智,
但是谈起影史佳片,大部分人都同意,
《肖申克的救赎》稳坐头把交椅。
不过最近有一件有趣的事:
两位意大利科学家发了篇论文,
讲他们如何用 AI 给电影打分排名,
肖申克压根没有上榜……
这就很有趣了。
因为我查了下这两位专家,
Livio Bioglio 和 Ruggero G. Pensa 教授,
是意大利都灵大学计算机专业的。
俩写代码的
为什么要跟电影过不去 :/
质疑研究者的专业性之余,
还是要看下俩人有什么话可说。
电影的成功,通常是由票房收入或专业评论的意见来衡量的。然而,这些衡量方式可能受到外部因素的影响,例如广告营销或者趋势,而且它们无法准确呈现一部电影长期的影响力。
仔细一琢磨,还真略有道理。
如果跟业内人士讨论最“成功”的电影。
你说《阿凡达》和《星战:原力觉醒》
不会有人反驳你。
前者全球票房28亿美元创纪录,
后者美国票房将近10亿排第一。
票房越高,看过的人越多。
如果这不算成功,这没有影响力,
什么片子成功,什么叫影响力?
可是在两位科学家开发的 AI 眼里,
这两部电影算不上有影响力。
因为这 AI 评出的最具影响力十大电影,
压根就没有21世纪上映的:
这个排名里的片子我都听说过,
出于对不同电影主题的兴趣,
只看过其中几部。
比如我很喜欢科技,也喜欢科幻。
所以《2001:太空漫游》让我看得很爽。
尽管它节奏真的慢爆
作为一个卡在八零末尾的半吊子电影迷,
这个排名让我意识到自己看得还不够多。
可你看,前十名都是上世纪的老电影,
明明是2018年的 AI,
把一百年前的电影都翻出来了,
是不是有点太老古董了??
在粗略看了一遍论文后,我发现,
这俩科学家提出的电影评价方法
确实挺有意思:
就像评价网页排名那样,
他们用超链接的数量和权重,
去评价一部电影的影响力。
我是没看过多少电影,称不上专家。
但网页排名我知道啊!
虽然我也没干过 SEO,
但做了这么久内容,至少略懂一二吧。
概览这篇论文,评价指标一共四个:
In-Degree, Closeness, Harmonic, PageRank.
先别发懵,这四个指标其实很好理解。
咱们一个一个看。
In-Degree 入度中心性
简而言之,
或者你在微信上有300个好友,
那么你在微信上的入度中心性就是300。
明白了吧?
或者看下面这个图:
一号圈的度中心性=0
因为没有其它圈指向它;
二号圈的度中心性=2
因为有两个圈指向它。
搜索引擎给网页排名的时候,会用这个指标,
比如硅星人FM播客 (gxr.fireside.fm)
如果有另外两个网页上有这个链接,
那么硅星人FM的 In-Degree 得分就是2。
(欢迎收听硅星人FM)
那么回到这篇论文,
也是利用这个评价指标,
研究人员从 IMDb 数据库里
寻找电影 b 对电影 a 的指向。
这个指向,可能是所谓的“致敬”
比如《大话西游》对《重庆森林》的台词戏仿:
其实星爷特别喜欢戏仿其他经典影视剧,感兴趣的朋友可以多了解下。
或者美版《无间道》直接翻拍港版:
甚至只是剧情上的引用,
比方说《夜宴》直接引用了哈姆雷特的剧情。
再比如科幻电影《2001:太空漫游》
它的章回体叙事节奏被不少电影采纳,
场景设计后来也出现在其它太空电影里。
总体来讲,它在更多层面上影响了更多电影。
比如回转的太空舱
不管怎样,只要电影 a 被其他电影
以各种方式致敬翻拍和引用,
那么电影 a 的 In-Degree,
就是这些致敬电影的总数。
Closeness 接近中心性
这一条也比较好理解。
比方为一座商场选址,
地产商要计算商场和周边居住区的距离。
最后选择的地址,
和所有居住区之间的距离之和最小。
那么它的接近中心性就是最高的。
比如下图,所有的点都是居民区,
把它当成北京市
直觉上把商场建在王府井 E 是最近的,
然而实际上 B 点才是接近中心性最高的,
(大约青年路或者望京附近)
因为它同时兼顾了市区以及通州燕郊的居民。
利用这个指标,
很容易评价最有影响力的演员。
比如萨缪尔·L·杰克逊,
在这个算法选出十大演员里排第一:
他合作了不少演员,
参与了82部电影,
演过佳片也有不少。
这种演过电影多的、
跟其他演员合作多的、
表演技巧被其他演员采用的,
他/她们的接近中心性都很高。
Harmonic 和谐中心性
比方说有5个网页上有硅星人FM链接,
这5个网页被称作一度网页,
那么硅星人FM 的和谐中心分数就是5。
又有10个网页上有上面那5个网页,
它们叫做二度网页,
那么分数就变成了5+(10/2)=10
又有36个网页上有上面那10个网页,
(你一定知道它们叫什么……)
分数又变成了5+(10/2)+(36/3)=22
我们回到电影的语境,
还是用《2001:太空漫游》举例。
它的设定被《星际穿越》采用了,
而只晚一年上映的《火星救援》
也有跟《星际穿越》类似的桥段。
再假设另外6部电影借鉴了《火星救援》
那么可以这样计算:
《2001:太空漫游》的和谐中心分数
就是 1+(1/2)+(6/3)=3.5。
现在你明白了:
一部电影的和谐中心分数,
就是“致敬”了它的电影数量 x ,
加上对 x 致敬的电影数量 y 除以二,
再加上对 y 致敬的数量 z 除以三
这样一直相加下去……
PageRank 佩奇排名
你可以没听说过佩奇排名,
但你肯定听说过它的发明者:拉里·佩奇!
没错,就是 Google 的联合创始人。
如果把网页a在 b、c、d上每一个链接
都看做其他网页对 a 的一次投票,
那么把这个投票再加上b、c、d的权重,
就成了佩奇排名。
比方说只有某个小网站上有你的链接,
那么你的得分就比较低。
但如果你的链接上了 Google 首页,
你的得分就变得超高。
放在电影的语境下也是一样。
《星际穿越》致敬了《2001:太空漫游》
《星际穿越》拿了不少奥斯卡,
相应地,后者的得分就很高。
《星际穿越》大量借鉴了《2001:太空漫游》
反之亦然:
《逐梦演艺圈》致敬了《房间》
可是《逐梦演艺圈》本身是大烂片,
所以《房间》的得分肯定也不咋地……
如果你对这个研究感兴趣,
可以在拉到最后“阅读原文”查看论文。
这份论文出来之后,遭到不少质疑。
有人指出这种评估方式太“科学”了,
可能存在“过拟合”现象。
大部分人则表示根本看不懂,
而且结果明显太偏向老电影了吧!!
前十名里没有80年代之后的电影,
上榜的大部分也都在40年代之前。
研究者也给出了他们的解释:
版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/13426.html