欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

BigData 2018 最前沿:让人工智能找到可操作的防范恶行最优决策

12-09 IT文章

原标题:BigData 2018 最前沿:让人工智能找到可操作的防范恶行最优决策

雷锋网 AI 科技评论按:本文作者赵通,是来自美国圣母大学计算机系 DM2 实验室的博士生。本文是他为雷锋网 AI 科技评论撰写的基于 BigData 录用论文《Actionable Objective Optimization for Suspicious Behavior Detection on Large Bipartite Graphs》的独家解读稿件,未经许可不得转载。

前言

恶行是可怕的。章莹颖绑架失踪案过去了 500 余天,还没有实质进展。2017 年 4 月,未满 27 岁的北大硕士毕业生章莹颖作为访问学者前往美国伊利诺伊大学香槟分校交流学习。6 月 9 日下午 2 点,章乘坐公交赴校外公寓签约,在转站等车时,不慎上了一辆陌生男子的黑色轿车,之后再也没有人见过她。当晚其好友与教授报警,一直到 6 月 30 日,美国警方拘捕一名白人男子,称章可能已死亡。7 月 12 日,联邦大陪审团正式起诉嫌疑人,到目前为止,此案仍在法庭受理当中。类似的情形在国内也时有发生,「滴滴顺风车」命案便是血淋淋的悲剧。每每出现在新闻标题里的「又一女孩」或是「三个月内第二名乘客」这些字眼,都让人纳闷,究竟是什么让这类事件一而再、再而三地发生。恶行不只出现在现实生活中,在网络中也无处不在,如在淘宝和 eBay 上就存在买家「霸凌」卖家的行为:买家只需购买卖家的一件便宜商品,即获得给商品评价、打分的权利。买家如若无视商品质量,打出极低的分数,卖家的平均分数就会降低,而平台推荐系统往往根据评分排行,评分稍微降低一点,都会导致卖家在和其余商家竞争时无法出现在被推荐的第一页,从而失去生意,最终倒闭。因此买家利用卖家的弱点,可以索要折扣乃至现金等,这就是「霸凌买家」的由来。

引出问题

在关注各种案件的同时,我们不得不思考:当我们面临即将到来的恶行时,我们是否能够提前防范恶性事件的发生?越是思考,越是让人不寒而栗——比起生活上的孤零零,更可怕的是信息的贫瘠与环境的复杂。

父母亲的一句「注意安全」遇上了「签订租约」、「错过公交」、「迟到误点」、「校内路边」、「黑色轿车」、「白人男子」、「邀请上车」等陌生环境下的复杂情景,都显得苍白无力。受害人的判断力迅速被「准时准点」、「诚实守信」、「文明发达」、「乐于助人」冲垮。如果这些状况发生在她的家乡福建省南平市,想必她会冷静很多:太多的事故、故事以及对周遭的了解让她拥有足够多的信息去面对复杂环境。试想,如果莹颖曾看过伊利诺伊大学校园犯罪地图、听过一些危险事件的报道,在内心里构建起一座防范恶行的「防火墙」,她也许会在「签约误点」的情况下对「上陌生人的黑色轿车」这一选择要多加斟酌,从而避免这一悲剧的发生。一句简单的「注意安全」,信息量真的是太少了。

BigData 2018 最前沿:让人工智能找到可操作的防范恶行最优决策

图一:来自 CampusCrime.net:性犯罪、抢劫等恶性事件的校园分布

虽然政府与各方平台已经非常努力地给人民与用户提供最优质、最安全的服务,他们却很难提前对恶行做出有效的防范。因为将好人误判为坏人的代价是巨大的。试想,当重要邮件被误扔进了垃圾箱,当一批正常的淘宝用户被封号,当警方误逮捕「可疑人员」,这些都必会导致服务劣质化、抱怨四起、平台收益受损、责任难以承担等诸多负面影响。这就是为什么政府与平台虽坐拥计算与大数据资源,却显得反应迟钝、畏首畏尾。不过在责难平台的同时,用户自身也忽略了安全意识的建立,忘记了自己才是最有执行力去说「不」的人。

我们的想法

当我们观察到平台与用户之间存在着这条很长很深的信息鸿沟时,圣母大学计算机系数据决策实验室(DM2 Lab, University of Notre Dame)尝试使用一种新的思路去弥补这一鸿沟。为了统一称谓,我们称发出行为的人为「主动方」,包括搭讪者、粉丝、司机等;接受行为的人为「被动方」,包括被搭讪者、被关注者、乘客等,其中「主动方」存在产生恶性行为的可能。传统的恶行检测算法(suspicious behavior detection)往往以「主动方是否为攻击者」的标签作为优化的变量,从而使得平台可以对预测为正例者进行人工调查、再做出决策,调查过程费时费力。DM2 提出,让「被动方」根据对「主动方」的特征或者行为历史的观察形成防范意识、选择防御等级,例如女性乘客可以根据司机年龄性别、驾龄、过往评分和评价等信息进行筛选。这里就存在一个妥协的问题:防御等级过高,则得到服务的范围和及时性会降低;防御等级过低,则安全又难以得到保证。用户个体是很难选择合理等级的,而平台却拥有海量数据和智能算法,可以为用户推荐合适的防御等级并估计选取后的结果,让用户自行选择。这样用户拥有安全意识、平台也可以「推卸」一部分责任,信息鸿沟得以弥补,恶意行为的防范变得可操作、可执行。

事实上,由用户个体来防范恶行的思路并不是第一次出现,如淘宝就有插件可以用来屏蔽差评师(好评率低于一定百分比的买家)。

BigData 2018 最前沿:让人工智能找到可操作的防范恶行最优决策

图二:差评师拦截插件

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/11780.html