欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

知乎算法战“杠精”|你好AI

01-01 IT文章

孙达云几乎从不骂人。他长得白瘦斯文,架着副黑框眼镜,一脸的书生气。哪怕跟人争执到脸红脖子粗,嘴里也蹦不出半个脏字儿。

但技术层面上,他可能是研究网络谩骂造诣最深的人。作为知乎第一个社区管理员,孙达云就是那个戴着“认真、专业、友善”的红袖箍,每天浏览着各种嬉笑怒骂的人。几年前他根据知乎站内帖整理出一张表:骂人的方式有上千种,光“SB”一个词就有几百个变体。都是字音字形的变化,再加上方言、小语种,不胜枚举。

从2011年灌水文化的“认真你就输了”,到“丧”,再到如今的“佛系”和“扛精”,孙达云一路看着网络主流文化的演变。

与之对应的,答非所问、评论区水化、回复者阴阳怪气、找到志同道合的人越来越难的情况像病毒一样蔓延开,使一批知乎大V逐渐变成潜水兽,甚至淡出社区。这些负面情绪正在威胁着内容社区赖以为生的根本——那些优秀答主们生产内容的热情。

知乎心理学话题优秀答主曾旻,最近两年已经不太看评论了。

“早期粉丝在1万以下的时候,还常回复,现在14万了,回复不过来了。”另一层原因,评论质量不如当初高了。最近他发了条热帖,评论被折叠了十几条。被机器自动折叠的,通常是非理性又缺乏营养的发泄情绪帖,这不是对知乎社区有价值的内容,同时这种处理也是对曾旻的保护。

2018年,知乎的用户量大幅攀升,从去年底的1.2亿,到今年11月底变成了2.2亿。大量新增用户来自知乎开拓中的三四线城市。跟“小而美”的果壳不同,知乎并不想做乌托邦。更大的用户量,也是它寻求更多广告变现的基础。

新居民和旧居民、专业答主和不专业的调侃者、不同兴趣和表达方式的人,在这座虚拟城市中交汇。多元化丰富了知乎,但也带来了更多潜在的冲突。

社区氛围管理的难度提高了,它要满足的差异化口味也更多了。知乎决定用机器算法解决这个问题:基于算法,志趣相投的人之间被“架起桥梁”,可能爆发恶性冲突的人则会像永不交织的平行线。

习得你兴趣后的机器将决定你会收到什么推送、看到多大的世界,机器也将作为舆论警察,消除城市中的负面情绪和暴力。当每个人都能从获取信息中收获满足感,这座城市才是稳定和繁荣的。

至于算法要如何拯救你于“呵呵”或者“撕逼微笑脸”?又如何实现这座城市的用户和内容分层?以下要呈现的就是这么个故事。

算法vs杠精

跟其他网络社区相比,如果说知乎上的负面情绪帖有什么特点,那就是骂人不吐脏字儿,以及爱抬杠。

“春江水暖鸭先知,”一位知乎用户发了条文艺帖。不久后,他收到一条评论:“为什么是鸭先知?驴就不知吗?鹅就不知吗?虾呢?蟹呢?跟你说了吗?”

知乎正为此忧虑。杠精引发的憋屈和愤怒,无形中在社区里蔓延。

36氪获得了知乎上被投诉最多的“阴阳怪气”们:

1). 呵呵,就你厉害。

2). 你高兴就好。

3). 你站在道德的高地上就不冷么?

4). 就你懂,可真把你牛逼坏了。

5). 脑子是个好东西,不建议智商太低、听风就是雨的人拥有。

6). 你的答案很有水平!你博士快毕业了吧?

7). 替我向你的体育老师问好,你的语文是他启蒙的吧?

“一个人突然骂你,你顶多呵呵,拉黑就好了,但他一直嘲讽你,你又很不爽。”

孙达云是最早感知到变化的人。过去7年,骂人文化在知乎已经消弭,但今年管理员团队的信箱里躺着大量投诉阴阳怪气的邮件,这让他们很头疼。“我们把底线问题解决的差不多了,不过大家对互联网生态的要求也变高了。”

梁源是知乎书法话题优秀回答者,自称专业杠精,但有趣的是,他也是“阴阳怪气”展的核心策展人之一。

这是个颇为“以暴制暴”的艺术展,展示着各种书法字体写出来的知乎站内的“阴阳怪气”们。

知乎算法战“杠精”|你好AI

逛到展区末端,一个糖果色的小房间,四角放着音箱,滚动播放着几百种方言录制阴阳怪气。大部分人几分钟就坐不住了,被“杠”了出来。

“梁源们”是知乎一直以来感到自豪的原因——这是一群对社区氛围敏感的人,且参与度很高。

无论看到不好的,还是让他们不爽的,或是不希望出现在知乎的内容,都会点举报。可以说这群用户很不好“伺候”,但他们更乐于生产内容,更重要的是,他们的行为相当于人工标注,为后期知乎算法去学习场景提供了训练样本。

早期的知乎,就是靠用户举报和人工运营,去逐条处理帖子里的情绪毒瘤。

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/19912.html