除了制造“逼真假脸”,GANs还有哪些打开方式?
文|脑极体
自2014年诞生之日起,GANs(Generative Adversarial Nets,生成对抗网络)就一直是机器学习领域的“流量担当”,过去的两年间更是迎来了成果井喷。
有人还专门为它建立了一个GAN Zoo,用来收集所有已被命名的GAN,目前已经有500多个了。欣赏一下这令人咋舌的增长曲线:
尽管GANs的进步是日新月异,但仔细观察一下就会发现,最广为人知的吸睛案例,大都集中在娱乐领域,而且不乏吐槽之声。
比如从去年年底英伟达推出的GAN,合成的人脸几乎能够以假乱真,一众媒体直呼“可怕”。前不久它终于有了自己的名字“StyleGAN”,源代码也免费公布,立马又被爱搞事情的网友送到了风口浪尖上。
来自Uber的软件工程师Philip Wang利用styleGAN做了一个网站,每次刷新都会生成一个“现实中不存在”的人脸,逼真得令人毛骨悚然。很快就有网友表示,看到了一张跟自己一样的脸,然后她就真的不存在了……这个赛博朋克式的神展开,立马让大家带入了被“假脸”支配的恐惧。
当然,除了探讨照片是否可信、带来识别安全问题怎么办这些问题之外,或许我们也应该关注一下,为什么GANs一路进化,大多数研究却总是聚焦在换脸技术上呢?
这场热闹非凡的换脸游戏背后,恐怕隐藏着一个GANs从算法走向产业道路上最难突破的瓶颈。
GANs新成员:换脸技术哪家强?
GANs从出道那天开始,“图像生成”就是最能打的一块招牌。而在各种各样GANs中,“新晋网红”styleGAN,绝对是面部生成的技术担当。
关于英伟达这个新模型,我们去年就第一时间解读过,在此不再赘述。简单来说,就是让生成器模仿风格迁移算法的方法,学会识别出更高级、也更有意义的特征变化(比如年龄、脸部细节等等),从而让图像生成效果更加逼真。
同时,styleGAN的识别效率也大幅度提升,能够自动分离图像中的变化,开发者能够以直观的方式控制合成结果。加上前不久英伟达开放了图像数据集和styleGAN的源代码,自然吸引了不少技术大佬们跃跃欲试。
有用它“造老婆”的,一位名叫roadrunner01的程序猿,用大量二次元少女的图片训练StyleGAN,各种风格的纸片人妹子任由选择。
当然还有装逼失败的。由于准备不充分,靠StyleGAN生成假脸的网站“thispersondoesnotexist”就被群嘲了,因为网友在上面找到了几乎和自己一样的脸,就此掀起了一阵“刷新一次消失一个人类”的都市灵异文学创作热情。真的是,没有全球70亿人的人脸数据集,就不要揽瓷器活儿啊。
不仅图像能造假,视频也没逃过此劫。去年年初,基于GAN的视频换脸术Deepfakes,就被用来制造了一大堆足以乱真的假视频,奥巴马、斯嘉丽·约翰逊、神奇女侠盖尔加朵、杨幂、刘亦菲等中外名人纷纷成了假视频的主角。
尽管GANs的进展很令人欣喜,但一个尴尬而无奈的现实也就此清晰地呈现在了它的进化之路上——绝大多数成果都聚焦在图像生成上,并且常常以娱乐、夸张的形式出现,“逆天”“以假乱真”“被色情”等新闻不绝于耳。
人脸生成的效果太好、门槛太低,正在挑战着公众的辨别能力,让大众对网络内容和图像证据的信任进一步坍塌,而那些大众期待的、GANs真正改变产业和生活的效用,却仿佛集体失声了。怎么回事?
除了“逼真假脸”,GANs还有哪些打开方式?
首先要替GANs澄清一下,作为一个能自我判别和推倒出新样本的生成算法,它能应用的训练场景和商业前景是非常大的。而且,正在勤勤恳恳地“为人民服务”,为不少产业的进化添砖加瓦。比如:
1.影视创作
创作是最考验想象力和艺术张力的地方,也是越来越劳动密集型的产业之一。在工业制作体系成熟的好莱坞,一部电影从编剧到营销团队往往多大数千人。而GAN恰恰可以改变这样昂贵而高风险的生产过程。
版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/35465.html