对话 Salesforce 首席科学家 Richard Socher:选择 ML 是出于对数学和语言的热爱
雷锋网 AI 科技评论按: 2018 年开始,NeuroAscent 联合创始人、数据科学家 Sanyam Bhutani 相继对 AI 领域一些优秀的从业者、研究者以及 kagglers 进行了采访,并在其博客中推出了系列文章,大家可前往以下地址查看 Sanyam Bhutani 的采访系列文:
近日,Sanyam Bhutani 采访到了 Salesforce 的首席科学家 Richard Socher 教授。在采访中,Richard 根据自己当年的机器学习经历分享了自己的学习经验,并针对机器学习的研究成果、行业现状、面临的问题以及未来的发展表达了自己的见解。雷锋网 AI 科技评论编译如下。
今天,我很荣幸能采访到 Richard Socher 教授。Richard 是 Salesforce 的首席科学家,于斯坦福大学博士毕业,师从吴恩达和 Chris Channing 学习机器学习和 NLP。他曾是斯坦福大学深度学习与自然语言处理课程的讲师,现在则担任 NLP 标准公开课 CS224N 的慕课讲师。
以下为采访实录:
Sanyam Bhutani:Richard 您好,很感谢您能接受我的采访。
Dr. Richard Socher:我也要谢谢您选择采访我。
Sanyam Bhutani:现在,您在 Salesforce 担任首席科学家一职。您也曾是 NLP 领域最好、最有名的课程之一——斯坦福大学深度学习与自然语言处理课程的讲师,并拥有机器学习方向的博士学位。您能跟读者分享一下您是怎样开始学习机器学习的吗?是什么让您对深度学习产生了兴趣呢?
Dr. Richard Socher:从小到大我都对数学非常感兴趣,同时我也热爱语言,并坚信它们是人类智慧最有趣的产物以及将我们人类从本质上与动物区别开来。AI 能够让我将这些热爱都结合起来,并创造一些能改变这个世界的东西。我在德国开启我的求学生涯,之后来到美国攻读博士学位。
Sanyam Bhutani:刚刚博士毕业,您就选择了创立 MetaMind,而不是加入「科技巨头」,当时您是出于怎样的考量选择这条道路,为什么您认为这一选择是必然的?
Dr. Richard Socher:当我从斯坦福大学博士毕业时,我希望能够创造些什么,能够将深度学习所有的潜能都通通利用起来,而不仅仅是通过某个特定的应用来利用它很小的一部分。我在 2014 年创立 MetaMind,将它定义为对图像和文本数据进行分析、标注和预测的 AI 平台,来帮助企业做出更明智、更快速和更准确的决策。在 2016 年,MetaMind 被 Salesforce 收购,不过 Salesforce 允许我们这个小团队继续作为「爱因斯坦」项目的一部分,将 AI 能力赋予数百万位用户。
Sanyam Bhutani:到现在,您已经在最前沿的研究领域工作了十年左右,这些年工业界和学界的哪些发展成果是您最喜欢的?
Dr. Richard Socher:对于我团队在自然语言十项全能(Natural Language Decathlon,简称 decaNLP)上取得的最新成果,我感到无比兴奋和自豪。decaNLP 是一个学习可同时执行十项复杂的自然语言任务的通用 NLP 模型的新基准。工业界在 AI 模拟人类语言的能力上取得巨大进展的同时,decaNLP 将重新定义语言理解成功与否的基准,并为 AI 模型所能回答的问题类型开拓了新的可能性。在零样本学习技术的帮助下,decaNLP 拥有了一项人类独有的能力:模型对于从未见过的输入也可以进行推理
Sanyam Bhutani:可以说,自然语言处理的发展要落后于计算机视觉。您对于当前这种情况有什么看法?现在是开始成为一位 NLP 从业者的好时期吗?
Dr. Richard Socher:计算机视觉和语言理解面临着非常不同的挑战。在计算机视觉领域,我们凭借广泛到足以囊括大量图像类目的 ImageNet,取得了很多成果。结合了神经网络的 ImageNet,是能很好地处理许多不同视觉问题的默认模型。不过,NLP 与计算机视觉所面临的问题各不相同。语言理解要微妙得多,并且单个 NLP 任务或数据集无法应对语言理解整体的复杂性。
从很多方面来说,decaNLP 对于 NLP 的作用就相当于 ImageNet 对于计算机视觉的作用。由于问答太过广泛,并且你可以询问任意问题,因而我们可以将任意一个 NLP 问题视作一个问题——有什么看法?这句话翻译过来是什么?等等,——同时训练一个模型去同时执行几项任务。
Sanyam Bhutani:对于有志于从事自然语言处理工作的读者以及初学者,您最想给他们提出的建议是什么?
Dr. Richard Socher:对于初步接触到这一领域的学子,我推荐他们利用好网上的资源。例如我之前的斯坦福课程(cs224n.stanford.edu)就在网上对外开放了,并且 Salesforce 最近也在 Trailhead(Salesforce 的免费线上学习平台)上发布了一些 NLP 深度学习相关的不错的内容(内容查看地址:)。
Sanyam Bhutani:目前这一领域的研究呈现爆发式的增长,您是怎样跟上最前沿的发展步伐的?
Dr. Richard Socher:我通常使用 Twitter 了解研究的最新动态,同时与该领域的其他人保持联系。
Sanyam Bhutani:得益于互联网,我能够有机会收听您精彩的主旨演讲以及讲座(我是您的粉丝)。
针对怎样有效地表达科技观点,您能分享一些技巧吗?
Dr. Richard Socher:我认为最好是简单地表达观点,并尝试去探讨 AI 在与人类相关的方面对他们所带来的影响。
Sanyam Bhutani:您是 AI 伦理的支持者,您能指出某些领域是我们即便在 AI 早期阶段也必须加以关注的吗?
版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/27282.html