深度学习硬件竞赛,CPU要抢GPU的饭碗?
这一次,谁能赢得这场马拉松之战?
文 | 崔佛
尽管分工不同,但CPU与GPU的较劲从未停止过。
在个人PC市场,CPU集成的核芯显卡已经在主打轻薄、便携的笔记本电脑上接过了部分独立显卡的大旗,而在正处于风口上的深度学习领域,CPU将再次向GPU发起挑战。
深度学习概念的普及很大程度上要归功于AlpahGo。
2016年3月,DeepMind旗下运用深度学习原理的人工智能程序AlphaGo与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜。AlphaGo的胜利极大加速了深度学习概念的普及,同样带动了人工智能在业界的复兴。
AlpahGo之后,人工智能开始陆续在语音识别、机器视觉、数据挖掘等多个领域落地,从过去更多停留在理论层面的学术概念真正向具有商业价值的技术创新转变,来自各行各业的企业都拥有运用人工智能技术优化业务流程、发掘行业机遇、开启商业蓝海的机会。
在这过程中,作为人工智能重要子集的深度学习几乎成了人工智能的代名词。
简单来说,深度学习是从机器学习进化而来,利用多层神经网络进一步从海量数据中获取洞察且无需事先“知道规则”,与一般机器学习相比,深度学习可以更加深入地挖掘现有数据集。
2017年,埃森哲对多个行业和地区的调查结构显示,人工智能可以让企业的盈利能力提高38%,在未来10年内产生超过14万亿美元的经济影响。
这一赛道有多热,从催生出的行业独角兽企业数量就可见一斑,光是在中国就有商汤、优必选、寒武纪、云从、旷视、依图、地平线机器人、出门问问、奥比中光、小马智行、云知声……这些独角兽不需要像市值千亿的巨头一样大包大揽,它们其中很多只需要在人工智能的一个场景做到领先就足以享受技术带来的红利。
而除了人工智能企业在各个细分赛道的竞赛,上至开源深度学习框架,下至硬件基础设施提供商,围绕深度学习的全面战争已然打响。
在硬件基础设施领域,站在擂台两边的正是CPU与GPU。伴随着近年来自动驾驶技术的兴起,作为很多自动驾驶技术开发者的选择,GPU在深度学习硬件竞赛中占得先机,但从英特尔的一系列动作来看,CPU在人工智能、深度学习领域的发展潜力同样不可小觑。
在多数情况下,技术的进步与硬件设施的迭代是一个长期相互促进的过程。和在PC游戏领域,英伟达的显卡技术(如光线追踪)会促使游戏开发者开发更高画质的游戏,而最新游戏不断攀升的性能需求又反过来促使英伟达更新显卡架构类似,在深度学习领域,深度学习算法设计、训练模型的发展与硬件基础设施的更新也在同步进行。
在过去相当长的一段时间内,GPU被认为是更适合深度学习的硬件设施,主要原因在于,深度学习是模拟人脑神经系统而建立的数学网络模型,对处理器的主要要求是需要大量的并行的重复计算,这一要求正好与GPU提供多核并行计算的基础结构特点相符。这也是为什么在自动驾驶技术方面,GPU成为很多开发者首选的原因,自动驾驶涉及到的海量数据,天然适合GPU的技术特性。
不过作为CPU的“带头大哥”,英特尔自然没有任由CPU不适合深度学习的观点持续下去。在由谷歌、百度、英特尔、AMD、哈佛大学、斯坦福大学等机构联合推出的机器学习基准测试工具MLPerf的测试结果中,针对MLPerf深度学习训练工作负载,英特尔至强处理器取得的结果并不逊色于MLPerf参考GPU。
具体来说, 英特尔至强分别在MLPerf图像分类基准测试 (Resnet-50) 、推荐基准测试、强化学习基准测试三项中获得0.85分、1.6分与6.3分,作为对比,这三个项目中,参考GPU的实施分数均为1.0分。
尽管这并不意味着CPU可以完全取代GPU在深度学习中的地位,但已经充分说明,CPU凭借近年来更新、迭代获得的针对性的软、硬件优化,在深度学习上已经能占据一席之地。英特尔方面的数据显示,在与前一代没有优化软件的产品相比,英特尔至强处理器执行深度学习任务的性能大幅提升,训练吞吐量提升高达127倍。
(图:三明治结构欺诈侦测模型架构)
版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/57395.html