云知声造芯再迈一步，推多模态AI战略，打响AI芯片场景落地战！

01-04 IT文章

原标题：云知声造芯再迈一步，推多模态AI战略，打响AI芯片场景落地战！

智东西（公众号：zhidxcom）
文 | 伊娃

2019年的第一个工作日，云知声创始人、CEO黄伟以一句“少有人走的路”，为其多模态AI芯片战略拉开帷幕。

▲云知声创始人、CEO黄伟

2014年人工智能还远未如此火热，黄伟在面向B端市场的商业探索中，就意识到算力、算法结合在一起的重要性，于是确定了“云端芯”一体化的战略，并于2015年启动自研AI芯片。

在AI前夜的那个节点来看，作为一家刚成立2年的创业公司，云知声当时的策略无疑饱受质疑。

然而随着阿尔法狗（AlphaGo）战胜世界顶级围棋选手李世石后，AI浪潮袭来，并逐渐落地走向应用。2018年在场景驱动、中美贸易摩擦的背景下，AI芯片走向时代前台。

历时3年，云知声也终于2018年5月推出第一款语音AI芯片雨燕，交出造芯答卷。而2019年，云知声将在云端芯战略的基础上再迈进一步，并提出多模态AI芯片的构想。

先行业一步提出多模态AI芯片战略，这背后是云知声怎样的思考，这一构想又能否引领云知声下一阶段的发展？

一、多模态AI芯片战略浮出水面

过去6年来，云知声大概走过了四个阶段，2012~2014年即刚成立的前两年，布局算法平台构建技术优势；紧接着云知声确立“云端芯”一体化的策略，并启动自研AI芯片；到了2017~2018年云知声加速AI的商业扩展和应用，并推出首款语音AI芯片雨燕。

云知声造芯再迈一步，推多模态AI战略，打响AI芯片场景落地战！

站在2019年的起跑线上，黄伟称，接下来就是依托云知声的AI算法与AI芯片构建场景优势。而构建场景优势的关键就在于多模态AI芯片战略。

之所以提出这一战略，黄伟重点讲述了他面向5G与AIoT的思考。他认为，5G将推动行业产生质变，引发连接大爆炸、应用大爆炸，尤其是工业领域。

可以预见，随着5G的到来，语音、图像、视频等多维数据将会海量增长，此时多维数据的处理能力成为刚需。

与此同时，IoT场景下AI应用对于端云互动有着强需求，强大的云会让端侧能力更强，而强大的端则可提升数据处理的实时性和有效性，进而增强云的能力。

在多维数据处理能力与边缘计算的需求下，具备更强算力的多模态AI芯片就成为了场景的关键竞争力之一。

黄伟指出，面向5G场景，只有更强的算力还不够，还需要有深入场景提供服务的能力，并在此基础上对传统SoC（System On Chip，片上系统）做了进一步的解读。

云知声造芯再迈一步，推多模态AI战略，打响AI芯片场景落地战！

他认为，S应该代表不同的 AI 服务能力即 Skills，O 代表云端与边缘侧的互动 On/Off Cloud，C 代表具备智能处理能力的 AI 芯片。

从云端芯一体化，到多模态AI芯片战略，再到对SoC全新的理解，云知声对AI芯片的理解和布局都保持着行业领先性。

二、战略背后是多模态AI技术的积淀

从2018年开始，多模态交互就成为业界研究的一个重点。简单来说，模态可以理解为感官，多模态交互即是调用多种感官的交互方式，它跨过了自然语言，其方式也更加贴近人，也代表了AI未来的一个发展方向。

云知声在2019年开年提出多模态AI芯片战略，无疑在多模态探索的道路上又迈出一步，但多模态不应该成为一句口号，而应该真正落实到技术研发中。

智东西发现，在语音技术主赛道外，云知声在2018年也加紧布局图像识别、机器翻译等领域，进行多模态技术的储备。

去年，在国际权威人脸识别标准评测数据库 LFW 和 MegaFace 上，云知声团队研发的人脸识别系统，在上述两项标准评测中，性能分别达到 99.80%和 98.47%，得分位居业内前列。

云知声造芯再迈一步，推多模态AI战略，打响AI芯片场景落地战！

▲WMT2018国际机器翻译大赛成绩

去年5月份的WMT2018国际机器翻译大赛的中英翻译比赛中，组建不足1年的云知声机器翻译团队，也拿下英中第二、中英第四，综合第三的优异成绩。

本次发布会上，云知声联合创始人李霄寒进一步分享了云知声在人脸识别、表情分析、标签化、多目标唇动状态追踪等视觉AI方面的进展，进一步储备多模态技术基础。

云知声造芯再迈一步，推多模态AI战略，打响AI芯片场景落地战！

版权保护: 本文由沃派博客-沃派网编辑，转载请保留链接: http://www.bdice.cn/html/21045.html