欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

云知声造芯再迈一步,推多模态AI战略,打响AI芯片场景落地战!

01-04 IT文章

原标题:云知声造芯再迈一步,推多模态AI战略,打响AI芯片场景落地战!

智东西(公众号:zhidxcom)
文 | 伊娃

2019年的第一个工作日,云知声创始人、CEO黄伟以一句“少有人走的路”,为其多模态AI芯片战略拉开帷幕。

云知声造芯再迈一步,推多模态AI战略,打响AI芯片场景落地战!

▲云知声创始人、CEO黄伟

2014年人工智能还远未如此火热,黄伟在面向B端市场的商业探索中,就意识到算力、算法结合在一起的重要性,于是确定了“云端芯”一体化的战略,并于2015年启动自研AI芯片。

在AI前夜的那个节点来看,作为一家刚成立2年的创业公司,云知声当时的策略无疑饱受质疑。

然而随着阿尔法狗(AlphaGo)战胜世界顶级围棋选手李世石后,AI浪潮袭来,并逐渐落地走向应用。2018年在场景驱动、中美贸易摩擦的背景下,AI芯片走向时代前台。

历时3年,云知声也终于2018年5月推出第一款语音AI芯片雨燕,交出造芯答卷。而2019年,云知声将在云端芯战略的基础上再迈进一步,并提出多模态AI芯片的构想。

先行业一步提出多模态AI芯片战略,这背后是云知声怎样的思考,这一构想又能否引领云知声下一阶段的发展?

一、多模态AI芯片战略浮出水面

过去6年来,云知声大概走过了四个阶段,2012~2014年即刚成立的前两年,布局算法平台构建技术优势;紧接着云知声确立“云端芯”一体化的策略,并启动自研AI芯片;到了2017~2018年云知声加速AI的商业扩展和应用,并推出首款语音AI芯片雨燕。

云知声造芯再迈一步,推多模态AI战略,打响AI芯片场景落地战!

站在2019年的起跑线上,黄伟称,接下来就是依托云知声的AI算法与AI芯片构建场景优势。而构建场景优势的关键就在于多模态AI芯片战略。

之所以提出这一战略,黄伟重点讲述了他面向5G与AIoT的思考。他认为,5G将推动行业产生质变,引发连接大爆炸、应用大爆炸,尤其是工业领域。

可以预见,随着5G的到来,语音、图像、视频等多维数据将会海量增长,此时多维数据的处理能力成为刚需。

与此同时,IoT场景下AI应用对于端云互动有着强需求,强大的云会让端侧能力更强,而强大的端则可提升数据处理的实时性和有效性,进而增强云的能力。

在多维数据处理能力与边缘计算的需求下,具备更强算力的多模态AI芯片就成为了场景的关键竞争力之一。

黄伟指出,面向5G场景,只有更强的算力还不够,还需要有深入场景提供服务的能力,并在此基础上对传统SoC(System On Chip,片上系统)做了进一步的解读。

云知声造芯再迈一步,推多模态AI战略,打响AI芯片场景落地战!

他认为,S应该代表不同的 AI 服务能力即 Skills,O 代表云端与边缘侧的互动 On/Off Cloud,C 代表具备智能处理能力的 AI 芯片。

从云端芯一体化,到多模态AI芯片战略,再到对SoC全新的理解,云知声对AI芯片的理解和布局都保持着行业领先性。

二、战略背后是多模态AI技术的积淀

从2018年开始,多模态交互就成为业界研究的一个重点。简单来说,模态可以理解为感官,多模态交互即是调用多种感官的交互方式,它跨过了自然语言,其方式也更加贴近人,也代表了AI未来的一个发展方向。

云知声在2019年开年提出多模态AI芯片战略,无疑在多模态探索的道路上又迈出一步,但多模态不应该成为一句口号,而应该真正落实到技术研发中。

智东西发现,在语音技术主赛道外,云知声在2018年也加紧布局图像识别、机器翻译等领域,进行多模态技术的储备。

去年,在国际权威人脸识别标准评测数据库 LFW 和 MegaFace 上,云知声团队研发的人脸识别系统,在上述两项标准评测中,性能分别达到 99.80%和 98.47%,得分位居业内前列。

云知声造芯再迈一步,推多模态AI战略,打响AI芯片场景落地战!

▲WMT2018国际机器翻译大赛成绩

去年5月份的WMT2018国际机器翻译大赛的中英翻译比赛中,组建不足1年的云知声机器翻译团队,也拿下英中第二、中英第四,综合第三的优异成绩。

本次发布会上,云知声联合创始人李霄寒进一步分享了云知声在人脸识别、表情分析、标签化、多目标唇动状态追踪等视觉AI方面的进展,进一步储备多模态技术基础。

云知声造芯再迈一步,推多模态AI战略,打响AI芯片场景落地战!

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/21045.html