NLP难出独角兽?
作者:韩敬娴
编辑:张丽娟
2019年初,全球创投研究机构CBInsights发布了32家全球AI独角兽公司名单,其中美国有17家,中国有10家,商汤科技、云从、云知声、寒武纪等纷纷上榜。
经过政策、资本的快速助推,计算机视觉领域、语音领域纷纷跑出多个独角兽,而作为“皇冠上的明珠”的NLP领域却难见独角兽的影子。
众多的NLP领域公司大多成立在2015年、2016年左右,正逢AI热潮,入局并不算晚,但目前的融资大多还停留在A轮或者B轮,而语音、计算机视觉公司们已经在纷纷冲刺上市。
8月5日AI语音公司云知声对CV智识证实,正在接受科创板上市辅导;8月25日晚,计算机视觉公司旷视科技向港交所递交IPO招股书。
AI主要包含两个层面,一个是认知智能,一个是感知智能。比如语音识别、计算机视觉属于感知智能的层面,而 NLP 则属于认知智能层面。
为何NLP公司们跑的最慢?当前的落地应用到底发展到了什么程度?CV智识带着这样的疑惑与业内人士聊了聊目前的现状。
缺乏相对独立且足够大的场景
“NLP缺少相对独立且足够大的场景”,深度好奇创始人吕正东告诉CV智识,“它往往会变成一个引擎或者一个特定功能上的服务,这个的确制约了它的市场。”
所谓相对独立且足够大的落地场景,就像安防市场之于整个计算机视觉领域。
据中商产业研究院发布的《2018-2023年中国安防行业市场前景及投资机会研究报告》数据统计显示,我国安防行业市场规模从2012年的3240亿元增长到2017年的5960亿元,年均复合增长率达13%左右。
千亿需求驱动商业发展,技术突破加上场景自然结合,独角兽自然就容易脱颖而出。
反观NLP,众所周知,特别纯粹的应用就是机器翻译,众多行业公司产品也扎堆而生。
2016年底,科大讯飞推出晓译翻译机,直到2019年5月,讯飞翻译机更新至3.0;搜狗的旅行翻译宝在2018年1月正式亮相,9月又推出了搜狗翻译宝Pro;猎豹移动在2018年7月发布了小豹AI翻译棒。
出境旅游的语言沟通的确是很多游客的最大瓶颈,游客对智能翻译机的需求也的确存在,“只是用户的身上已经存在了智能手机、智能手表等不同的智能硬件,对于用户来说,真的愿意仅仅为了满足单一的翻译需求再增加一个硬件吗?”一位NLP领域产品经理对CV智识表示。
为了一个简单的需求,用户需要付出的价格并不便宜:小豹AI翻译棒售价229元,搜狗翻译宝Pro售价2299元,讯飞翻译机3.0售价3499元。
讯飞翻译机3.0(来自讯飞商城官网)
这与用户一直以来习惯的免费在线翻译服务正好相反。
从互联网时代的百度在线翻译、谷歌翻译等产品来看,日常翻译已经成为了一个带有天然的平台性或者免费服务性质的业务。
且根据中商产业研究院发布的《2018-2023年中国翻译机行业市场前景研究报告》预计我国翻译机市场规模将从2016年的396亿增长到2020年的561亿元,远没有安防和身份验证市场那么大。
除了市场本身有待验证之外,有业内人士对CV智识表示,“翻译机是一个强技术驱动的产品,并不是语音和翻译的简单串联,语言具有复杂多意性的特征,很难实现标准化和一致性。”
去年4月10日,腾讯翻译君在实时翻译过程中,不仅没有翻译成很通顺的中文,而且出现了几乎占满了几乎一整页的“for”。
腾讯翻译君在之后承认,包括神经网络机器翻译在内的深度学习算法,目前在原理上还有一定不确定性,在特定的情况下有一定的概率引发翻译偏差。
“语音翻译中的语音本身也有自己的技术,它并不是为了后面的翻译专门准备的,因此它在很多时候有自己的优化目标,但这个优化目标有可能在某些方面和翻译不一致,因此在两者结合过程中也需要技术上的再次突破。”
“想打造好的NLP技术非常难。NLP不是一个单一的学科,里面其实会牵扯到深度学习,认知领域,情感模型等等。而且语言的场景太复杂了,就拿中文来说,同一句话放在不同的场景里会有完全不同的解读。”竹间智能创始人兼CEO简仁贤也对CV智识坦言。
智能助手:如何平衡技术与隐私?
“近年来NLP、语音、视觉有融合发展的趋势”,有业内人士对CV智识表示。
除了纯粹的机器翻译场景之外,NLP与其他AI技术融合落地的智能助手以及智能客服成为了重要的落地场景。
2014年亚马逊Echo首次登场,2016、2017年苹果Homepod、谷歌Home、微软Invoke陆续“进场”,智能助手成为各家智能音箱的最大卖点。
随后国内传统硬件厂商和互联网厂商更是争相入局“圈地”,包括小米、阿里巴巴、联想、京东等,相继推出自己的智能音箱。
奥维云网(AVC)全渠道推总数据显示,2019年上半年,中国智能音箱市场在售机型数达到86个,销量为1556万台。
除了智能音箱之外,智能助手也成为智能手机的标配。
版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/80239.html