从“搜索挑战”,看字节跳动的自我暴露之路
图片来源@视觉中国
文 | 脑极体
昨天晚上,人们在字节跳动招聘公众号上,发现字节跳动开始正式对外为“字节跳动搜索部门”招聘员工。
招聘广告中写到,字节跳动要做全网搜索,当前团队有来自字节跳动内部推荐、广告、AI Lab等部门的,也有来自谷歌、百度、360等厂商的。广告中称,这一搜索引擎覆盖了字节跳动的今日头条、抖音、西瓜、火山、懂车帝等产品,计划打造一个理想的搜索中台架构。
对于这条消息,人们几乎毫不意外——该来的总会来,在字节跳动系产品分别利用微头条、悟空问答和多闪挑战过微博、知乎和微信之后,针对于百度的搜索引擎挑战也应运而生。另一方面,去年年底字节跳动就将前360搜索总经理吴凯招致麾下,进军搜索引擎领域的计划,也是路人皆知。
那么字节跳动在搜索上是否真的存有优势?这一场“战役”又真的会出现吗?
多模态搜索,会成为字节跳动弯道超车的机会吗?
提起字节跳动之于搜索,并非是毫无道理的荒谬故事。字节跳动作为一家繁荣于移动时代的企业,旗下推出的多款产品确实是在源源不断地生产着内容,而这些内容如果可以被整合和搜索,自然能够为用户提供很多便利。
尤其字节跳动系产品的一个显著特点,就是视频内容丰富。在上述几款主要产品中,抖音、西瓜、火山包括懂车帝和皮皮虾,这些产品要么是以视频为主要载体,要么包含大量视频内容。这也是移动时代产品的普遍情况,随着终端硬件能力的提升和上网资费的下降,视频内容的生产从未如此简单,因此有大量视频内容停留在各个软件终端形成孤岛,这些孤岛显然是亟待打通的。
如此以来,就引到了一个最近很流行的概念——多模态搜索。所谓多模态,即是结合多种类型的内容,从文字到图片再到音视频,进行统一的搜索。输入同一个关键字,可以搜索到对应文字图片结果,甚至还能通过对视频内容的识别而精准定位到某一部视频的某个片段。
如果说字节跳动要开拓搜索业务的话,多模态搜索或许是个不错的切入角度。
内忧外患,字节跳动的搜索之路有多难?
但仅仅依靠多模态内容搜索方面的需求,就能够支撑起一款搜索引擎吗?
想解答这一问题,需要从外部环境和内部因素两方面考虑。
从外部环境来说,搜索引擎领域和此前字节跳动尝试进入的短内容社交、知识问答社区等等都不一样,这一领域对于技术和数据都有着极高的依赖,从20年前就开始了拉锯战,并且在互联网和移动互联网的时代更迭中,头把交椅也并未易主。
想瓜分这一市场的玩家并不少见,2014年,阿里与UC联合推出神马搜索,至今在移动端市场份额也只有9.5%;腾讯旗下搜狗搜索,360搜索等传统搜索玩家做搜索更是长达十年左右,市场份额也都在个位数,甚至低于5%。
尤其搜索引擎还是一种非常依赖数据量的产品,用户使用越多、交互次数越多、产生的数据越多,因此训练出的算法也就越精准。百度作为头部企业,在行业中已经累积下了20年的数据优势,正在筑成高高的护城墙。字节跳动能否实现360、搜狗这些企业十年间都没有做到的事情,突破护城墙的限制,恐怕是个不小的挑战。
从内部因素来说的话,字节跳动的“多模态搜索优势假设”是否真的能成立也是存疑。
字节跳动在内容方面看似储备完善,实则存在着不少限制。相比搜索引擎所收录的正常内容,抖音、火山、西瓜视频一类产品中的视频,有很多都是用户自己对于生活的分享,例如抖音中的很多“套路跟拍”。换句话说,这种长尾内容对于其他人来说几乎是没有意义的。
同时在抖音一类的平台中,平台会有意识地引导商家账号入驻,发布商业性质的内容。想象一下,当字节跳动推出了搜索引擎,用户搜索“茶叶”二字,结果出现了一大堆抖音卖茶姑娘的广告;搜索“军阀”二字,则是看到一群“军阀太太”的换装秀。不光视频内容,文字内容也是如此,因为文字内容的匮乏,字节跳动甚至出现过抄袭百度知道内容的情况。
另一方面,多模态识别技术能力也并非像人们想象中那么容易达成。多模态考验的是对画面、声音和文字的综合理解,从理论上来说,字节跳动的视频产品想要实现智能推荐和内容安全,同样需要理解能力才能进行甄别。可字节跳动真的具备这种能力吗?一直以来,内容合规性常常让字节跳动头疼,在海外因色情内容被印度政府呼吁封杀,最近在国内又因为“画车标”风潮被大为诟病。如果说字节跳动真的拥有技术能力,难道不应该先解决内容安全问题吗?
版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/74049.html
- 上一篇:荣耀总裁调查开机广告 82%的用户一秒都不忍
- 下一篇:无惧禁令!华为新机稳了