大数据时代的爱与怕
撰文 / 王先 郑亚红
编辑 / 严冬雪
2015年9月,万众创业的风势正猛,一位创业者找到我,安利他正在筹备的一个项目,主营业务是为企业做员工离职预报,他坚称市场前景非常可观,问我要不要报道。阅世甚浅的我感到十分新奇,然后拒绝了他。
再次听到他的消息是在3年半之后,3月25日,号称拥有中国最大简历数据库的巧达科技被曝已被警方查封,或涉嫌多款产品在未被授权情况下抓取用户简历等信息。这家公司的法人兼大股东王成予正是当年那位创业者。
巧达科技爆雷,距离央视315晚会曝光WiFi探针盗取个人手机号码、外卖App疑似“窃听门”不过一两周时间;3月27日,北京市消协发布大数据“杀熟”调查,认为去哪儿网、飞猪旅行确实涉嫌有“杀熟”行为。有声音将近期一系列动作解读为监管部门正掀起对大数据黑产的新一轮打击。
你的姓名、年龄、身份证、收入、喜好、购买记录……这些数据的主权还在你手上吗?它们被倒卖了多少轮?到底有多值钱?有知情人士透露,以医疗数据为例,由于用户转化率高、数据获取难,一例透析病人的数据可被炒到8000元。
2018年,上海交通大学邵国松教授等人选取了中国500家有影响力的网站,对其隐私政策声明进行分析,核实其是否较好地执行了《网络安全法》相关条款。结果发现,收集个人信息的网站在所有类别网站中都占据了极高比例,其中教育类网站收集比例高达100%,商业类网站需要身份识别的也达84%。
01
公开资料显示,巧达科技成立于2014年7月,数据来源为“乔大招”,包括之前为企业做员工离职预报的“爱伙伴”在内,其旗下10多款招聘工具均为免费产品,这些产品通过爬虫等技术在网上抓取简历后投入数据库,再向企业提供相关人才信息服务。
有在线招聘头部公司人士认为这些数据过于夸张,她对AI财经社表示,这种爬虫技术会触及很多相关企业利益,所以一般公司都会设有反爬机制。
“燃财经”拿到的一份巧达数据的商务计划书则显示,该公司旗下有38个B端招聘产品、超过170万招聘者用户,自称有超过10亿份通讯录、拥有超过8亿自然人的信息,通过简历解析,可以对自然人产生包括社会关系、组织关系、家庭关系及区域位置等定位,几乎涵盖个体所有关键信息维度。
巧达科技将这些数据用在招聘、电商、影视、保险、金融等行业。这为巧达科技在2016年带来1.2亿元营收,其中净利润即达4800万元,到2017年,两项数字激增至4.11亿元和1.86亿元。
王成予曾公开宣称,“简历是最有价值的自然人数据。巧达数据通过大数据及人工智能技术研发的认知引擎,能够快速还原网上自然人的清晰画像,为商家提供实用的营销方案。超过170万家互联网企业和猎头公司在使用相关产品”。
巧达科技在2014年11月得到创新工场数百万美元A轮融资,2017年1月再次得到中信产业基金数千万人民币B轮融资。
至于创始者王成予本人,则由中国裁判文书网曝露了更多信息,2016年3月《北京市第三中级人民法院民事判决书》中显示,王成予在2011年5月之前的十几年里,存在多次违法犯罪记录,包括盗窃、诈骗等,其中包括2006年轰动一时的涉嫌敲诈勒索华硕公司一案。
更多的事情并非出自惯犯之手。2019年315晚会上,央视曝光“探针盒子”,当个体手机Wifi处于开启状态,就可能被探针盒子捕获,并转换获取手机号码。探针盒子不仅可以强制用户手机弹窗,冒充已连接WiFi在微信置顶界面投放无法消除的广告,甚至还能拨打骚扰电话和发送短信。这些小盒子放在商场、写字楼等公共空间内,可以在个体毫不知情的情况下搜取个人数据,甚至包括婚姻、教育、收入等信息。
2019年3月18日,美团和饿了么被曝疑似窃听用户日常对话。《IT时报》称,通过长达3个月的测验,他们发现,只要日常在对话中提到某款食品的名字,这些外卖软件总能即时推送相应商家信息,出现相关推荐概率高达60%-70%。
伴随大数据时代的到来的,是信息安全这一新问题。过去几年里,从小平台到大公司,数据泄露事件频发,仅2018年就包括:圆通的10亿条快递信息在暗网上架出售;华住酒店、万豪酒店各有5亿用户信息外泄;国泰航空940万乘客数据流出;陌陌3000万用户数据泄露……
几乎按月爆发的频率、动辄上亿的量级面前,普通人兴许躲过这一劫,旋即栽在下一劫。
02
版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/48055.html