在大数据时代下,数据的重要性不言而喻。Facebook作为技术巨头公司每天都在大规模的收集和存储用户数据。但是我们却不知道Facebook内部是如何运作的。本文从两方面进行了分析:1)Facebook的数据收集流程图;2)对数据安全性的担忧。
Facebook所收集的数据已使其成为世界上最具影响力的组织之一。共享实验室(Share Lab)则希望能够看破表面,理清这一技术巨头公司所使用的复杂算法和种种联系,以更好地了解该公司内部的社会结构和权力关系 。
几年前,贝尔格莱德(塞尔维亚共和国首都)的Vladan Joler和朋友开始研究这一全球最大公司之一的内部工作情况。他们的团队包括网络取证分析专家和数据可视化专家,已在塞尔维亚互联网服务提供商处考察了其称之为“不同形式的隐形基础设施”的情况。
但是,Joler和朋友正在一个名为共享实验室的项目下工作,他们的目标更为远大。Joler是塞尔维亚诺维萨德大学的教授,他说: “如果Facebook是一个国家,那么它会是比中国还要大的国家。”
他列出了一串熟悉但令人震惊的数字: 仅仅是硅谷的新公司也存储有约300PB的数据,拥有近20亿用户 ,而就是这些公司在2016年的收入也高达280亿美元(约合220亿欧元)。
然而,Joler认为,尽管我们作为用户总是免费向巨头公司提供大量信息作为他们的运作燃料,但我们却不知道公司表面之下是何种情况。
“我们所有人,当上传东西、标记人物、评论时,我们基本上都是在为Facebook工作,”他说。如Joler所说,人们互动所提供的数据支持着为社交媒体网站提供动力的复杂算法,正是如此,我们的行为也被转化为了产品。
试图解密其隐藏的部分也已被证明是一项庞大的任务。
他说:“我们尝试记录下所有的投入与结果,并记录下与Facebook进行交互的领域。我们记录了点赞、分享、搜索、更新状态、添加照片、朋友、名称,记录了设备中所有关于我们、关于应用程序给予Facebook的权限,例如手机状态、WiFi连接和音频记录等”。
但所有这些研究仅是整体计划的一小部分。因此该团队考察了Facebook的收购行为,并研究了其数量庞大的专利申请。
结果令人震惊。
数据庞大的流程图需要数小时才能完全理解,但其展示了我们提供给Facebook的数据是如何用以计算我们的种族亲密程度(Facebook的术语)、性取向、政治隶属关系、社会阶层、旅行时间表等。
这张图表展示了我们提供的所有信息。我们在Facebook上发布的链接、喜欢的页面、在由Facebook所有或与其有联系的网络上的许多其他网络行为,如在Instagram、WhatsApp或使用Facebook登录的其他网站,这些都可以被加入到一个巨大的算法过程。而且这个过程使得Facebook能精确定位用户,确定他们是否喜欢韩国食物、上班通勤时间长短、宝宝的年龄等情况。而且也说明了我们许多人通过智能手机应用程序所自愿提供的权限,其中包括阅读所有短信、未经许可下载文件以及访问用户精确位置的功能。
单独而言,这些是强大的工具;综合来看,他们则相当于数据收集引擎 。 Joler认为,这种发展的成熟程度已经到了可能出现滥用的地步。“就算是只考虑信息记录程序、移动电话的权限,又或是保留元数据,那么从数据分析的角度来看,这些都是非常棘手的。”
多年来,Facebook一直表示数据隐私和操作安全性至关重要。例如,Facebook数据不能被开发人员用来创建监控工具,与此同时,该公司表示它遵守所有国家的隐私保护法。他们还招募了数千名新员工来监察其内容。
尽管如此,Joler承认,他的研究使他对所得的信息有些偏执,但他对于未来的长期情况要更为担忧。这些数据都在一家公司手中。 即使其现在的领导人具备责任感、诚实守信,但二十年后的负责人又会是怎样的一个人呢 。
分析师表示分享实验室的工作是珍贵且发人深省的。康奈尔科技技术法律和政策专家Julia Powles博士说:“这或许是我所见过最全面的统计Facebook工作的研究了。研究人员沉着冷静地以数学方式展示出一个事实,即人们为了互相进行交流而放弃了大量其他的价值。” 对Facebook的研究范围可以简单的用数字表示,但是共享实验室所绘制的图表描绘出了其内在的特性,这是平行对比数据所无法实现的。
Powles博士解释说:“我们对科技巨头从未有过真正的历史类比。她继续说,这类公司的权力远远超出了当初的东印度公司和标准石油等老牌垄断企业。
虽然许多人可能认为马克·扎克伯格(Facebook创始人)帝国的目标是良好而充满善意的,但事实并不总是如此。Powles博士表示,Facebook一直是通过其受欢迎程度高于一切的方式来“顺应我们的基础心理冲动”。
但她的目的并不是希望共享实验室的研究能够导致Facebook数据的大规模流失,又或是导致对技术巨头的监督大大增加。
Powles博士说:“最引人注目的是顺从意识、监管不利、缺乏选择、公众冷漠。一个拥有巨大信息权力公司就拥有了非凡的优势,因为再没有比其更大的权力了。”
分享实验室团队希望能向公众揭示这种非凡的优势。但是,Joler很快就指出, 即使他们的大型图表也无法准确地描述这一社交媒体巨头公司的全部能力。 例如,他们不能保证的是,或许还存在有很多用于保密商业秘密的其他算法。
然而,Joler认为,“这仍然是当今世界唯一存在的图表,它是塑造我们世界的最伟大力量之一”。
|