戴维·罗恩(David Rowan):英国《连线》杂志编辑。
在一个大数据世界里,一条统计学上的指数上升曲线,使我们明白了自己怎样屈从于数字的威力。根据IBM的统计,每天我们总共会生成2.5EB(艾字节)的数据。在国际数据公司(International Data Corporation)的估算中,那就是海啸般的结构数据和非结构数据以每年60%的速度在增长。沃尔玛超市每小时把百万单零售交易记录拖进数据库,它在很久以前就已经上传了2.5PB(拍字节);Facebook每天处理25亿条内容和500TB(太字节)数据;还有谷歌每天积累起24PB的数据,它的YouTube分部独自每分钟就获得72小时时长的新视频。难怪硅谷的明星不再是天赋异禀的软件工程师,而是以分析见长的、更受人尊敬的数据科学家了。
当然,在先前对泽它字节(ZB)和尧它字节(YB)散乱的0和1的处理中,有着巨大的公共利益。利用个性化医疗的算法魔力,低成本的基因组学让肿瘤学家比以往更准确地攻击肿瘤;实时贝叶斯分析能让情报部门尝试去甄别坏人,它成为打击恐怖主义的一种新的数据挖掘方法。还有,不要忘记把原始数据转化成可操作的信息而增加业务的商业优势:根据经济学人智库的分析,那些有效使用数据的公司,其股价通常是同行的2.5倍。我们的生活不可阻挡地走进数据驱动的世界,然而一个迅速出现的数据下层社会却被排斥在外。任何一个对新算法工具缺少基本了解或极少有权使用它们的公民,都将在经济、政治和社会参与等广阔领域越来越被弱势化。这种数据对权力的剥夺会使个人信用或政治影响很难建立;他们将受到股票市场和社交网络的歧视。我们需要把数据读写能力看作在21世纪民主社会中一项必要的基本技能,并发起运动,甚或立法,去保护那些被遗忘者的利益。
数据剥夺权力有两种主要方法。
第一,他们在面对那些名义上对所有人都开放的市场中存在系统性劣势。拿股市来说:今天,胆敢与“高频低延迟算法”的机器交易员竞争的任何人,都应该意识到情况对他们多么不利。安德烈·基里连科(Andrei Kirilenko)是美国商品期货交易委员会的首席经济学家,他与普林斯顿大学和华盛顿大学的研究人员一道发现,最富有冲劲儿的高频交易员倾向于创造出最大利润,这意味着小投资者最明智的选择就是让机器帮自己炒股。这并非巧合,一大片其他领域里的权力正在归拢于那些控制算法的人,不论是奥巴马竞选活动使用的“微定位”(microtargeter),还是用“数据施肥”(data-fueled)的精细农业提高产量的战略家。
第二,绝对权力正在交给那些超级数据挖掘者,无相应责任的“优势”使得他们的统治力越来越不可撼动。数据寡头将从各个角度定义普通大众。那些征信机构、雇主甚至美国国家安全局,都有一个关于你的固定看法。这基于你的在线数据流量,比如搜索引擎、社交网络以及个人“影响力得分”网站;他们并不管相关内容是否不实或早已过期。祝你好运,尽力纠正这些正在损害你前程的错误或虚假印象。那些被剥夺了权力的用户(比如Instagram和Facebook的用户)已经越来越意识到,个人数据如何被使用,是由那些机构说了算,而不是由自己说了算。显然,是用户在生产着那些数据,所以必须明确一种责任,去告知和教导用户。
数据就是权力。随着个人的度量标准变得比以往更容易收集和储存,数据权力必须得到再平衡,并稳固地回归到个人和公民手中。让医药企业有选择地甚至误导性地控制临床实验数据,其实是在阻碍医学的进步。在尧它字节时代,让我们坚持占有数据库机器的钥匙,确保人们对数据库的主权吧。