戴维·罗恩(David Rowan):
《连线》杂志英国版主编。
谷歌公司前任CEO埃里克·施密特(Eric Schmidt)常说,从文化诞生到2003年,人类已经制造了5 EB的信息。而现在,我们每两天就能产出5EB的内容,并且这一速度还在加快。在这个后隐私时代,大量社会媒体的分享、GPS定位、手机信号塔、无线传感监测、浏览器定位、人脸识别检测、消费意向调查及其他各种各样的方式,让我们的个人资料存在于我们无法控制的数据库中,而我们也无法基于这些数据做出更明智的决策。所以,是时候在市场营销公司的消费者信息、信用卡公司的反欺诈分析和国家资助的全面信息识别监管中开拓出数据挖掘的概念了。我们需要思考如何挖掘我们的信息输出方式,提炼出将无序的个人资料整理成可操作并具有预测性的信息的方法。如果对个人资料的挖掘能进入大众视野,我们所有人都将受益。
微软公司在2006年9月看到了这样的机会,它的个人数据开发系统(personal data mining)申请了美国20080082393号专利。这一系统主要用于分析用户自己或第三方提供的个人资料,通过识别机会和提供建议来提高用户的生产力和生活质量。用户可以自己决定是否让微软使用其生活记录,但大家一般都很难拒绝这样的请求,因为使用说明中说到,个人资料的开发是“识别那些很可能被埋没的相关信息”的一种方法。
如果个人的资料数据能被开发出一些可操作的模式,无论是个人还是整个社会都将受益。这样的开发能将那些杂乱的原始数据变成具有预测能力的数据,它们可以预测我的情绪,提高我的效率,让我变得更健康、更直观,显示出我的学习成绩和创造力。我还希望能发现某些隐藏的意义,揭示出那些我忽略的风险因素可能带来的后果。在一个分享的时代,我们更需要数据驱动的自我探索。
一场快速发展的小规模自我跟踪运动已经显现出这种思维的潜力,凯文·凯利的“量化自我”和加里·沃尔夫(Gary Wolf)的“数据驱动式生活”启发了这场运动。通过移动传感器、APP应用软件和效果可视化,这场运动跟踪并测量着个体的运动量、睡眠质量、警觉性、生产力、药物反应、DNA、心跳、饮食、收支情况等,在此基础上分享分析结果,并将其纳入更大的数据库中进行分析理解。这就是对原始数据进行聚类、分层等分析以发现规律,基本上就是简单地从冗余信息中提取有效信号。
无论是像23andMe基因技术公司那样将个人资料加入资料库以获得科学理解,还是像traineo那样利用用户提交的数据来激发其他用户改变自己的行为,这种思维能获得的累计回报将是互利性而非自利性的。事实上,正如丹尼尔·卡尼曼、丹尼尔·吉尔伯特(Daniel Gilbert)、克里斯塔基斯和马丁·福勒(Martin Fowler)所展示的那样,个体层面准确的数据跟踪,是理解和量化人类幸福,理解社交网络如何影响我们的行为,理解疾病如何通过群体传播的关键。
数据已经在那里了,我们只需要鼓励人们去利用它、分享它,并将其纳入知识之中。