数据驱动的集体行动是一种越来越普遍的做法,包括公民科学、医学研究、艺术和文化、消费者维权和其他领域的例子。贯穿这些不同举措的理念是,人们可以有意识地为一项超越自身的事业贡献数字数据,就像人们长期以来付出金钱和时间的方式一样。我们已经有了关于付出金钱和时间的法律和规范,包括那些管理非营利组织、慈善捐赠和志愿服务的法律和规范。除其他考虑外,在制定这些法律时,必须将有意奉献时间与剥削性劳动行为和财务贡献与敲诈或欺诈区分开来。这两种情况都取决于捐赠者做出了深思熟虑的选择。个人有权决定是否为某项事业提供金钱或时间,对捐赠者和接受捐赠的组织都有相应的保护措施。关于付出时间和金钱的规则已经存在了很长时间,除了政策倡导者、学者和改革者,很多人都不怎么考虑它们。但在提供数据方面,我们要重新开始,我们做出的决定将关系到我们所有人。关于我们是否、如何提供数据以及谁提供数据的斗争才刚刚开始。

两个截然不同的未来悬而未决。一种未来类似于VHC这样的努力,在这种情况下,人们寻找的是难以聚合或被锁在专有墙后面的信息。我们将研究一系列案例,从人们分享鸟类照片到有线电视账单,再到健康数据。在每一个例子中,社区都在制定有关数据使用、管理技术和提供新服务或分析的规则。这种方法是由人驱动的——关于收集什么数据、在什么条件下以及采取什么保护措施的决定通常是由自己的数据涉及的人做出的。这些数据背后的软件代码通常是开源的,管理人员密切关注数据能做什么,不能做什么。

另一种未来在十多年前就已经很明显了。这是一种自上而下、由企业主导的数据慈善模式,这个术语是联合国(United Nations)创造的。用联合国的话说,当“私营部门分享数据以支持更及时和更有针对性的政策行动”时,数据慈善就会发生。在这种方法中,拥有大量数据集的公司(现在几乎所有的公司都是这样)允许研究人员访问这些数据,以解决特定的挑战。这方面的例子包括电信公司分析汇总的电话位置数据,以跟踪流行病期间人们的行动,或分析社交媒体动态,以协助救灾。这种方法确保了公司对数据流的完全控制,并允许他们通过对一些外部定义的问题进行研究而获得好感。在数据流中拥有数据的人对数据的处理没有发言权,对分析或底层数据的外部审查很少发生,而公司自己的服务条款掌握了决策过程。

在这两种未来之间的斗争中,关键在于我们是否有能力在使用我们的数据用于公共事业方面做出有意的选择。第一种方式,即提供数据的社区驱动模型,有很多方法可以做到这一点。它们还不是非常明显或一致,防止滥用或欺诈的保护措施仍然太少。空间是碎片化的,不容易导航。但它包含了大量的创造性能量和各种可能性,使之变得更容易,更普遍,更一致。尽管个人提供数据的“方式”仍在不断涌现,但他们都有一个共同点,那就是对意图的承诺。

阅读全文我们如何提供数据《斯坦福社会创新评论》的Lucy Bernholz和Brigitte Pawliw-Fry。