数据殖民主义:当人工智能公司想殖民全人类的数据时,如何阻止他们?发表时间:2024-04-02 21:49 最近数月,美国一些小说家、艺术工作者及新闻机构对人工智能公司提起了诉讼,指控它们在其内容上"搭便车"。诉讼指出,这些企业通过使用这些内容训练其机器学习模型,可能侵犯了版权法。 对科技行业而言,挖掘这类内容对构建人工智能工具而言是必不可少的,而科技公司认为这最终将惠及大众。OpenAI最近在向立法者提交的声明中强调,若不利用受版权保护的材料,便无法开发出当前最先进的人工智能模型。尽管法院是否会接受此一观点还未可知,但对于内容创作者来说,前景并不太明朗。今年2月,加州一法院拒绝了萨拉·西尔弗曼(Sarah Silverman)及其他作家提出的多项诉求。 一些案例可能反映了持续的谈判过程,因为某些企业正试图压迫其他公司,以分得人工智能这块“大蛋糕”。例如,出版巨头阿克塞尔·施普林格(Axel Springer)与社交平台Reddit近期达成了一项利润丰厚的协议,向人工智能公司授权使用其内容。与此同时,旨在保护创意产业内容的英国立法尝试已被搁置。 然而,这背后隐藏着一个更大的社会难题,可能并不那么容易被发现:那些我们通常不会立即想到与版权法有关的内容——如上传到各大平台的电子邮件、照片及视频——应如何处理?在这方面,并没有太多引人注目的法庭案例。然而,生成式人工智能对这些内容的占用,揭露了一场巨大的社会文化变革。 人们容易忽略这种变化,因为这类内容常被视为公共资产,不属于任何个体。但对于这类公共资产的挪用,潜藏着一种尚待命名的不公和剥削——一种在版权案例中难以捕捉的不公。这种不公正在历史上有过先例,每当有人声称拥有某项资源的所有权时,就是因为其意图在于占有之。 在殖民主义初期,如英国等殖民者声称他们新近“发现”的澳大利亚大陆法律上是“无主地”,即不属于任何人的土地,尽管那里早已有人居住多千年。这便是所谓的“发现论”——殖民时期的“发现者即占有者”。 最近,某些公司采取了类似的说法,意图将我们的数字内容甚至生物识别数据视作仅供开发之用的废料。从廉价土地、廉价劳动力到廉价数据,“发现论”的逻辑得以无缝连接,我们将这一现象称为“数据殖民主义”。这里的“殖民主义”并非比喻,而是描述一种非常真实的新兴社会秩序,其基础不再是自然资源或劳动力的开采,而是通过对人类生活数据的持续挪用。数据殖民主义帮助我们将当下社会生活的巨变理解为一段漫长的剥夺历史的延续。人类所有文化成为了原材料,被输送进商业人工智能机器,并从中获得巨额利润。今年早些时候,OpenAI开始了一轮7万亿美元的融资,正如《金融时报》所述,“超过了英国和法国国内生产总值的总和”。 真正关键的不是生成式人工智能的输出是否抄袭了权力巨大的媒体集团所拥有的著名作家们的作品。问题的实质是一种全新的获利模式,它将我们的日常生活转化为免费的数据输入。这种利润丰厚的数据搜集行为(其中生成式人工智能仅是众多恶例之一)实质上是一场持续已久的更广泛的权力斗争。 为了挑战这一现象,我们需要超越版权法的局限性,从更广阔的角度重新审视以“发现”为幌子的侵占主义为何属于错误行为。在今日,我们的生活和文化被转换为了被殖民的数据领域,这种新的——到目前为止几乎未受争议的——转变将决定大型科技公司与我们之间的关系,可能持续数十年甚至数个世纪。一旦资源被占据,几乎不可能重新夺回,现代政府在作出剥夺土著人土地权利的决定时仍旧引用“发现论”便是明证。 土地之于历史,数据之于当代。若我们不采取行动,我们将在未来长时间内为大型科技公司的“发现论”付出代价。 在人工智能时代应用历史教训 遗憾的是,仅仅通过退出某个社交媒体平台等单轨途径来解决这些问题是远远不够的。鉴于殖民主义是一个具有数百年历史的复杂问题,因此反抗其新形态也需借鉴丰富的反殖民主义传统,采用多维度的解决策略。 在这场斗争中,最为关键的工具即是我们的想象力。数据的去殖民化需成为一项富有创造性的文化运动。实际上,没有任何一个殖民社会能够彻底、永久地根除殖民主义。但即便无法以身体力行反抗殖民主义,我们亦能通过思想来抗争。集体的智慧将成为我们最宝贵的财富。 在我们近期出版的《数据掠夺:大科技的新殖民主义以及如何反击》一书中,我们概述了一些可以开始运用这种创造性能量的实际方法。我们借鉴了拉丁美洲和拉丁活动家的做法,他们鼓励我们在三个不同层面同时采取行动:体制内、反体制和超越体制。仅仅局限于其中一个层面是不足够的。 那么,这在实践中将如何体现呢?在体制内工作可能意味着继续推动政府做出迄今为止大多未能实现的事情:通过反垄断法、消费者保护法及保护我们的文化作品和遗产的法律来对大科技公司进行规范。放弃主流政治看似诱人,但从长期来看,这种做法只会适得其反。 但我们不能仅仅等待制度的自我修正。这意味着我们需要对抗体制,如同几个世纪以来的去殖民化运动一样,拥抱抵抗的政治和美学,人类有着许多鼓舞人心的案例,涉及工会、工人权益、土著数据主权、环保组织以及反对利用数据技术进行战争、监控、种族隔离和针对移民的迫害的运动。 最终,我们需超越体制思考,探索限制数据使用的方法,并将数据的利用转向更加社会化、民主化的目标。这或许是最难的任务,但也是最重要的。这需要新技术的开发,也需要新的拒绝技术的方法。为了抵制数据殖民主义带来的新不公,我们需要巨大的集体努力和想象力。在对抗和逆转殖民主义的漫长道路上,这一努力是至关重要的一步。 作者简介:尤利塞斯·A·梅希亚斯 (Ulises A. Mejias) 是纽约州立大学奥斯威戈分校传播学教授。 尼克·库尔德里 (Nick Couldry) 是伦敦政治经济学院媒体传播和社会理论教授。 文章信源:Truthout(真相输出) 信源简介:Truthout是一家独立的非营利新闻组织,主要关注社会正义、环境和政治议题。它以深入调查和报道著称,致力于揭露社会不公和提供替代性视角。Truthout不接受广告或政府资助,依靠读者捐赠维持运营,强调其新闻内容的独立性和客观性。该媒体经常关注被主流媒体忽视的话题,以及挑战传统权威和观点的报道。但其立场具有极度倾向性,对转基因生物持负面看法。 信源评级: 文章仅供交流学习,不代表日新说观点。 |