元宣布暂停计划,根据监管压力,不再使用欧洲用户数据来训练AI

元已确认,将暂停计划,不再使用欧洲联盟和英国用户的数据来训练其AI系统。

此举是为了应对爱尔兰数据保护委员会(DPC)的反对意见,爱尔兰DPC是欧盟各国数据保护机构代表。英国信息专员办公室(ICO)也要求Meta暂停计划,直到解决其提出的关切。

“DPC对元暂停计划,不再使用欧盟/欧洲经济区成年人在Facebook和Instagram上分享的公共内容来培训其大型语言模型表示欢迎,”DPC在周五的一份声明中表示。“此决定是在DPC和Meta之间进行了密集的交流后做出的。DPC将继续与Meta就此问题保持联系,并与其欧盟数据保护机构同事合作。”

虽然Meta已经在美国等市场利用用户生成内容训练其AI,但欧洲严格的GDPR法规为Meta及其他公司改进其AI系统(包括使用用户生成的训练材料的大型语言模型)创造了障碍。

然而,Meta上个月开始通知用户即将对其隐私政策进行更改,称这将使其有权使用Facebook和Instagram上的公共内容来训练其AI,包括评论、与公司的互动、状态更新、照片及其相关说明。公司辩称需要这样做是为了反映“欧洲人口的多种语言、地理位置和文化参考”。

这些变化原定于6月26日生效。但这些计划激起了非营利性隐私活动组织NOYB(“none of your business”)针对欧盟成员国提出的11项投诉,指控Meta违反了GDPR的各个方面。其中之一涉及是否需要征得用户同意,即数据处理确实在进行时,用户首先应该被问及他们的许可,而不是依赖于拒绝采取行动。

至于Meta,它依赖GDPR的一个叫做“合法利益”的规定,以主张其行为符合法规。这并不是Meta第一次使用这一法律依据进行辩护,此前它曾这样做以证明处理欧洲用户用于定向广告的合规性。

总之,监管机构很可能至少会暂停Meta计划的变更,特别是考虑到该公司已经让用户难以“选择退出”数据使用。公司表示,已经发送了超过20亿条通知,告知用户即将发生的变化,但与其他重要的公共信息不同,这些通知并未置于用户的首要位置,而是出现在用户的普通通知中:朋友的生日提醒、照片标签提醒、小组公告等。因此,如果有人不经常检查通知,很容易错过这一点。

即使看到通知的人也不会自动知道有抗议或选择退出的方法,因为通知只是邀请用户点击查看Meta将如何使用他们的信息。没有任何暗示说这里有选择的余地。

Meta: AI 通知
图片来源:Meta

此外,从技术上讲,用户无法“选择退出”其数据的使用。相反,他们必须填写一个抗议表格,提出他们为什么不希望其数据被处理的论据——这完全取决于Meta是否会尊重这一请求,尽管公司表示将尊重每个请求。

Facebook“抗议”表格
图片来源:Meta / 截图

尽管抗议表格与通知相链接,但如果用户主动寻找“选择退出”选项,他们将会遇到困难。

在Facebook的网站上,他们首先需要点击右上方的个人资料照片;点击“设置和隐私”;点击“隐私中心”;向下滚动并点击“Meta的生成AI”部分;再次向下滚动过一堆链接来到一个标题为“更多资源”的部分。该部分下的第一个链接叫做“Meta如何使用信息进行生成AI模型”,他们需要阅读大约1100个单词后才能找到公司的“选择抗议”的表格。在Facebook移动应用程序中也是类似情况。

“选择抗议”表格链接
图片来源:Meta / 截图

本周早些时候,当被问及为什么这个过程要求用户提交抗议而不是选择加入时,Meta的政策沟通经理Matt Pollard指向了其现有的博客文章,该文章称:“我们认为这种法律基础(‘合法利益’)是处理公共数据、以培训AI模型所需的规模而尊重人们权利的最适当平衡。”

换言之,进行这种选择加入很可能不会产生足够大规模的人们愿意提供数据。因此,避免这一问题的最佳方法是在用户的其他通知中发出单一通知;为寻找“选择退出”的人隐藏一个抗议表格要经过数次点击;然后让他们证明他们的抗议,而不是给他们直接选择退出的权限。

在周五更新的博客文章中,Meta的全球隐私政策全球沟通总监Stefano Fratta表示,该公司对DPC所收到的请求感到“失望”。

“这对于欧洲的创新、AI开发中的竞争以及延迟将AI的好处带到欧洲人身边而言是一项倒退,”Fratta写道。“我们坚信我们的做法符合欧洲法律法规。AI培训并不是我们服务独有的,相较于行业其他竞争对手,我们更透明。”

AI 军备竞赛

所有这些都不是新鲜事,Meta正在一场AI军备竞赛中,这凸显了大科技公司在我们身上拥有的大量数据。

今年早些时候,Reddit披露,它已签约,将在未来几年内向ChatGPT制造商OpenAI和谷歌等公司许可其数据,可获得逾2亿美元。而谷歌这些公司之一已因依赖版权新闻内容来训练生成式AI模型而面临巨额罚款。

但这些努力也突显了公司将为确保在现有立法框架下利用这些数据而采取的极端措施;“选择加入”很少是议程上的内容,而选择退出的过程常常是多余费力的。就在上个月,有人在Slack现有隐私政策中发现了一些可疑措辞,暗示它将能够利用用户数据来训练其AI系统,用户只能通过向公司发送电子邮件来选择退出。

去年,谷歌最终为在线出版商提供了一种方式,使他们能够注入一段代码到其网站中以选择退出训练其模型。至于OpenAI,它正在建立一个专门工具,以让内容创建者选择不训练其生成式AI智能;这项工具预计将在2025年准备就绪。

虽然Meta暂时搁置了在欧洲训练其AI所使用的用户公共内容的计划,但它很可能会在与DPC和ICO协商后以其他形式再次出现,希望随之而来的是采用不同的用户权限处理方式。

ICO执行风险主管Stephen Almond在周五的一份声明中表示:“要充分利用生成式AI和它带来的机会,至关重要的是公众可以信赖从一开始就尊重他们隐私权的承诺。”“我们将继续监督主要的生成式AI开发商,包括Meta,审查他们已经制定的保障措施,确保英国用户的信息权利得到保护。”