在意大利实施临时禁令并在其他欧盟国家进行一系列调查后,OpenAI 有一周多的时间来遵守欧洲数据保护法。如果失败,它可能面临巨额罚款、被迫删除数据,甚至被禁止。
但专家告诉《麻省理工科技评论》,OpenAI 几乎不可能遵守这些规则。这是因为用于训练其 AI 模型的数据的收集方式:从互联网上收集内容。
在 AI 开发中,主导范式是训练数据越多越好。OpenAI 的 GPT-2 模型有一个包含 40 GB 文本的数据集。ChatGPT 所基于的 GPT-3 在 570 GB 数据上进行了训练。OpenAI 尚未透露其最新模型 GPT-4 的数据集有多大。
在过去的几周里,一些西方数据保护机构已经开始调查 OpenAI 如何收集和处理支持 ChatGPT 的数据。他们认为它已经收集了人们的个人数据,例如姓名或电子邮件地址,并在未经他们同意的情况下使用了这些数据。
如果 OpenAI 不能说服当局其数据使用做法是合法的,它可能会在特定国家甚至整个欧盟被禁止。法国数据保护机构 CNIL 的人工智能专家 Alexis Leautier 表示,它还可能面临巨额罚款,甚至可能被迫删除模型和用于训练它们的数据。
“美国的原则是,当东西公开时,它就不再是私人的,这根本不是欧洲法律的运作方式,”爱德华兹说。GDPR 赋予人们作为“数据主体”的权利,例如有权了解他们的数据是如何收集和使用的,以及有权将他们的数据从系统中删除,即使这些数据最初是公开的。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容