谷歌更新隐私政策，确认使用公共数据训练 AI 模型

文章正文

发布时间：2023-07-06 20:06

当地时间本周一，谷歌方面对其隐私政策进行了更新。据了解，在更新后的隐私政策中提到，谷歌可通过收集网络上的公开信息或来自其他公共来源的数据，以帮助训练该公司的 AI（人工智能）模型及打造实用功能，并建构更完整的 AI 产品，其中包括谷歌翻译、聊天机器人 Bard 和 Cloud AI 功能等。

通过对比可以发现，在历史版本的隐私政策中，谷歌方面强调的则是这些数据将用于帮助训练 " 语言模型 "，而非 "AI 模型 "。

对此有观点认为，" 这意味着谷歌在使用公共数据进行训练和构建系统时具有更多的自由，将能够使用公共数据来构建更完整的自家 AI 产品，而非以往的单一功能。并且这项更新表明，谷歌方面正在向公众及其用户明确表示，他们在网上公开发布的任何内容都可能用于训练 Bard 及其未来版本，以及谷歌开发的任何其他生成式 AI 产品 "。

谷歌发言人克里斯塔 · 马尔登（Christa Muldoon）则回应称，" 我们的隐私政策一直都明确表示，谷歌使用来自开放网络的公共可获得信息来训练语言模型，用于谷歌翻译等服务……此次更新仅是澄清了新的服务（如 Bard）也包括在内。我们在开发 AI 技术时将隐私原则和保护措施纳入其中，符合我们的 AI 原则 "。

据了解，虽然谷歌新版隐私政策确认了公开信息将用于训练 AI 产品，但并未说明该公司是否或者将如何阻止受版权保护的内容进入相关训练数据库。截至目前，已有大量可公开访问的网站出台相关政策，禁止其他公司为训练大语言模型和其他 AI 产品集开展数据收集或网络抓取行为。同时，OpenAI 等公司也遭遇了多起与 " 控违规收集数据以训练大模型 " 相关的指控。

值得一提的是，此前曾有关消息源透露，为获得更多的数据，谷歌方面已经制定了协议，愿意在未来付费购买相关内容。该消息源表示，" 谷歌已经制定了许可协议，他们愿意接受需要付款购买内容的原则，但还没有讨论金额。谷歌方面称，未来几个月里会进行金额方面的谈判，这是第一步 "。

当时谷歌方面曾回应称，关于上述协议的报道 " 不准确 "，并表示 " 现在还处于早期阶段，我们正在继续与生态系统合作，包括内容发布者，以获取他们的意见 "。