GitHub Copilot 数据使用政策更新

GitHub 今天宣布了一项关于数据使用方式的更新,旨在提供更智能、更具上下文感知的编码辅助。从 4 月 24 日开始,Copilot 免费版、Pro 和 Pro+ 用户的交互数据——包括输入、输出、代码片段及相关上下文——将被用于训练和改进其 AI 模型,除非用户选择退出。Copilot Business 和 Copilot Enterprise 用户不受此次更新影响。
如果你不希望参与,可以在设置的“隐私”部分选择退出。如果你之前已经选择不允许 GitHub 为产品改进收集此类数据,你的偏好设置将被保留——你的选择会被尊重,你的数据将不会被用于训练,除非你主动选择加入。
这种做法与行业通行实践保持一致,并将提升所有用户的模型性能。通过参与,你将帮助我们的模型更好地理解开发工作流,提供更准确、更安全的代码模式建议,并提升其在代码进入生产环境前帮你发现潜在缺陷的能力。
真实世界数据 = 更聪明的模型
我们最初的模型是基于公开数据和手工编写的代码样本构建的。过去一年,我们开始整合来自微软员工的交互数据,并看到了显著的改进,包括多种语言中代码建议接受率的提升。
整合微软内部数据带来的改进表明,通过对真实世界交互数据进行训练,我们可以为更多样化的用例提升模型性能。如果你决定参与此计划,我们可能收集和利用的交互数据包括:
- 你接受或修改过的输出
- 发送给 GitHub Copilot 的输入,包括展示给模型的代码片段
- 光标位置周围的代码上下文
- 你编写的注释和文档
- 文件名、仓库结构和导航模式
- 与 Copilot 功能(聊天、行内建议等)的交互
- 你对建议的反馈(点赞/点踩评分)
此计划不会使用:
- Copilot Business、Copilot Enterprise 或企业所属仓库的交互数据
- 在 Copilot 设置中选择退出模型训练的用户交互数据
- 你处于“静态”状态的问题、讨论或私有仓库内容。我们特意使用“静态”一词,因为当你主动使用 Copilot 时,它确实会处理私有仓库中的代码。这些交互数据是运行服务所必需的,并且可能被用于模型训练,除非你选择退出。
此计划中使用的数据可能会与 GitHub 的关联公司(包括微软)共享。这些数据不会与第三方 AI 模型提供商或其他独立服务提供商共享。
我们相信,AI 辅助开发的未来依赖于像你这样的开发者提供的真实世界交互数据。这就是我们使用微软交互数据进行模型训练,并即将开始使用 GitHub 员工交互数据的原因。
如果你选择用你的交互数据帮助我们改进模型,感谢你。你的贡献对于构建服务于整个开发者社区的 AI 工具意义重大。如果你选择不参与,那也没问题——你仍然可以充分利用你所熟悉和喜爱的 AI 功能。
携手合作,我们可以继续构建能够加速你的工作流、并赋能你更快地构建更好、更安全软件的 AI。
如果你有任何疑问,请访问我们的常见问题解答及相关讨论。
作者
Mario Rodriguez 作为首席产品官领导 GitHub 产品团队。他的核心身份是一名学习者,他的热情在于创造开发者工具——以至于过去 20 年他一直在微软和 GitHub 的领导岗位上践行这一使命。Mario 最近负责监督 GitHub 的 AI 战略和 GitHub Copilot 产品线,推动 Copilot 在数千家组织和数百万用户中发布和成长。工作之余,Mario 与妻子和两个女儿共度时光。他还共同主持并创立了一所特许学校,致力于推动美国农村地区的教育进步。
相关文章
解决 GitHub 近期的可用性问题
GitHub 近期经历了几次可用性事件。我们理解这些中断对客户的影响,并在此分享我们当前优先处理的稳定性工作详情。
探索 GitHub 更多内容
文档
掌握 GitHub 所需的一切,尽在一处。
GitHub
在 GitHub 上构建未来,这里是任何人、在任何地方构建任何东西的平台。
客户故事
认识在 GitHub 上构建的公司和工程团队。
The GitHub Podcast
收听 GitHub 播客,这是一档专注于 GitHub 上开源开发者社区内及周边的主题、趋势、故事和文化的节目。
觉得有用?分享给更多人