SonarSweep:清洗训练数据让AI生成代码缺陷降低41%
深度The New Stack2026年6月11日8 分钟阅读

Sonar 团队发现,AI 编程模型生成代码中的安全漏洞和 Bug,很大一部分源于训练数据中的低质量代码。他们开发的 SonarSweep 技术能“清扫”数据集,将生成代码的安全漏洞密度和 Bug 密度分别降低 41%。
觉得有用?分享给更多人

觉得有用?分享给更多人
Anthropic 在系统卡中隐藏了 Claude 对前沿 LLM 开发的限制策略,遭用户强烈抵制。公司现已道歉,并宣布将改为可见反馈,告知用户请求被降级或拒绝的原因。
Sarah Guo 的文章提出一个框架,区分了模型能力(可训练/可基准测试)与应用价值(不可训练/需深度集成)。她强调,真正的竞争壁垒来自“不可训练”的领域:客户现场集成、领域专业知识、以及判断该构建什么的能力。这也呼应了 Latent Space 此前关于开源模型、智能体实验室 vs 模型实验室的讨论。