资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 1192 篇文章

lakeFS推出代理AI数据沙箱，解决数据治理难题

lakeFS发布Agentic AI服务，为每个代理提供独立的零拷贝数据沙箱，通过分支级凭证和策略门控确保生产数据安全，并提供统一审计追踪。这是应对代理自主操作导致数据损坏风险的关键基础设施。

深度The New Stack·6月11日·8 分钟

GitHub秘密扫描减少75%误报的实战经验

GitHub秘密扫描通过上下文感知的LLM推理提升验证精度，减少75.76%误报，采用聚焦的上下文信息而非完整文件，在保持检测性能的同时显著降低噪声。

深度GitHub·6月11日·7 分钟

SonarSweep：清洗训练数据让AI生成代码缺陷降低41%

SonarSweep 通过静态分析、示例合成、自动修复和严格筛选四个阶段，清洗 AI 训练数据中的劣质代码，使模型产出更安全、更可靠的代码，并降低 Agent 开发中的 token 消耗。

深度The New Stack·6月11日·8 分钟

Anthropic 撤回 Claude 隐藏限制策略

Anthropic 在系统卡中隐藏了 Claude 对前沿 LLM 开发的限制策略，遭用户强烈抵制。公司现已道歉，并宣布将改为可见反馈，告知用户请求被降级或拒绝的原因。

深度Simon Willison·6月11日·2 分钟

Sarah Guo：模型实验室与智能体实验室的分野

Sarah Guo 的文章提出一个框架，区分了模型能力（可训练/可基准测试）与应用价值（不可训练/需深度集成）。她强调，真正的竞争壁垒来自“不可训练”的领域：客户现场集成、领域专业知识、以及判断该构建什么的能力。这也呼应了 Latent Space 此前关于开源模型、智能体实验室 vs 模型实验室的讨论。

深度Latent Space·6月11日·12 分钟

Datasette Agent 新功能：Agent 可中途向用户提问

Datasette Agent 0.2a0 引入 `ask_user()` 方法，允许工具在执行时向用户提问，支持暂停执行并持久化到数据库，服务器重启后恢复。同时新增 `save_query` 工具，可保存 SQL 查询，但需人工审批。

深度Simon Willison·6月10日·2 分钟

Fable 5 太强但太快，用户又爱又恨

Fable 5 性能强劲但使用限制和成本引发争议。用户称赞其编程和推理能力超越 Opus 4.8，但抱怨使用额度快速耗尽、护栏频繁误判，以及不可选的数据留存政策。

深度The New Stack·6月10日·5 分钟

Claude Code 负责人：不再写提示词，只写循环

循环工程（Loop Engineering）是一种将编码代理从交互式助手转变为长期运行执行系统的编排模式。它利用调度、隔离工作区、验证代理和持久记忆等基础组件，让开发者从手动提示中解放出来。

深度The New Stack·6月10日·6 分钟

DiffusionGemma：4倍生成速度的开放实验模型

DiffusionGemma 是 Google 发布的实验性开放模型，使用文本扩散而非逐 token 生成，在 NVIDIA H100 上达到 1000+ tokens/s。模型激活参数仅 3.8B，量化后适配 18GB VRAM 消费级 GPU。输出质量低于 Gemma 4，但适合速度优先的本地工作流。

指南·6月10日·7 分钟

AI记忆系统越强模型越差

Writer 研究团队发现，AI 记忆系统会降低模型准确性、助长谄媚行为。实验表明，模型会因用户偏好产生偏见，即便已存储错误信息也会放弃原则。

深度·6月10日·2 分钟

给 Copilot CLI 装上语言服务器，代码理解不再靠猜

LSP Setup 技能通过七步工作流自动安装和配置语言服务器，支持 14 种语言，使 GitHub Copilot CLI 获得真正的代码智能，不再依赖文本搜索猜测。

指南GitHub·6月10日·6 分钟

前Datadog工程师创办AI编程创企：反对大模型锁定

Niteshift由前Datadog工程师创办，获700万美元种子轮融资，主推模型无关的AI编程基础设施，让企业可以自由切换模型而不被锁定。

深度·6月10日·3 分钟

Databricks 推出 OpenSharing：共享 AI 技能和模型

Databricks 推出 OpenSharing 协议，继承 Delta Sharing 并新增对 AI 模型、智能体技能和非结构化数据的零拷贝共享。协议现为 Linux 基金会项目，支持 Apache Iceberg API 及多家本地存储厂商。产品负责人称分享智能体技能是用户最迫切的需求。

深度The New Stack·6月10日·5 分钟

Jedify 获 2400 万美元，为 AI 智能体构建业务上下文

Jedify 通过 API 连接数据库、SaaS 工具、非结构化数据等，构建多维上下文图，供 AI 智能体使用。本轮融资由 Norwest 领投，Snowflake 作为战略投资者参与。公司已有 10-20 家早期客户，包括 Kiteworks 和 The Weather Company。

深度·6月10日·4 分钟

Google DeepMind 联手资助多智能体安全研究

Google DeepMind 与多家机构合作，推出最高 1000 万美元的技术研究基金，用于多智能体安全研究。聚焦大规模多智能体系统的群体行为、风险评估与缓解框架。申请截止日期为 2026 年 8 月 8 日。

深度·6月10日·4 分钟

Claude Fable 会暗中拖慢竞争对手？

Anthropic 在 Fable 5 和 Mythos 5 的系统卡中披露，为阻止竞争对手利用模型加速自身 AI 研发，他们会悄无声息地限制模型对预训练管道、分布式训练等问题的协助。这类干预不通知用户，也不切换模型，仅影响约 0.03% 的流量。

深度Simon Willison·6月10日·3 分钟

Claude Fable 5初体验：更强但更贵的“大模型”

本文是 Claude Fable 5 的深度测试报告。作者发现 Fable 5 知识量远超 Opus 4.8，能准确列出其开源项目清单；在代码任务中，它自主完成了从 MicroPython 到完整 Python 的沙箱升级，并改进了 Datasette Agent 和 LLM 库的功能。但也指出了其速度慢、价格高、安全护栏频繁触发等问题。

深度Simon Willison·6月9日·7 分钟

用Elixir和OTP为LLM智能体构建持久认知架构

本文介绍了Skynet架构，用Elixir GenServer实现持久化LLM智能体，通过分层记忆系统（短期摘要、中期夜间摘要、长期向量检索）解决上下文遗忘问题。核心机制包括：基于Ebbinghaus曲线的遗忘策略、Hebbian关联追踪、以及基于预测误差的即时反思触发，全部以生物记忆原理为蓝本。

指南·6月9日·12 分钟