资讯

AI Agent Skills 生态的最新动态、教程和深度分析

找到 17 篇文章

亚洲AI推出类Mythos模型，美国出口禁令持续

美国出口禁令持续，亚洲AI公司推出竞品：360的“屠龙风”对标Mythos，Sakana AI的Fugu模型具备前沿能力且无出口管制风险。尽管美国模型仍受重视，但本地化替代品正在崛起。

深度·6月27日·5 分钟

Transformers.js 跨域存储 API 实验：解决模型重复下载难题

Transformers.js 作为浏览器端运行 AI 模型的工具，面临因缓存隔离导致的重复下载问题。文章通过自动语音识别和情感分析两个管道示例，展示了模型和 Wasm 运行时资源在不同源间无法共享缓存，进而引出了跨域存储 API 这一解决方案。

深度Hugging Face·6月23日·6 分钟

Postgres 的下一个挑战：减少数据搬运

Postgres 的演进方向从存储性能转向互操作性。AI 暴露了数据多次复制的弊端，减少数据搬运成为关键。未来创新将围绕扩展能力展开，而非重新发明数据库。

深度The New Stack·6月18日·5 分钟

生产级RAG系统的检索瓶颈与解决方案

生产级RAG系统在规模扩展时，检索召回率会急剧下降，导致模型基于不完整或无关上下文生成错误答案。问题在于检索架构过于简单，而非模型能力不足。通过构建深度检索、混合搜索、多级排序的统一检索系统，可以在保证低延迟的同时维持高召回，从根本上提升RAG系统的可靠性。

深度The New Stack·5月19日·12 分钟

Aurora 优化器：解决 Muon 神经元死亡问题，训练效率提升 100 倍

Aurora 优化器通过交替投影到半正交矩阵集合和均匀行范数集合，解决了 Muon 更新中的行范数各向异性导致的神经元死亡问题。在 1.1B 参数规模上，Aurora 实现了 100 倍的数据效率，并超越了当前 nanoGPT 速度跑榜的最优结果。

深度·5月10日·5 分钟

Pinecone 宣布 RAG 时代结束，转向知识编译

Pinecone 推出 Nexus 知识引擎和 KnowQL 查询语言，主张将推理上移，预编译数据为结构化工件，而非在推理时检索原始块。此举可使任务完成率超 90%、Token 消耗降低 90%。

深度The New Stack·5月6日·5 分钟

Bret Taylor 的 Sierra 收购 YC 背景 AI 初创 Fragment

Sierra 收购了 YC 支持的法国 AI 初创 Fragment，以增强其智能体开发能力。收购金额未披露，Fragment 联合创始人将加入 Sierra。

深度·4月23日·2 分钟

Artifacts：专为智能体设计的 Git 存储

Artifacts 是一个专为智能体设计的分布式版本化文件系统，兼容 Git 协议，支持大规模仓库创建和自动化管理。它基于 Durable Objects 和 Zig 编写的 WASM Git 服务器构建，适用于代码、配置、会话历史等多种数据的持久化存储。

指南·4月16日·6 分钟

用 RAG 和 ChromaDB 搭建带记忆的文档搜索应用

本教程详细演示了构建一个具备记忆功能的私有文档搜索应用的完整流程。从安装依赖、加载文档、分块处理，到使用 ChromaDB 存储向量嵌入并实现带历史记忆的问答链。最后还展示了如何添加交互式问答循环，让应用能动态响应用户查询。

教程The New Stack·4月10日·8 分钟

Anthropic 切断第三方执行框架订阅，开发者担忧工作流碎片化

Anthropic 停止 Claude 订阅对第三方执行框架的支持，强制转向按量计费，引发开发者对工作流可移植性和供应商锁定的担忧。行业专家指出，这反映了 AI 平台加强对工具生态控制的趋势，可能推动开发者转向开源模型或更灵活的基础设施方案。

深度The New Stack·4月6日·4 分钟

笔记本退货事件暴露 RAG 检索准确性问题

本文通过真实案例揭示了 RAG 生产环境中的检索准确性问题，提出混合搜索（Hybrid Search）解决方案，将向量相似度与 SQL 谓词结合，在单一数据库查询中实现精确检索。

深度The New Stack·4月3日·7 分钟

GitHub 用 AI 检测扩展应用安全覆盖

GitHub 推出 AI 安全检测功能，与 CodeQL 静态分析互补，扩展对 Shell、Dockerfile、Terraform 等生态的支持。检测结果直接集成到 PR 工作流，结合 Copilot Autofix 快速修复漏洞，帮助团队在合并点强制执行安全策略。

指南GitHub·3月23日·3 分钟

Simon Willison 谈智能体工程：从信任到测试

本文编译了 Simon Willison 在 Pragmatic Summit 上关于智能体工程（Agentic Engineering）的谈话要点。他讨论了开发者采纳 AI 工具的演进阶段、如何建立对 AI 输出的信任、测试驱动开发在智能体编码中的实践，以及代码质量、模板使用和安全挑战等关键话题。

深度Simon Willison·3月14日·8 分钟

Turbopuffer 创始人谈 RAG 后时代搜索

Turbopuffer 起源于帮助 Readwise 解决昂贵的向量搜索成本问题。创始人 Simon 认为，大模型需要连接外部系统来获取完整知识，而智能体工作流将导致搜索查询量激增。他分享了服务 Cursor、Notion 等客户的经验，并阐述了其“P99 工程师”的招聘哲学。

深度Latent Space·3月12日·3 分钟

Hugging Face Hub 推出存储桶功能

Storage Buckets 是 Hugging Face Hub 上类似 S3 的可变对象存储，专为机器学习生产中的中间文件设计。它支持 CLI、Python 和文件系统集成，并利用 Xet 后端进行内容分块和去重，提升传输效率并降低成本。

指南Hugging Face·3月10日·4 分钟

上下文腐化拖垮企业 AI，Elastic 专家支招破解

上下文腐化（Context Rot）指 AI 系统因新旧数据冲突导致性能下降的问题，表现为响应延迟、幻觉增加。解决方案包括建立评估指标监控性能，并利用 Elasticsearch 等工具进行相关性检索和数据治理。分析师强调，企业需持续对抗上下文腐化，否则将引发模型有效性下降的恶性循环。

深度The New Stack·3月9日·4 分钟

零手写代码，五个月交付百万行产品

团队通过 Codex 智能体在零手写代码约束下，五个月交付了百万行代码的产品，工程效率提升十倍。核心经验包括：将知识库结构化而非堆砌指令、推动更多上下文入仓以提升智能体可读性、通过强制约束而非微观管理来保持代码库一致性。

深度OpenAI·2月11日·6 分钟