资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 938 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 938 篇文章
LangChain 二月更新涵盖 LangSmith 平台功能增强、开源项目 deepagents 沙箱支持,以及智能体生产监控的深度指南。团队还预告了五月 Interrupt 2026 大会,并列出全球多场社区活动。
Together AI 的 CPD 架构通过引入缓存感知路由和共享 KV 缓存层级,将冷请求(全新上下文)和热请求(可复用上下文)的预填充计算分离。这种设计防止了计算密集的冷请求阻塞共享资源,使得热请求能快速复用缓存,从而在混合负载下将可持续 QPS 提升 35-40%,并保持更优的尾部延迟。
Donald Knuth 在 2026 年 3 月 3 日分享,Claude Opus 4.6 解决了他研究数周的开放问题,让他对生成式 AI 的自动推理和创造性问题解决能力刮目相看。
Gemini 3.1 Flash-Lite 是 Google 廉价 Flash-Lite 系列的最新更新,价格大幅降低。它支持四种思维层级,用户可生成从极简到详细的不同风格图像。
Gemini 3.1 Flash-Lite 是 Google 最新低成本大语言模型,在 Arena.ai 上 Elo 得分 1432,性能超越同级别模型。开发者可通过 Google AI Studio 和 Vertex AI 预览使用,已获 Latitude 等公司早期测试。
文章探讨了 AI 如何加剧信息污染和社会信任危机,并汇总了近期 AI 开发工具的重要进展,包括 Qwen 3.5 小模型发布、Codex 5.3 性能提升以及智能体可靠性与可用性成为开发者关注焦点。
文章认为,在 AI 大规模生成代码的时代,传统的手动代码评审已不可持续。人类应将价值判断从“代码是否正确”转移到“是否解决了正确的问题”。未来工作流将以规范驱动开发为核心,通过多层自动化验证和安全护栏来确保代码质量。
作者 Simon Willison 分享了他如何利用 Claude Code 智能体,通过一条提示将 GIF 压缩工具 Gifsicle 编译为 WebAssembly,并自动生成一个功能完整的网页应用。文章拆解了提示的每个部分,解释了 Claude 如何理解并执行复杂指令,包括处理 WebAssembly 编译、UI 设计和自动化测试。
Claude 记忆导入功能允许用户通过 claude.com/import-memory 提示词导出所有对话记忆,包括个人细节、项目偏好和指令修正。输出格式为带日期的代码块,确保数据完整可移植。
AI 基础设施资本支出正以每年近 2000 亿美元的规模爆炸式增长,这可能侵蚀科技巨头的利润。编码智能体(如 Claude Code)的采用率正在急剧上升,预示着巨大的生产力变革。地缘政治、芯片供应链瓶颈和能源限制是 AI 发展的关键制约因素。
文章记录了作者从 AI 智能体编程怀疑者到实践者的转变,通过一系列渐进项目展示了智能体在复杂编码任务中的能力。他最终尝试用智能体将 Python 的 scikit-learn 库移植到 Rust,并指出最新模型相比几个月前的版本有质的飞跃。
METR 联合创始人 Joel Becker 首次做客 Latent Space 播客,解析了其团队备受争议的时间跨度评估工作,包括基准构建的复杂性、结果外推的陷阱,以及 AI 生产力研究的局限性。文章还链接了他在 AI Engineer 大会上的演讲和开发者生产力相关讨论。
Anthropic 推出面向大型开源项目维护者的免费 Claude Max 计划,需满足 GitHub 星标或 NPM 下载量门槛。名额有限,滚动审核。
本文详细介绍了如何利用 GitHub Copilot CLI 在终端中快速探索问题、搭建项目、调试故障并生成可审查的代码变更。重点在于理解何时使用 CLI 快速推进,何时切换到 IDE 精细打磨,以及如何最终在 GitHub 上完成协作与交付。
状态运行时环境解决了智能体在生产环境中运行多步骤工作流的挑战,如状态管理、工具调用和错误处理。它运行在 AWS 环境中,提供持久编排和内存,支持客户支持、销售运营等复杂解决方案。运行时即将在 Amazon Bedrock 上线,可通过 OpenAI 团队联系获取更多信息。
OpenAI 与亚马逊宣布战略合作,将 Frontier 平台引入 AWS,并投资 500 亿美元。AWS 将成为 Frontier 的独家第三方云分发提供商,双方将共同开发状态运行时环境和定制模型。
Nano Banana 2 以每千张图像 67 美元的价格成为当前最佳图像生成模型,具备实时搜索增强和 6 角色一致性能力。同时,智能体编码可靠性提升,但复杂性和评测通胀问题引发担忧。Perplexity 则通过三星集成和开源嵌入模型强化检索能力。
GitHub Copilot 智能编码助手新增模型选择器,可按任务需求选用不同模型;引入自检功能,在提交 PR 前自动优化代码;内置安全扫描,实时检测漏洞和敏感信息;支持创建自定义智能体,固化团队工作流程;新增 CLI 切换,云端和本地工作无缝衔接。