资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 938 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 938 篇文章
Galileo 推出开源项目 Agent Control,旨在为企业提供集中式的 AI 智能体管控平台,支持跨部署统一实施安全护栏。IDC 预测企业 AI 智能体使用量将激增,此类治理工具需求迫切。
LangChain 为 Deep Agents 添加了自主上下文压缩功能,模型可自行判断何时压缩历史对话。该工具通过中间件实现,已在 CLI 中默认启用,SDK 中需手动配置。测试显示模型使用保守,但能有效提升长对话效率。
微软 VS Code 团队借助 GitHub Copilot 和定制智能体,将发布周期从每月缩短至每周。产品经理能直接编写原型代码并提交 PR,工程师则用智能体自动化代码审查和问题处理。团队认为,让代码库适应智能体是当前工程团队的关键能力。
JetBrains 指出 AI 编码智能体在缺乏项目结构理解的情况下生成代码,会累积「影子技术债」。公司发布 Junie CLI 作为独立智能体,具备代码库智能;同时推出 Air 环境,支持多智能体协同工作,定位为智能体时代的基础设施层。
本文邀请《The New Stack》的读者向姊妹平台 Towards Data Science 投稿,分享在数据、AI 和智能体工程(Agentic Engineering)领域的实践经验。文章介绍了投稿要求、受欢迎的内容类型以及作者报酬计划。
Cloudflare 推出 RFC 9457 兼容的结构化错误响应,支持 Markdown 和 JSON 格式,使 AI Agent 能直接读取机器可读指令。此举将错误响应负载和 Token 使用量减少超过 98%,提升 Agent 工作流的效率和成本效益。
乐天集团通过部署 OpenAI 的 Codex 智能体,显著提升了软件交付的速度和安全性。具体成效包括:将平均恢复时间减少约 50%,在 CI/CD 中自动化代码审查与漏洞检查,并将大型全栈项目的开发周期从季度级压缩到周级。
文章分析了 AI 智能体面临的提示注入攻击如何演变为社交工程,强调防御需限制操作影响而非仅检测恶意输入。OpenAI 在 ChatGPT 中采用源-汇分析和 Safe Url 等机制,在敏感信息外传前介入用户确认,借鉴了人类客服的风险管控思路。
OpenAI 的 Responses API 结合 shell 工具和托管容器,为智能体提供了执行环境,支持文件操作、数据库查询和受控网络访问。系统通过并发执行、输出限制和上下文压缩(Compaction)优化性能,并引入技能(Skills)实现工作流复用,使智能体能处理端到端的复杂任务。
文章汇总了 2026 年 3 月 11 日的 AI 编程动态,包括 GPT-5.4 与 Claude Opus 的代码质量对比测试、Claude Code 新功能如代码审查和本地定时任务,以及两起严重安全事件:Claude Code 误删数据库和 GitHub Issue 标题漏洞攻击。
Brewlog 是一个自托管的咖啡日志平台,能追踪烘焙商、烘焙批次、咖啡袋、冲煮记录、设备和咖啡馆访问。项目采用 Rust 后端和 Datastar 前端,并集成了基于 LLM 的咖啡袋扫描功能。作者分享了项目设计决策和智能体编程模式。
文章定义了智能体执行框架(Harness)的概念,即模型之外的所有代码、配置和执行逻辑。通过分析模型原生能力的局限性,推导出文件系统、代码执行、沙箱环境、内存搜索等关键组件如何帮助智能体完成实际工作。执行框架设计旨在将期望的智能体行为转化为可实现的系统特性。
Together AI 宣布其 Dedicated Inference 服务已支持 NVIDIA Nemotron 3 Super 模型。该模型采用 Transformer 与 Mamba 混合架构,拥有 100 万 token 上下文窗口,专为复杂推理和多智能体工作流设计。开发者无需管理 GPU 即可部署。
编码智能体降低了代码实现成本,使软件构建流程从PRD驱动的瀑布模式转向原型驱动的评审模式。EPD角色随之演变:通才价值飙升,系统思维成为关键技能,所有人需具备产品感,专业门槛提高,角色分化为构建者与评审者。
GitHub Copilot SDK 将智能体执行层开放为可编程能力,支持多步任务委托、结构化上下文执行和应用内嵌入。AI 正从文本接口转向执行接口,改变软件架构。
作者通过两个关键线索——大语言模型能用 Base64 进行完整对话,以及 Goliath-120B 模型层间乱序拼接仍能工作——推测出 Transformer 模型存在“翻译层”和“推理皮层”。基于此,他通过复制中间层,在不改变任何权重的情况下,让模型性能大幅提升,登顶排行榜。
英伟达即将发布开源 AI 智能体平台 NemoClaw,旨在为企业提供安全部署方案。平台开放给所有公司使用,无论是否采用英伟达芯片。这可能是英伟达应对 AI 智能体安全担忧和行业变化的新策略。
本文记录了使用 AI 智能体(Claude Opus 4.6 + Copilot CLI)对经典教材《算法导论》进行大规模形式化验证的实践。智能体在数周内自动生成了超过 10 万行 F*/Pulse 代码与证明,但核心挑战在于如何有效审计同样由 AI 生成的规范。文章分享了主要发现,包括程序验证工具的有效性、规范审查的难题,以及由此带来的编程语言设计研究机会。