你想做什么?
编辑精选
本周值得关注的工具与文章
SkillNav 周刊:MCP 迈向生产级部署
本周 AI Agent 领域三大趋势:MCP 生态正从概念验证迈向生产级部署,Agent 架构设计进入深水区,AI 与人类协作出现新探索。NVIDIA 和 Perplexity 等厂商正通过标准化工具加速 Agent 实用化进程。
阅读完整周刊一个人 + Claude Code,从空目录到可用的 macOS 密码管理器。双层加密、Touch ID、中英双语,19 小时交付并开源。
本文记录了哈佛教授 Matthew Schwartz 指导 Claude Code 完成一项理论物理计算的全过程。他选择了一个研究生二年级难度的课题,将工作分解为 102 个任务,通过分阶段提示引导 AI 逐步完成。实验表明,AI 在结构化指导下能执行复杂计算,但仍需人类监督纠正错误。
精选工具
编辑推荐的高质量 AI Agent 工具
面向代码绘画、generative art、流场和粒子系统创作场景,用 p5.js 结合 seeded randomness 与参数探索生成原创作品,并输出创作哲学、HTML 预览和 JS 代码。
把文档、幻灯片等内容快速套用 Anthropic 官方品牌配色与字体规范,统一标题、正文和图形视觉风格,适合做品牌化排版、视觉润色和公司设计标准校准。
先生成视觉哲学,再落地成原创海报、艺术画面或其他静态设计,输出 .png/.pdf,强调构图、色彩与空间表达,适合需要高完成度视觉成品的场景。
面向接入 Claude API、Anthropic SDK 或 Agent SDK 的开发场景,自动识别项目语言并给出对应示例与默认配置,快速搭建 LLM 应用。
围绕文档、提案、技术规格、决策记录等写作任务,按上下文收集、结构迭代、读者测试三步协作共创,减少信息遗漏,写出更清晰、经得起他人阅读的内容。
覆盖Word/.docx文档的创建、读取、编辑与重排,适合生成报告、备忘录、信函和模板,也能处理目录、页眉页脚、页码、图片替换、查找替换、修订批注及内容提取整理。
面向组件、页面、海报和 Web 应用开发,按鲜明视觉方向生成可直接落地的前端代码与高质感 UI,适合做 landing page、Dashboard 或美化现有界面,避开千篇一律的 AI 审美。
按公司常用模板和语气快速起草内部沟通内容,覆盖 3P 更新、状态报告、领导汇报、项目进展、事故复盘、FAQ 与 newsletter,适合需要统一格式的团队沟通场景。
聚焦高质量 MCP Server 开发,覆盖协议研究、工具设计、错误处理与传输选型,适合用 FastMCP 或 MCP SDK 对接外部 API、封装服务能力。
遇到 PDF 读写、文本表格提取、合并拆分、旋转加水印、表单填写或加解密时直接用它,也能提取图片、生成新 PDF,并把扫描件通过 OCR 变成可搜索文档。
Puppeteer 是让 Claude 自动操作浏览器进行网页抓取和测试的 MCP 服务器。
Filesystem 是 MCP 官方参考服务器,让 LLM 安全读写本地文件系统。
Brave Search 是让 Claude 直接调用 Brave 搜索 API 获取实时网络信息的 MCP 服务器。
Fetch 是 MCP 官方参考服务器,让 AI 能抓取网页并转为 Markdown 格式。
Slack 是让 AI 助手直接读写你的 Slack 频道和消息的 MCP 服务器。
Sequential Thinking 是让 AI 通过动态思维链解决复杂问题的参考服务器。
GitHub 是 MCP 官方参考服务器,让 Claude 直接读写你的代码仓库和 Issues。
SQLite 是让 AI 直接查询本地数据库进行数据分析的 MCP 服务器。
PostgreSQL 是让 Claude 直接查询和管理你的数据库的 MCP 服务器。
Memory 是一个基于本地知识图谱的持久化记忆系统,让 AI 记住长期上下文。
最新资讯
AI Agent 生态的前沿动态 · 4月15日 更新
本文提出OmniShow框架,通过统一通道条件注入和门控局部注意力机制,实现了文本、图像、音频和姿态多模态条件下的人机交互视频生成。该框架采用解耦-联合训练策略有效利用异构数据,并在自建基准测试中达到最优性能,为自动化内容创作提供了工业级解决方案。
本文提出QuanBench+基准,统一评估Qiskit、PennyLane和Cirq三大框架下的量子代码生成能力,包含42个对齐任务。实验显示,单次生成最佳准确率在Qiskit达59.5%,经反馈修复后可提升至83.3%。该研究揭示了多框架量子编程仍高度依赖框架特定知识,为可靠量子代码生成提供了首个跨平台评估标准。
本文提出MEDS框架,通过存储历史行为信号并利用密度聚类识别频繁错误模式,对重复错误进行动态惩罚。在五个数据集和三个基础模型上,MEDS平均性能提升最高达4.37个点,同时显著增加了采样行为多样性。该方法解决了强化学习中采样多样性下降和重复错误模式的问题,为大规模语言模型训练提供了新思路。