用 Claude Code 做长期科学计算项目
教程Anthropic2026年3月18日6 分钟阅读

Anthropic 展示了如何用 Claude Code 执行需要数天甚至数周的科学计算任务,比如重写数值求解器或移植 Fortran 代码到 Rust。通过进度文件、测试基准和 Git 协调,单个智能体就能完成耦合度高的复杂项目。
本文编译自 Long-Running Claude for Scientific Research,版权归原作者所有。
觉得有用?分享给更多人

觉得有用?分享给更多人
作者基于 LLM 库构建了一个简单的编码 Agent,实现了文件编辑、命令执行、文件搜索等工具,并通过 CLI 和 Python API 提供交互。实验展示了 Agent 自动生成代码的能力。
使用 DSPy 框架评估和优化 Datasette Agent 的 SQL 回答系统提示词。方法包括构建测试框架、生成自动评估数据集、运行优化循环,并发现了多个改进方向。