Simon Willison 教记者用 Claude Code 做数据分析

这是为 NICAR 2026 研讨会“Coding agents for data analysis”准备的讲义。这个三小时的课程面向数据记者,演示了如何用 Claude Code 和 OpenAI Codex 这类工具来探索、分析和清洗数据。
讲义目录如下:
工作坊用了 GitHub Codespaces 和 OpenAI Codex,因为这样容易(且便宜)分发预算受限的 API 密钥给学员。参与者最终消耗了 23 美元的 Codex token。
所有练习都用 Python 和 SQLite,部分用了 Datasette。
工作坊的一个亮点是,我们启动 Datasette 让它从 viz/ 文件夹提供静态内容,然后让 Claude Code 直接在那个文件夹里开始 vibe coding 新的交互式可视化。这是它为我的树木数据库用 Leaflet 和 Leaflet.heat 创建的热力图,源码在这里。

我设计这份讲义也是为了给没能现场参会的人用。通常来说,面向数据记者的材料同样适用于任何有数据要探索的人。
觉得有用?分享给更多人