Simon Willison 教记者用 Claude Code 做数据分析

教程Simon Willison2026年3月16日3 分钟阅读
Simon Willison 教记者用 Claude Code 做数据分析
三小时工作坊,23 美元 token 费,数据记者用 Claude Code 完成了数据清洗、分析和可视化全流程。讲义内容公开,适合所有需要探索数据的人。

这是为 NICAR 2026 研讨会“Coding agents for data analysis”准备的讲义。这个三小时的课程面向数据记者,演示了如何用 Claude Code 和 OpenAI Codex 这类工具来探索、分析和清洗数据。

讲义目录如下:

工作坊用了 GitHub Codespaces 和 OpenAI Codex,因为这样容易(且便宜)分发预算受限的 API 密钥给学员。参与者最终消耗了 23 美元的 Codex token。

所有练习都用 Python 和 SQLite,部分用了 Datasette。

工作坊的一个亮点是,我们启动 Datasette 让它从 viz/ 文件夹提供静态内容,然后让 Claude Code 直接在那个文件夹里开始 vibe coding 新的交互式可视化。这是它为我的树木数据库用 Leaflet 和 Leaflet.heat 创建的热力图,源码在这里

Screenshot of a "Trees SQL Map" web application with the heading "Trees SQL Map" and subheading "Run a query and render all returned points as a heat map. The default query targets roughly 200,000 trees." Below is an input field containing "/trees/-/query.json", a "Run Query" button, and a SQL query editor with the text "SELECT cast(Latitude AS float) AS latitude, cast(Longitude AS float) AS longitude, CASE WHEN DBH IS NULL OR DBH = '' THEN 0.3 WHEN cast(DBH AS float) <= 0 THEN 0.3 WHEN cast(DBH AS float) >= 80 THEN 1.0" (query is truncated). A status message reads "Loaded 1,000 rows and plotted 1,000 points as heat map." Below is a Leaflet/OpenStreetMap interactive map of San Francisco showing a heat map overlay of tree locations, with blue/green clusters concentrated in areas like the Richmond District, Sunset District, and other neighborhoods. Map includes zoom controls and a "Leaflet | © OpenStreetMap contributors" attribution.

我设计这份讲义也是为了给没能现场参会的人用。通常来说,面向数据记者的材料同样适用于任何有数据要探索的人。

本文编译自 Coding agents for data analysis,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

本文分享了如何将 GitHub Copilot SDK 集成到 React Native 应用中,构建一个名为 IssueCrush 的 Issue 智能分类工具。核心方案是服务端集成模式,解决了 SDK 依赖 Node.js 环境的问题,并详细介绍了生命周期管理、提示工程、响应处理和优雅降级等关键实现模式。

教程GitHub·3月24日·8 分钟

Starlette 1.0 发布,最大的变化是引入了基于异步上下文管理器的 lifespan 机制。作者利用 Claude 的 Skill 功能,让 AI 克隆代码库并学习新版本特性,然后成功生成了一个包含项目、任务、评论和标签的完整任务管理应用。

教程Simon Willison·3月22日·5 分钟

评论