Dan Woods 用 Apple 论文在 MacBook 上跑 Qwen 397B
深度Simon Willison2026年3月18日2 分钟阅读
Dan Woods 利用 Apple 的「LLM in a Flash」研究,在 48GB 内存的 MacBook Pro M3 Max 上,让 Qwen3.5-397B-A17B 模型以每秒 5.5+ token 的速度运行。他通过 Claude Code 自动执行了 90 次实验,生成了优化的 MLX 和 Metal 代码。
觉得有用?分享给更多人