LLM 架构图鉴:从 GPT-2 到最新 MoE
指南2026年3月16日8 分钟阅读

这个页面汇集了《大语言模型架构对比》等多篇文章中的架构图和关键参数表,聚焦于解码器堆栈的演变。你可以点击图片放大,或通过模型名称跳转到原文对应章节。
本文编译自 LLM Architecture Gallery,版权归原作者所有。
觉得有用?分享给更多人

觉得有用?分享给更多人
Datasette Agent 是一个可扩展的 AI 助手,提供对话式数据查询接口。支持通过插件生成图表、图片和代码执行。可运行本地模型,并已为 Datasette Cloud 用户准备。
datasette-agent-sprites 0.1a0 是 Simon Willison 发布的一个 beats,为 Datasette Agent 增加了与 Fly Sprites 交互的工具。