OpenMythos:从零复现Claude架构的理论工程
深度2026年5月4日12 分钟阅读
一位独立开发者根据公开研究推测,Claude Mythos 可能是一种“循环深度 Transformer”(RDT),并以此为基础构建了开源实现 OpenMythos。该项目在 PyTorch 中实现了三阶段循环架构,包含可切换的多头潜在注意力(MLA)与分组查询注意力(GQA),以及稀疏 MoE 前馈网络,适合探索计算自适应、深度可变的推理模式。
本文编译自 OpenMythos: A theoretical reconstruction of the Claude Mythos architecture, built from first principles using the available research literature,版权归原作者所有。
觉得有用?分享给更多人