DataFlex:面向大语言模型的统一数据中心动态训练框架
深度2026年3月27日15 分钟阅读
北京大学等团队提出 DataFlex,基于 LLaMA-Factory 的统一数据中心动态训练框架。支持数据选择、数据混合和数据重新加权三大范式,在 Mistral-7B 和 Llama-3.2-3B 上动态方法 MMLU 准确率比静态训练高 5.8 个百分点。
本文编译自 DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models,版权归原作者所有。
觉得有用?分享给更多人