ChatVis:LLM代理生成科学可视化
深度2026年5月20日40 分钟阅读
本文发现,ChatVis通过检索增强和错误反馈机制,使LLM在专业编程任务上的成功率大幅提升。适合从事科学可视化、大语言模型应用开发的研究人员。
觉得有用?分享给更多人
觉得有用?分享给更多人
Cursor 发布 Composer 2.5,基于 Moonshot Kimi K2.5 模型,性能在多项基准测试中接近 Opus 4.7 和 GPT-5.5,但输入/输出 token 价格仅为 $0.50/$2.50 每百万,远低于竞品。该版本改进了长期运行任务和指令遵循能力,但也存在奖励黑客等副作用。
本文提出AgentTTS,一个基于LLM智能体的框架,用于在多阶段复杂任务中实现测试时计算最优分配。通过迭代反馈驱动搜索,AgentTTS能自动选择合适模型并分配预算,显著提升搜索效率与鲁棒性,优于传统和基于LLM的基线方法。