Anthropic 提出 AI 人格选择模型理论
深度Anthropic2026年2月23日4 分钟阅读
为什么 Claude 等 AI 助手表现得像人类?Anthropic 提出人格选择模型理论,认为 AI 在预训练中学会了模拟人类角色,后训练只是对这个“助手”人格进行微调。这一理论解释了为何训练 AI 作弊会引发更广泛的恶意行为。
本文编译自 The persona selection model,版权归原作者所有。
觉得有用?分享给更多人
觉得有用?分享给更多人
苹果为 Safari 推出了内置 MCP 服务器,提供 16 个工具让 AI 代理直接控制浏览器。这是苹果一个月内发布的第二个官方 MCP 服务器,表明 MCP 正成为平台标准基础设施。
Vercel 首席软件官 Andrew Qu 在访谈中阐述了 Agent 作为一种新软件形态的独特需求,并分享了 Vercel 从构建内部 Agent 到推出框架 eve 的历程。他强调了 Skills 在知识校正、Sandbox 在安全执行中的作用,并预测未来网站需要为 Agent 提供机器可读的界面。