资讯

AI Agent Skills 生态的最新动态、教程和深度分析

共 966 篇文章

Together Chat 上线：免费调用北美部署的 DeepSeek R1

Together Chat 应用正式发布，集成了 DeepSeek R1、Llama 3.3 70B、Qwen 2.5 72B、Qwen Coder 32B 和 Flux Schnell 等主流开源模型。该应用支持联网搜索、图像生成和代码编写，并可作为渐进式网页应用在手机上使用。

指南·3月24日·3 分钟

Gemini Robotics 让 AI 进入物理世界

Gemini Robotics 是基于 Gemini 2.0 的视觉-语言-动作模型，可直接控制机器人，在通用性、交互性和灵巧性上表现突出。Gemini Robotics-ER 则增强了空间理解能力，可生成代码控制机器人，成功率比 Gemini 2.0 高 2-3 倍。Google 正与合作伙伴推进机器人安全研究和实际应用。

指南·3月12日·4 分钟

Gemini 2.0 Flash 原生图像生成开放测试

Gemini 2.0 Flash 的原生图像生成功能已通过 Google AI Studio 和 Gemini API 开放给开发者测试。该功能支持图文混合创作、多轮对话编辑、基于知识的图像生成以及更准确的文本渲染。开发者现在可以使用实验模型 gemini-2.0-flash-exp 进行体验。

指南·3月12日·2 分钟

Gemma 3 发布：轻量、多语言、支持函数调用

Gemma 3 是 Google DeepMind 推出的新一代轻量级开源模型，在单 GPU/TPU 上表现优异，支持多语言、视觉推理和函数调用。同时发布的 ShieldGemma 2 是一个基于 Gemma 3 的图像安全检查器。模型已集成到 Hugging Face、Ollama 等主流工具链中。

指南·3月12日·5 分钟

Gemini 2.0 Flash-Lite 正式发布，性能提升价格更优

Gemini 2.0 Flash-Lite 正式上线，性能超越前代，定价更简化。文章展示了 Daily、Dawn 和 Mosaic 三家公司在语音 AI、数据分析和视频编辑领域如何利用该模型提升效率、降低成本。

指南·2月25日·3 分钟

Gemini 2.0 全家桶全面开放

Gemini 2.0 Flash 现已通过 API 全面开放，适用于生产级应用。同时，谷歌推出了实验版 Gemini 2.0 Pro，专为代码性能和复杂提示优化，以及预览版 Gemini 2.0 Flash-Lite，在保持低成本高速度的同时提升了质量。所有模型均支持多模态输入。

指南·2月5日·3 分钟

FACTS Grounding：大语言模型事实性评估新基准

FACTS Grounding 是一个评估大语言模型事实对齐能力的综合基准，包含 1,719 个需要长文档响应的示例，覆盖金融、科技、医疗等多个领域。评估采用 Gemini 1.5 Pro、GPT-4o 和 Claude 3.5 Sonnet 作为自动法官模型，通过两阶段评分确保响应既满足用户请求又完全基于文档。基准和排行榜将随领域进展持续更新。

深度·12月17日·4 分钟

Together AI 收购 CodeSandbox，推出首个内置代码解释器

Together AI 通过收购 CodeSandbox，在推理平台中集成了代码解释器，允许 LLM 执行生成的代码。CodeSandbox SDK 也已开放测试，开发者可将其用于自己的应用。此举旨在提升 LLM 解决复杂编程问题的能力。

指南·12月12日·4 分钟

Gemini 2.0 发布：为智能体时代打造的新模型

Gemini 2.0 是 Google 为智能体时代推出的新一代 AI 模型，性能超越前代，支持原生多模态输出和工具调用。Gemini 2.0 Flash 实验版现已向开发者提供，并将在明年年初广泛推出。Google 还展示了基于 Gemini 2.0 的智能体研究原型，如 Project Astra 和 Project Mariner。

指南·12月11日·5 分钟

Google DeepMind 在 NeurIPS 2024 展示 AI 研究

Google DeepMind 概述了其在 NeurIPS 2024 上的研究重点，包括构建更智能、安全的 AI 智能体，革新 3D 内容创建流程，以及改进大语言模型的训练和响应方式。

深度·12月5日·4 分钟

Genie 2：能生成无限3D世界的世界模型

Genie 2 是一个大型基础世界模型，能够根据单张图像生成无限多样、可交互的 3D 环境，用于训练和评估具身智能体。它展示了物体交互、角色动画、物理模拟等涌现能力，并能与 SIMA 等智能体协同工作，加速 AI 研究。

深度·12月4日·5 分钟

Anthology：用人生故事为大模型注入虚拟人格

Anthology 通过为 LLM 提供详细的人生故事作为上下文，使其能更逼真地模拟个体人类样本，而非仅停留在群体层面。该方法在模拟皮尤调查时，在分布相似性、相关性矩阵一致性等指标上表现更优。研究为社会科学中的用户研究、民意调查等提供了新的可能性，但也需警惕潜在的偏见与隐私风险。

深度·11月12日·4 分钟