资讯
AI Agent Skills 生态的最新动态、教程和深度分析
共 966 篇文章
AI Agent Skills 生态的最新动态、教程和深度分析
共 966 篇文章
Together Chat 应用正式发布,集成了 DeepSeek R1、Llama 3.3 70B、Qwen 2.5 72B、Qwen Coder 32B 和 Flux Schnell 等主流开源模型。该应用支持联网搜索、图像生成和代码编写,并可作为渐进式网页应用在手机上使用。
Gemini Robotics 是基于 Gemini 2.0 的视觉-语言-动作模型,可直接控制机器人,在通用性、交互性和灵巧性上表现突出。Gemini Robotics-ER 则增强了空间理解能力,可生成代码控制机器人,成功率比 Gemini 2.0 高 2-3 倍。Google 正与合作伙伴推进机器人安全研究和实际应用。
Gemini 2.0 Flash 的原生图像生成功能已通过 Google AI Studio 和 Gemini API 开放给开发者测试。该功能支持图文混合创作、多轮对话编辑、基于知识的图像生成以及更准确的文本渲染。开发者现在可以使用实验模型 gemini-2.0-flash-exp 进行体验。
Gemma 3 是 Google DeepMind 推出的新一代轻量级开源模型,在单 GPU/TPU 上表现优异,支持多语言、视觉推理和函数调用。同时发布的 ShieldGemma 2 是一个基于 Gemma 3 的图像安全检查器。模型已集成到 Hugging Face、Ollama 等主流工具链中。
Gemini 2.0 Flash-Lite 正式上线,性能超越前代,定价更简化。文章展示了 Daily、Dawn 和 Mosaic 三家公司在语音 AI、数据分析和视频编辑领域如何利用该模型提升效率、降低成本。
Gemini 2.0 Flash 现已通过 API 全面开放,适用于生产级应用。同时,谷歌推出了实验版 Gemini 2.0 Pro,专为代码性能和复杂提示优化,以及预览版 Gemini 2.0 Flash-Lite,在保持低成本高速度的同时提升了质量。所有模型均支持多模态输入。
FACTS Grounding 是一个评估大语言模型事实对齐能力的综合基准,包含 1,719 个需要长文档响应的示例,覆盖金融、科技、医疗等多个领域。评估采用 Gemini 1.5 Pro、GPT-4o 和 Claude 3.5 Sonnet 作为自动法官模型,通过两阶段评分确保响应既满足用户请求又完全基于文档。基准和排行榜将随领域进展持续更新。
Together AI 通过收购 CodeSandbox,在推理平台中集成了代码解释器,允许 LLM 执行生成的代码。CodeSandbox SDK 也已开放测试,开发者可将其用于自己的应用。此举旨在提升 LLM 解决复杂编程问题的能力。
Gemini 2.0 是 Google 为智能体时代推出的新一代 AI 模型,性能超越前代,支持原生多模态输出和工具调用。Gemini 2.0 Flash 实验版现已向开发者提供,并将在明年年初广泛推出。Google 还展示了基于 Gemini 2.0 的智能体研究原型,如 Project Astra 和 Project Mariner。
Google DeepMind 概述了其在 NeurIPS 2024 上的研究重点,包括构建更智能、安全的 AI 智能体,革新 3D 内容创建流程,以及改进大语言模型的训练和响应方式。
Genie 2 是一个大型基础世界模型,能够根据单张图像生成无限多样、可交互的 3D 环境,用于训练和评估具身智能体。它展示了物体交互、角色动画、物理模拟等涌现能力,并能与 SIMA 等智能体协同工作,加速 AI 研究。
Anthology 通过为 LLM 提供详细的人生故事作为上下文,使其能更逼真地模拟个体人类样本,而非仅停留在群体层面。该方法在模拟皮尤调查时,在分布相似性、相关性矩阵一致性等指标上表现更优。研究为社会科学中的用户研究、民意调查等提供了新的可能性,但也需警惕潜在的偏见与隐私风险。