jiaojianli.com · AIGC早知道

AI 领域每日动态精选

2026年5月25日 · 周一 · 第 21 期

本期聚焦 AI Coding 与 具身智能 两大方向，从本周 Google I/O 2026 的重磅发布，到 xAI、阿里、Figure AI 等机构的最新进展，筛选出今日全球最有价值的 10 条 AI 动态。每条均附事件摘要、值得关注的原因及原始链接，助您快速掌握行业前沿。

AI 编程工具

AI CODING

Cursor 发布 Composer 2.5 自研编程模型，正式对标 Claude Opus 4.7

Cursor 于 5 月 18 日正式推出首款自研前沿级编程模型 Composer 2.5，在 SWE-Bench Multilingual 基准测试中取得 79.8% 的分数，与 Claude Opus 4.7 和 GPT-5.5 性能持平。标准版定价为输入 $0.5 / 百万 Token、输出 $2.5 / 百万 Token，已向所有 Cursor 用户开放。这是 Cursor 从”AI 辅助编辑器”真正迈向”自研模型驱动的 AI 编程平台”的关键一步。

💡 为什么值得关注

此前 Cursor 主要依赖外部模型（Claude/GPT），此次发布自研模型意味着 AI 编程工具厂商开始向上游模型层延伸，竞争格局将从”模型能力比拼”转向”模型+产品体验”的端到端闭环。对开发者而言，更多自研模型意味着更丰富的选择和更透明的定价。

查看官方公告 →

AI CODING

xAI 发布 Grok Build CLI，马斯克亲自下场 AI 编程智能体赛道

xAI 于 5 月 14 日正式推出 AI 编程智能体 CLI 工具 Grok Build（Beta 版），直接对标 Claude Code 和 OpenAI Codex CLI。该工具搭载 Grok 4.3 Beta 模型，支持 256K Token 上下文窗口、最多 8 个并行子智能体、Plan Mode 计划模式，以及原生 MCP/ACP 协议支持。在 SWE-Bench Verified 基准测试中得分 70.8%。目前仅限 SuperGrok Heavy 订阅用户（$299/月）使用。

💡 为什么值得关注

xAI 以 CLI 工具为切口进入开发者市场，与马斯克旗下 X/Tesla/SpaceX 生态形成协同潜力巨大。Grok Build 的 ACP 协议支持（Anthropic 主导的 Agent 通信协议）表明 xAI 正在主动融入主流 AI Agent 生态，而非另起炉灶。

查看 xAI 官方公告 →

AI CODING

Google I/O 2026 发布 Antigravity 2.0，剑指 AI Agent 编程平台

在 5 月 19-20 日的 Google I/O 2026 大会上，Google 发布了面向 AI Agent 时代的编程平台 Antigravity 2.0，定位直接对标 Claude Code 和 OpenAI Codex。该平台通过代理系统可从零构建一个操作系统，全程 Token 成本不到 $1000。同时，Google 发布了 Gemini 3.5 Flash 模型，输出速度约为其他前沿模型的 4 倍，成为 AI Agent 和编码工具的理想底座。

💡 为什么值得关注

Google 以”毫不掩饰地以智能体为先”的理念重新设计开发者工具链，Gemini 3.5 Flash 的极速推理能力将显著降低 AI 编程工具的响应延迟，对 Copilot、Cursor、Claude Code 等现有产品形成直接竞争压力。

查看 Google I/O 全部公告 →

AI CODING

Andrej Karpathy 宣布加入 Anthropic，参与 Claude 预训练

5 月 19 日，OpenAI 联合创始人、前 Tesla AI 负责人 Andrej Karpathy 在 X 上宣布正式加入 Anthropic，参与 Claude 模型的预训练研究。Karpathy 是”Vibe Coding”一词的创造者，也是当前 AI 编程运动最具影响力的人物之一。此举被视为 AI 安全研究力量的一次重大重组，可能加速 Claude 在编程场景的能力提升。

💡 为什么值得关注

Karpathy 的加入意味着 Anthropic 在”AI 编程”这一核心赛道的投入将进一步加大。Claude Code 目前已经是最受开发者欢迎的 AI 编程工具之一，顶级人才的注入将扩大其在 AI 辅助编程领域的领先优势。

查看 TechCrunch 报道 →

大模型

阿里发布 Qwen 3.7-Max 旗舰模型，国产第一、全球第十三

阿里巴巴于 5 月 20 日在 2026 阿里云峰会上正式发布全新一代千问旗舰大模型 Qwen 3.7-Max。该模型在 Arena 全球大模型盲测总榜中排名国产第一、全球第十三，在编程智能体测评 Terminal Bench 2.0 中得分 69.7%，超过 DeepSeek-v4-pro 和 Claude-Opus 4.6。最引人注目的是其自主任务能力：在全新硬件平台（平头哥真武 M890 芯片）上，从零出发自主完成推理内核优化，35 小时内执行 432 次评估，最终取得 10 倍加速。

💡 为什么值得关注

Qwen 3.7-Max 展示了国产大模型在”长周期自主任务”方向上的突破性进展，从”对话助手”真正迈向”自主工作者”。其在无文档、无示例情况下完成硬件优化的能力，是 AI Agent 走向实际生产环境的重要标志。

查看快科技报道 →

具身智能 · 人形机器人

具身智能

Figure AI 120 小时分拣直播：人机对决，效率差距仅 0.04 秒

估值 390 亿美元的具身智能公司 Figure AI 在圣何塞总部发起持续超 120 小时的全网直播，验证人形机器人 24 小时轮班作业能力。直播中途安排了 10 小时人机分拣对决：人类实习生以平均单件 2.79 秒、共 12924 件的总成绩略胜机器人（平均 2.83 秒，共 12732 件）。截至报道时，机器人已稳定运行超 6 天，通过三台机器人轮流充电实现无缝接力。

💡 为什么值得关注

此次直播是具身智能从”演示视频”走向”工业级压力测试”的标志性事件。人机效率差距缩小至 0.04 秒，说明人形机器人在结构化场景已接近人类水平。Figure AI 借此验证商业化部署可行性，为物流、仓储等场景的规模落地提供了实证依据。

查看站长之家报道 →

具身智能

AGIBOT 发布新一代具身智能机器人及模型，宣布 2026 为”部署元年”

国产具身智能领军企业 AGIBOT（智元机器人）在 APC 2026 合作伙伴大会上宣布 2026 年为”具身智能部署元年”，并发布了基于”One Robotic Body, Three Intelligences”全栈架构的新一代机器人平台和多个 AI 模型。AGIBOT 提出了清晰的 XYZ 曲线发展框架，其中 X 曲线（2022-2026）聚焦技术验证，Y 曲线（2026-2028）聚焦规模部署。这是目前国内具身智能企业中最完整的商业化路线图之一。

💡 为什么值得关注

AGIBOT 作为全球出货量第一的具身智能机器人厂商（39% 份额），其”部署元年”宣言标志着整个行业从技术验证期进入商业化落地期。对于关注具身智能赛道的教育研究者而言，这意味着相关教学案例将从”概念介绍”升级为”真实产业实践”。

查看 PR Newswire 公告 →

具身智能

香港中文大学成立全港首个具身智能实验室，覆盖全端核心技术

香港中文大学于 5 月 18 日宣布成立”香港具身智能实验室“，这是全港第一个覆盖控制算法、操作算法、关节模组、机器人硬件等全端具身智能核心技术研发的实验室。实验室将聚焦于具身智能的基础研究、产业转化和人才培养，引发香港社会广泛关注。此举标志着具身智能正式进入香港高等教育体系。

💡 为什么值得关注

高校系统性布局具身智能全端技术（从算法到硬件），意味着该方向已从”产业热点”升级为”学科建设方向”。对教育技术学研究者而言，具身智能在教育场景的应用（如机器人导师、物理 AI 助教）将成为值得深入探索的新兴方向。

查看新浪报道 →

具身 AI

SAE 发布 2026 具身 AI 白皮书 + 华为发布开源 ROS-LLM 框架

近期两大信号标志着具身 AI 正在走向标准化和工程化：① SAE International 发布 2026 具身 AI 白皮书（arXiv:2605.10653），将具身 AI 定义为需要生命周期治理的系统工程挑战，提出了标准化框架；② 华为在 Nature Machine Intelligence 发布开源 ROS-LLM 框架，支持自然语言指令自动分解为机器人原子动作、行为树执行及模仿学习，大幅降低具身 AI 应用开发门槛。

💡 为什么值得关注

标准组织和顶级学术机构的同时发力，说明具身 AI 已从”各搞各的”进入”协同共建”阶段。ROS-LLM 框架的开源尤其值得关注，它为教育机器人、AI 实验教学提供了可复用的技术基础设施。

查看 SAE 白皮书（arXiv）→

产业动态

DeepSeek V4-Pro 永久降价 75%，国产大模型价格战再升级

DeepSeek 于 5 月 22 日正式将 V4-Pro 模型的促销折扣转为永久定价：未缓存输入 $0.435 / 百万 Token，输出 $0.87 / 百万 Token，较原价格下降约 75%。新定价下，V4-Pro 输入成本比 Claude Opus 4.7 低约 8 倍，输出成本低约 10 倍，同时仍保持顶级开源编程模型性能。此举距 4 月开始的促销活动仅一个月，显示国产大模型价格竞争仍在加剧。

💡 为什么值得关注

DeepSeek 的永久降价将倒逼其他厂商跟进，进一步降低 AI 编程工具、教育 AI 应用、智能体平台的运营成本。对教育机构而言，这意味着部署自有 AI 教学助手的经济门槛正在快速下降，”AI 平民化”进程加速。

查看 DeepSeek 定价文档 →