AI 领域每日动态精选


AIGC早知道封面图

jiaojianli.com · AIGC早知道

AI 领域每日动态精选

2026年5月25日 · 周一 · 第 21 期

本期聚焦 AI Coding具身智能 两大方向,从本周 Google I/O 2026 的重磅发布,到 xAI、阿里、Figure AI 等机构的最新进展,筛选出今日全球最有价值的 10 条 AI 动态。每条均附事件摘要、值得关注的原因及原始链接,助您快速掌握行业前沿。

AI CODING

Cursor 发布 Composer 2.5 自研编程模型,正式对标 Claude Opus 4.7
Cursor 于 5 月 18 日正式推出首款自研前沿级编程模型 Composer 2.5,在 SWE-Bench Multilingual 基准测试中取得 79.8% 的分数,与 Claude Opus 4.7 和 GPT-5.5 性能持平。标准版定价为输入 $0.5 / 百万 Token、输出 $2.5 / 百万 Token,已向所有 Cursor 用户开放。这是 Cursor 从”AI 辅助编辑器”真正迈向”自研模型驱动的 AI 编程平台”的关键一步。
💡 为什么值得关注

此前 Cursor 主要依赖外部模型(Claude/GPT),此次发布自研模型意味着 AI 编程工具厂商开始向上游模型层延伸,竞争格局将从”模型能力比拼”转向”模型+产品体验”的端到端闭环。对开发者而言,更多自研模型意味着更丰富的选择和更透明的定价。

查看官方公告 →

AI CODING

xAI 发布 Grok Build CLI,马斯克亲自下场 AI 编程智能体赛道
xAI 于 5 月 14 日正式推出 AI 编程智能体 CLI 工具 Grok Build(Beta 版),直接对标 Claude Code 和 OpenAI Codex CLI。该工具搭载 Grok 4.3 Beta 模型,支持 256K Token 上下文窗口、最多 8 个并行子智能体、Plan Mode 计划模式,以及原生 MCP/ACP 协议支持。在 SWE-Bench Verified 基准测试中得分 70.8%。目前仅限 SuperGrok Heavy 订阅用户($299/月)使用。
💡 为什么值得关注

xAI 以 CLI 工具为切口进入开发者市场,与马斯克旗下 X/Tesla/SpaceX 生态形成协同潜力巨大。Grok Build 的 ACP 协议支持(Anthropic 主导的 Agent 通信协议)表明 xAI 正在主动融入主流 AI Agent 生态,而非另起炉灶。

查看 xAI 官方公告 →

AI CODING

Google I/O 2026 发布 Antigravity 2.0,剑指 AI Agent 编程平台
在 5 月 19-20 日的 Google I/O 2026 大会上,Google 发布了面向 AI Agent 时代的编程平台 Antigravity 2.0,定位直接对标 Claude Code 和 OpenAI Codex。该平台通过代理系统可从零构建一个操作系统,全程 Token 成本不到 $1000。同时,Google 发布了 Gemini 3.5 Flash 模型,输出速度约为其他前沿模型的 4 倍,成为 AI Agent 和编码工具的理想底座。
💡 为什么值得关注

Google 以”毫不掩饰地以智能体为先”的理念重新设计开发者工具链,Gemini 3.5 Flash 的极速推理能力将显著降低 AI 编程工具的响应延迟,对 Copilot、Cursor、Claude Code 等现有产品形成直接竞争压力。

查看 Google I/O 全部公告 →

AI CODING

Andrej Karpathy 宣布加入 Anthropic,参与 Claude 预训练
5 月 19 日,OpenAI 联合创始人、前 Tesla AI 负责人 Andrej Karpathy 在 X 上宣布正式加入 Anthropic,参与 Claude 模型的预训练研究。Karpathy 是”Vibe Coding”一词的创造者,也是当前 AI 编程运动最具影响力的人物之一。此举被视为 AI 安全研究力量的一次重大重组,可能加速 Claude 在编程场景的能力提升。
💡 为什么值得关注

Karpathy 的加入意味着 Anthropic 在”AI 编程”这一核心赛道的投入将进一步加大。Claude Code 目前已经是最受开发者欢迎的 AI 编程工具之一,顶级人才的注入将扩大其在 AI 辅助编程领域的领先优势。

查看 TechCrunch 报道 →

大模型

阿里发布 Qwen 3.7-Max 旗舰模型,国产第一、全球第十三
阿里巴巴于 5 月 20 日在 2026 阿里云峰会上正式发布全新一代千问旗舰大模型 Qwen 3.7-Max。该模型在 Arena 全球大模型盲测总榜中排名国产第一、全球第十三,在编程智能体测评 Terminal Bench 2.0 中得分 69.7%,超过 DeepSeek-v4-pro 和 Claude-Opus 4.6。最引人注目的是其自主任务能力:在全新硬件平台(平头哥真武 M890 芯片)上,从零出发自主完成推理内核优化,35 小时内执行 432 次评估,最终取得 10 倍加速。
💡 为什么值得关注

Qwen 3.7-Max 展示了国产大模型在”长周期自主任务”方向上的突破性进展,从”对话助手”真正迈向”自主工作者”。其在无文档、无示例情况下完成硬件优化的能力,是 AI Agent 走向实际生产环境的重要标志。

查看快科技报道 →

具身智能

Figure AI 120 小时分拣直播:人机对决,效率差距仅 0.04 秒
估值 390 亿美元的具身智能公司 Figure AI 在圣何塞总部发起持续超 120 小时的全网直播,验证人形机器人 24 小时轮班作业能力。直播中途安排了 10 小时人机分拣对决:人类实习生以平均单件 2.79 秒、共 12924 件的总成绩略胜机器人(平均 2.83 秒,共 12732 件)。截至报道时,机器人已稳定运行超 6 天,通过三台机器人轮流充电实现无缝接力。
💡 为什么值得关注

此次直播是具身智能从”演示视频”走向”工业级压力测试”的标志性事件。人机效率差距缩小至 0.04 秒,说明人形机器人在结构化场景已接近人类水平。Figure AI 借此验证商业化部署可行性,为物流、仓储等场景的规模落地提供了实证依据。

查看站长之家报道 →

具身智能

AGIBOT 发布新一代具身智能机器人及模型,宣布 2026 为”部署元年”
国产具身智能领军企业 AGIBOT(智元机器人)在 APC 2026 合作伙伴大会上宣布 2026 年为”具身智能部署元年”,并发布了基于”One Robotic Body, Three Intelligences”全栈架构的新一代机器人平台和多个 AI 模型。AGIBOT 提出了清晰的 XYZ 曲线发展框架,其中 X 曲线(2022-2026)聚焦技术验证,Y 曲线(2026-2028)聚焦规模部署。这是目前国内具身智能企业中最完整的商业化路线图之一。
💡 为什么值得关注

AGIBOT 作为全球出货量第一的具身智能机器人厂商(39% 份额),其”部署元年”宣言标志着整个行业从技术验证期进入商业化落地期。对于关注具身智能赛道的教育研究者而言,这意味着相关教学案例将从”概念介绍”升级为”真实产业实践”。

查看 PR Newswire 公告 →

具身智能

香港中文大学成立全港首个具身智能实验室,覆盖全端核心技术
香港中文大学于 5 月 18 日宣布成立”香港具身智能实验室“,这是全港第一个覆盖控制算法、操作算法、关节模组、机器人硬件等全端具身智能核心技术研发的实验室。实验室将聚焦于具身智能的基础研究、产业转化和人才培养,引发香港社会广泛关注。此举标志着具身智能正式进入香港高等教育体系。
💡 为什么值得关注

高校系统性布局具身智能全端技术(从算法到硬件),意味着该方向已从”产业热点”升级为”学科建设方向”。对教育技术学研究者而言,具身智能在教育场景的应用(如机器人导师、物理 AI 助教)将成为值得深入探索的新兴方向。

查看新浪报道 →

具身 AI

SAE 发布 2026 具身 AI 白皮书 + 华为发布开源 ROS-LLM 框架
近期两大信号标志着具身 AI 正在走向标准化和工程化:① SAE International 发布 2026 具身 AI 白皮书(arXiv:2605.10653),将具身 AI 定义为需要生命周期治理的系统工程挑战,提出了标准化框架;② 华为在 Nature Machine Intelligence 发布开源 ROS-LLM 框架,支持自然语言指令自动分解为机器人原子动作、行为树执行及模仿学习,大幅降低具身 AI 应用开发门槛。
💡 为什么值得关注

标准组织和顶级学术机构的同时发力,说明具身 AI 已从”各搞各的”进入”协同共建”阶段。ROS-LLM 框架的开源尤其值得关注,它为教育机器人、AI 实验教学提供了可复用的技术基础设施。

查看 SAE 白皮书(arXiv)→

产业动态

DeepSeek V4-Pro 永久降价 75%,国产大模型价格战再升级
DeepSeek 于 5 月 22 日正式将 V4-Pro 模型的促销折扣转为永久定价:未缓存输入 $0.435 / 百万 Token,输出 $0.87 / 百万 Token,较原价格下降约 75%。新定价下,V4-Pro 输入成本比 Claude Opus 4.7 低约 8 倍,输出成本低约 10 倍,同时仍保持顶级开源编程模型性能。此举距 4 月开始的促销活动仅一个月,显示国产大模型价格竞争仍在加剧。
💡 为什么值得关注

DeepSeek 的永久降价将倒逼其他厂商跟进,进一步降低 AI 编程工具、教育 AI 应用、智能体平台的运营成本。对教育机构而言,这意味着部署自有 AI 教学助手的经济门槛正在快速下降,”AI 平民化”进程加速。

查看 DeepSeek 定价文档 →