AI 周报 Vol.11 | Anthropic 估值逼近万亿、Karpathy 跳槽、OpenAI 秘密冲刺 IPO,五月太疯狂了

过去两周没写周报,不是我偷懒,是五月的 AI 圈实在太密了。

Google I/O、Anthropic 天价融资、Karpathy 跳槽、OpenAI 秘密 IPO、Claude Opus 4.8、GPT-5.6 泄露……我甚至不知道该把哪条放第一条。

算了,按时间线来吧。

Google I/O 2026:Gemini 开始「动手」了

5 月 19 日的 Google I/O,信息量比往年都大。

核心发布是 Gemini 3.5 Flash——一个面向 Agent 场景优化的模型。Terminal-Bench 2.1 得分 76.2%,输出速度是 GPT-5.5 的 4 倍。Google 同时公布了几个吓人的数字:Gemini 每月处理 3.2 千万亿 Token,年增长 7 倍;Gemini App 月活 9 亿。

但我觉得真正值得关注的是两件事。

第一,Gemini Omni Flash——第一个能接受任意输入(图片/音频/视频/文字)并生成视频的全模态模型。不是”文生视频”,是你可以拿一段视频让它编辑,保持物理一致性和角色连续性。这个能力目前独一份。

第二,Gemini Spark——在隔离虚拟环境中运行的”个人 AI 管家”。不是聊天机器人,是能帮你订机票、填表单、处理邮件的 Agent。Google 还发布了 Antigravity 平台,让开发者搭建 Agent 应用。

说句实话,Google 的节奏终于不像以前那样”发布即巅峰,然后没下文”了。Gemini 3.5 Flash 发布当天就 GA,Pro 版下个月上线。

但 Google 也有翻车的地方。Gemini 把计费方式从”每日提问次数”改成”按算力计费”,用户炸了。九次调整配额才勉强稳住。这件事的教训很简单:用户不关心你的技术架构,他们只关心”我还能免费用多久”。

Anthropic:650 亿、9650 亿估值、Karpathy 加盟

5 月 28 日,Anthropic 宣布完成 650 亿美元 H 轮融资,投后估值 9650 亿美元——超越了 OpenAI 今年 3 月的 8520 亿估值,成为全球估值最高的 AI 创业公司。

650 亿美元是什么概念?差不多是阿里巴巴当前市值的一半。一家成立五年的公司,估值逼近万亿美金。

同一天,Anthropic 发布了 Claude Opus 4.8。如果你期待一个大版本跃迁,可能会失望——Opus 4.8 的核心提升不在”更聪明”,而在”更可靠”。它在 Agent 任务中的表现大幅领先 Opus 4.7:SWE-Bench Pro 从 64.3% 提升到 69.2%,OSWorld 达到 83.4%。最关键的改进是:它会在不确定时主动暂停、请求补充信息,而不是硬着头皮给一个可能有 Bug 的方案。

这个设计思路是对的。Agent 场景里,”知道自己不知道什么”比”什么都会”重要得多。

另一条重磅消息:Andrej Karpathy 正式加入 Anthropic

Karpathy 去年离开 OpenAI 后自己搞教育项目,业界都在猜他下一步去哪。5 月 19 日答案揭晓——他将带领 Anthropic 的预训练研究团队,而且有意思的是,他要用 Claude 本身来辅助研究。AI 训练 AI 的闭环,正在形成。

Anthropic 还以 3 亿美元收购了 SDK 生成工具 Stainless,随后关停了其所有托管服务——相当于断了 OpenAI、Google、Cloudflare 等公司的 SDK 工具链。这步棋挺狠的。

SpaceX 的 S-1 招股书也披露了一个数字:Anthropic 每月向 SpaceX 支付 12.5 亿美元的算力费用,合同签到 2029 年,总额约 450 亿美元,使用 22 万张 GPU。这个数字解释了为什么 Anthropic 需要融 650 亿。

OpenAI:IPO、GPT-5.6 泄露、数学突破

OpenAI 这边也没闲着。

5 月 22 日,多家媒体报道 OpenAI 已向 SEC 秘密提交 IPO 申请,高盛和摩根士丹利担任承销商,估值预计超过 1 万亿美元。但翻翻财务数据:Q1 营收 57 亿美元,运营利润率 -122%。Sora 因为算力成本与收入严重不匹配已经关停,原计划迪士尼 10 亿美元投资也黄了。

ChatGPT 周活用户 9.05 亿,比 2 月峰值 9.2 亿略有下滑。

在这样的背景下冲刺 IPO,只能说 OpenAI 真的很需要钱。

产品层面,OpenAI 发布了三款实时语音模型——GPT-Realtime-2(首款具备 GPT-5 级推理能力的语音模型)、GPT-Realtime-Translate(70+ 语言实时翻译)、GPT-Realtime-Whisper(流式语音转文字)。上下文窗口从 32K 扩展到 128K。

一个值得关注的消息:多名开发者在 Codex 后端日志中发现了一个未公开模型 GPT-5.6,内部代号 iris-alpha,支持 150 万 Token 上下文窗口。预测市场认为它在 6 月 30 日前发布的概率有 80%-89%。

还有一件事我觉得被低估了——OpenAI 的推理模型独立解决了 Erdős 单位距离猜想,一个悬而未决近 80 年的数学问题。剑桥数学家 Timothy Gowers 验证了证明的正确性。这不是”AI 帮数学家算了几步”,这是 AI 独立完成了原创数学发现。

国内战场:降价、开源、人才管制

国内这边的关键词是”卷”。

DeepSeek V4-Pro 在 5 月 22 日宣布 API 永久降价 75%,输入价格锁定在 $0.435/百万 Token——GPT-5.5 的 1/50。缓存命中成本再砍 90%。内部组建了 “Harness” 团队,要做对标 Claude Code 的代码 Agent 产品。V4-Pro 完全跑在华为昇腾芯片上。

阿里 Qwen3.7-Max 在 5 月 20 日发布,GPQA Diamond 92.4、HMMT 97.1,两项均为全球最高分。100 万 Token 上下文,定价 $2.50/百万 Token——不到 Claude Opus 4.7 的 1/6。

智谱 GLM-5.1 High-Speed 在 5 月 22 日发布,API 输出速度 400 Token/秒,全球最快。Artificial Analysis 基准中五大厂商成本最低:$544 vs DeepSeek $1,071 vs OpenAI $3,357。

百度 ERNIE 5.1 在 5 月 9 日发布,参数量压缩到 ERNIE 5.0 的 1/3,全球排名第 4、国产模型第 1。

腾讯在 5 月 21 日发布了 OS 级 AI 助手「马维斯」,Windows/Mac/Android 三端同步上线,能操控桌面应用、处理文件、远程调度手机任务。

两条政策面消息值得留意。一是彭博报道阿里和 DeepSeek 的顶级 AI 工程师出国需要政府审批,理由是国家安全。二是中国网信办起草了新的聊天机器人治理规则。

人才流动加上政策收紧,国产 AI 正在进入一个更复杂的阶段。

其他值得关注

  • Cursor Composer 2.5(5/18):搭载 Kimi K2.5(1 万亿参数 MoE),SWE-Bench Multilingual 79.8%,定价 $0.50/百万 Token
  • Mistral Medium 3.5(5/22):128B 密集模型,256K 上下文,开放协议,配套发布云端编程 Agent “Vibe”
  • Stable Audio 3.0(5/20):开源音乐生成模型,支持最长 6 分 20 秒,训练数据全授权,用户拥有输出版权
  • NVIDIA:黄仁勋宣布每年在台湾投资 1500 亿美元,新总部 2030 年运营,雇佣 4000 人
  • SoftBank:承诺在法国投资 450 亿欧元建设 AI 数据中心(3.1 GW,2031 年)
  • Snowflake + AWS:60 亿美元五年合作,在数据所在位置构建企业级 Agent AI
  • Apple WWDC 2026:定档 6 月 9 日,Siri 将以独立 App 形态回归,iOS 27 搭载七大 AI 功能
  • 特朗普推迟签署 AI 行政令(5/21):原计划要求前沿模型发布前 90 天安全审查,因担心削弱对华竞争力而搁置

三句话总结这个五月

模型能力还在涨,但竞争焦点已经从「谁更聪明」变成了「谁能干活」。Agent 成了所有大厂的共同答案。

融资规模在膨胀,但商业化的压力也在同步膨胀。Anthropic 年化收入超 500 亿、OpenAI Q1 亏 70 亿——烧钱速度比收入增长更快。

国内模型在基准测试上追得很紧,价格战打到骨折。但人才流动受限、监管趋严,下半年的不确定性在增加。

六月已经开始。GPT-5.6 在路上,Apple WWDC 就在下周。这个夏天不会太平。


AI 周报 Vol.11 | Anthropic 估值逼近万亿、Karpathy 跳槽、OpenAI 秘密冲刺 IPO,五月太疯狂了
https://www.ohtudou.top/2026/06/03/2026-06-03-ai-weekly-vol11/
作者
Tudo
发布于
2026年6月3日
许可协议