中国AI离美国还有多远2025最新实力榜来了

以前是遥遥领先,现在是贴身肉搏。
就在这个5月,国际AI评测机构 Artificial Analysis 发布了最新的《中国AI季度实力报告》,信息量炸裂,简单说:中国AI不仅追上了美国,在“开源大模型”这条赛道上,甚至实现了反超。
别急,我们一点点拆开说:
谁是现在中国最强的模型?
答案是: DeepSeek R1(0528版) 。
智力评分 68,已经基本追平美国顶级闭源模型(OpenAI o3)。
它是开源模型中的第一名,也是全球推理能力最强的开源模型。
这个版本甚至没有换架构,只是靠后训练 + 强化学习,把原有架构“喂”出了新高度。
一句话: 中国开源模型打破了“只能做陪跑”的刻板印象。

中国的开源战队:不只是DeepSeek
除了DeepSeek, 阿里系的Qwen3 也非常能打:
最新的 Qwen3-235B-A22B,智力评分62,推理能力国内第二。
阿里的策略也很明确:模型开源 + 云服务配套,打造平台化生态。
你还会看到以下这些名字频频出现在报告中:Moonshot(月之暗面)、StepFun(阶跃星辰)、Zhipu(智谱)、MiniMax……它们构成了一个活跃的中国AI创业版图, 几乎覆盖了从文本、语音到图像、视频生成的所有赛道 。

谁在全球最强榜单上?
来看看本次评估(使用 MMLU-Pro、LiveCodeBench、Humanity’s Last Exam 等七大维度)的最新智力排名中 60 分以上的:
排名
模型
国家
智力评分
1
OpenAI o4-mini
美国
70
2
DeepSeek R1 (0528)
中国
68
3
Gemini 2.5 Pro
美国
68
4
Grok 3 mini
美国
67
5
Claude Opus 4
美国
65
6
Qwen3-235B-A22B
中国
62
7
Seed-Thinking 1.5
中国
62
8
文心一言 X1
中国
60
也就是说, 前八中有四个是中国模型(50%),且分差已经缩小至个位数。
多模态战况:中国已不再是“缺席者”
文本生成之外,中国公司在“AI画画”和“AI做视频”方面也开始亮眼表现:
文生图 :字节的 Seedream 3.0和 GPT-4o 基本打平、MiniMax 的 Image-01甚至超越了老玩家 Midjourney。

文生视频 :虽然 Google Veo 3 依旧领先,但快手 Kling 2.0、阿里 Wan 2.1 等已进入主力阵营。注:这份报告之前快手已经将 Kling 更新到 2.1,性能可能已经逼近 Veo 3。
图生视频 :小范围试水中,MiniMax、腾讯、阿里都已推出相关产品。
特别是字节跳动,从文本、语音到图像生成,几乎全栈打通,成了中国最“多模态”的AI公司。
AI产品落地:中国真的很“卷”
这份报告特别指出,中国很多大模型背后都已经有了 上亿用户的落地产品 :
公司
产品
月活用户
阿里
通义千问
1.5亿
字节
豆包
1.1亿
华为
Celia
2亿
DeepSeek
Chat
1亿
而美国那边,OpenAI 每周的活跃用户已经接近 8 亿,所以虽然模型的能力差距在缩小,但对于活跃用户来说, OpenAI 仍然保持绝对的领先。
🧭 那中国AI的优势到底是什么?
总结来看,中国AI的“破圈密码”大概有三点:
开源文化 :DeepSeek、阿里等持续开源,极大推动了生态活跃度。
落地能力 :产品化和用户量领先,技术变现路径更清晰。
速度 :新模型更新周期缩短至3个月一个版本,研发节奏堪比互联网快消。
一句话: 跑得快、用得广、敢开源 。
写在最后:但别太早“庆功”
虽然这份报告很振奋人心,但也不能忽视几个现实问题:
美国模型依然在闭源前沿保持领先
算法创新上,中国仍以模仿+微创新为主
推理、涌现能力虽逼近,但多模态、长上下文等方向仍有差距
但也正因为差距不大了, 未来的博弈,才刚刚开始。
参考:https://artificialanalysis.ai/downloads/china-report/2025/Artificial-Analysis-State-of-AI-China-Q2-2025-Highlights.pdf
📮


共有 0 条评论