只需要13价格的5070就可以媲美4090黄仁勋被指偷换概念

只需要13价格的5070就可以媲美4090黄仁勋被指偷换概念-2

在刚刚召开的 CES 2025 展会上,一场关于显卡性能的争议正在科技圈发酵。起因是 NVIDIA CEO黄仁勋的一个令人惊诧的声明: 他称售价仅 549 美元的全新 RTX 5070 显卡,可以媲美售价高达 1,599 美元的旗舰产品 RTX 4090 的性能。 这个相差近三倍售价的产品性能对比,立即在游戏和科技社区引发热议。

不少专业人士指出,英伟达正在通过 AI 技术的加持来模糊"性能"的定义,巧妙地回避了传统意义上的显卡性能差距。 这场争议也让我们不得不重新思考: 在 AI 时代,我们该如何定义和衡量显卡性能?

硬件规格差距悬殊

只需要13价格的5070就可以媲美4090黄仁勋被指偷换概念-3

从纯硬件规格来看,RTX 5070 与 RTX 4090 之间存在明显差距。RTX 5070 采用最新的 Blackwell 架构和台积电 N4P 工艺,而 RTX 4090 则使用 Ada Lovelace 架构和 4N 工艺。 在核心配置上,RTX 5070 的各项指标普遍只有 RTX 4090 的三分之一到二分之一 (后者为 4090):

- 流式多处理器(48 vs 128)

- CUDA 核心(6,144 vs 16,384)

- Tensor 核心(192 vs 512)

- 光追核心:48 个第四代 vs 128 个第三代

内存系统的差距同样显著。RTX 5070 配备 12GB GDDR7 显存,192 位位宽,带宽为 672 GBps;而 RTX 4090 则拥有 24GB GDDR6X 显存,384 位位宽,带宽达到 1,008 GBps。

只需要13价格的5070就可以媲美4090黄仁勋被指偷换概念-4

简单来说, 与 RTX 5070 相比,RTX 4090 的内存速度几乎快了 2 倍。而仅有 12GB 的内存可能会成为未来高分辨率游戏的瓶颈。

不过在功耗方面,RTX 5070 表现更为出色,TDP 仅为 250W,远低于 RTX 4090 的 450W。由于 RTX 5070 各个单元的核心数要少得多,因此与 RTX 4090 相比,它的功耗更低。

性能指标对比

在具体性能指标上,RTX 4090 的优势同样明显:

- 着色器性能 :RTX 4090 达到 83 TFLOPS vs RTX 5070 的 31 TFLOPS

- 光线追踪性能 :RTX 4090 的 191 TFLOPS vs RTX 5070 的 94 TFLOPS

- AI 运算能力 :RTX 4090 的 1,321 TOPS vs RTX 5070 的 988 TOPS

值得注意的是,在 AI 运算能力方面,差距明显缩小。RTX 5070 仅用 192 个第五代 Tensor 核心就达到了 988 TOPS,接近配备 512 个第四代 Tensor 核心的 RTX 4090。这一数据充分展示了新一代架构在 AI 处理上的优势,也为 DLSS 4 的强大性能提供了硬件基础。

我们可以看到在原始性能方面, RTX 4090 的各项指标普遍是 RTX 5070 的 2-3 倍。 但黄仁勋在发布会上反复强调"没有 AI 就不可能实现"这一点。

DLSS 4:性能提升的关键

那么,硬件规格差距如此之大的两款显卡,是如何达到相近的性能水平的?答案在于 NVIDIA 最新推出的 DLSS 4 技术。NVIDIA 高级技术产品经理 Lars Weinand 在接受采访时解释:"借助神经渲染和 DLSS 4,RTX 5070 确实能达到此前只有 RTX 4090 才能实现的性能水平,但这并不意味着在所有场景下都能完全匹敌。"

只需要13价格的5070就可以媲美4090黄仁勋被指偷换概念-5 图:DLSS4 可以提升帧速率

DLSS 4 最大的突破在于其多帧生成技术。通过"预测未来"而非"插值过去"的方式,每个传统渲染帧可以额外生成最多三个帧,使帧率提升最高达到 8 倍。 Nvidia 所说的性能水平主要指帧率,也就是每秒能够向显示器输出多少张静止图像来构成流畅画面,而非画面质量的对比。

以《赛博朋克 2077》为例,开启 DLSS 4 后可将帧率从原生的 27fps 提升至 243fps,大幅超越 DLSS 3.5 时的 142fps。

技术突破与争议

显然,在不使用 DLSS 的纯光栅化性能方面,RTX 5070 无法达到 RTX 4090 的水平。性能提升主要体现在支持 DLSS 4 的游戏中。在 DLSS 3 中,Nvidia 通过在两个渲染帧之间插入额外的 AI 生成帧来提升画面流畅度和帧率。

DLSS 4 进一步扩展了这一技术,每个传统渲染帧可以生成多达三个额外帧,使帧率最高提升至原来的 8 倍。新的转换器模型使帧生成速度提升了 40%,同时将显存占用降低了 30%。

只需要13价格的5070就可以媲美4090黄仁勋被指偷换概念-6

这种技术创新也引发了新一轮关于"虚拟帧"的讨论。一些玩家质疑 DLSS 生成的"虚拟帧"无法体现显卡的真实性能。Digital Foundry 的测试显示,虽然 DLSS 4 会引入约 6 毫秒的额外延迟,但帧时间更为平滑。Weinand 强调:"多帧生成带来的延迟微乎其微,我们通过 GPU 调节确保帧的显示节奏非常均匀。"

输入延迟或游戏体验对许多游戏来说至关重要,DLSS 4 的效果取决于原始帧率。即便 DLSS 4 能将 27fps 的游戏提升到 243fps,但如果原始帧率太低,游戏体验仍可能不够理想。

这一直是 DLSS 帧生成技术的局限之一:虽然画面看起来更流畅,但实际体验可能不如原生高帧率。 普通玩家可能察觉不到输入延迟,但对于习惯了高帧率的玩家来说,这种差异是明显的。

事实上,现代游戏中早已存在大量"虚拟"技术。随着越来越多的游戏支持全光线追踪,即便是顶级显卡也需要 AI 渲染技术的支持。DLSS 4 为开发者提供了新的工具,帮助实现此前难以想象的画质和效果。从 Sony 和 AMD 的最新动向来看,AI 驱动的渲染技术很可能成为游戏产业的未来发展方向。

争议不止于此

英伟达这次发布会引发的争议还不止于此。在展示 AI 算力增长时,黄仁勋展示了一张令人瞩目的增长曲线图,声称从 2016 年到 2024 年,英伟达的 AI 算力提升了整整 1000 倍。数据显示,从 2016 年 Pascal 架构的 19 TFlops,到 2024 年 Blackwell 架构的 20000 TFlops,这种指数级增长确实令人印象深刻。

只需要13价格的5070就可以媲美4090黄仁勋被指偷换概念-7

然而细心的观众发现,这张看似惊人的数据背后藏有玄机:最早的 Pascal 架构使用 FP16(半精度浮点)标准,到了 2022 年的 Hopper 架构时改用了 FP8,而最新的 Blackwell 架构更是采用 FP4 进行对比。 换言之,这是一个不同精度下的性能对比。

这种标准的变化再次引发业界质疑。虽然降低精度确实能带来更高的运算速度,但同时也意味着计算精度的损失。实际应用中,并非所有 AI 工作负载都能使用如此低的精度。不少技术专家指出,这种对比方式像是在刻意追求更具冲击力的营销数据,而不是展示真实的技术进步。

只需要13价格的5070就可以媲美4090黄仁勋被指偷换概念-8

正如有网友调侃的那样,黄仁勋正在成为"乔布斯之后的另一个营销大师"。这种营销手法固然令人印象深刻,但也让人不禁怀疑:在追求夺人眼球的数据时,是否有些过于舍弃了技术沟通的严谨性?

结论

从 DLSS 的帧率对比到 AI 算力的增长曲线,英伟达在这次发布会上的营销策略引发了诸多争议。一方面,不可否认的是,RTX 5070 通过 DLSS 4 的确能在特定场景下实现接近 RTX 4090 的帧率表现,AI 技术也确实正在重塑游戏图形的未来。另一方面,无论是用 AI 增强后的帧率来对比显卡性能,还是用不同精度标准来展示算力提升,这些手法都让人不禁质疑其营销方式的妥当性。

对普通玩家而言,RTX 5070 的选购建议很简单:如果您在意原生性能,那么这张显卡与旗舰级 RTX 4090 确实存在不小差距;如果您主要游戏支持 DLSS 4,且能接受 AI 渲染带来的微小延迟,那么这张售价仅为 RTX 4090 三分之一的显卡或许值得考虑。

不过在被营销数据冲昏头脑之前,或许我们更应该思考:在追求更惊艳的数字时,是否也应当同等重视技术传播的透明度和严谨性?毕竟,真正的技术进步不应该依赖于数据的刻意演绎,而是实打实的性能提升和用户体验改善。

THE END
分享
二维码
< <上一篇
下一篇>>