正在缓冲99% (@huanchong) 在 DeepSeek V4真正的划时代意义在哪里?不仅仅是价格便宜,它证明了中国 AI 正式从被卡脖子进入到自身产能爬坡的拐点 中发帖
刷抖音看到一个博主,跟我部分观点高度重合,干脆直接搬运他的原文过来。相同的部分不再重复,看他的就行;下面只放我自己的补充。
博主名字:程意
▶ 博主原文
中国 AI 正式从被卡脖子进入到自身产能爬坡的拐点
虽然 V4 本次实际训练仍是英伟达 + 昇腾的混合方案,V4 技术报告本身(§3.1)已经直接证明:DeepSeek 的训练栈是硬件无关的——同一套 fine-grained EP 方案在英伟达 GPU 和华为昇腾 NPU 上都跑通并 benchmark 过,达到同等的 1.5–1.96× 加速比。这意味着后续从零预训练 V5/V6,完全在华为昇腾上做不存在任何技术约束,只剩产能约束。
[image]
本段翻译:
性能与开源巨型内核。 我们在 NVIDIA GPU 和华为昇腾 NPU 平台上验证了细粒度 EP 方案。与强大的非融合基线相比,该方案在一般推理工作负载下实现了 1.5...