@HCPTangHY 在 DeepSeek仓库DeepGEMM仓库更新 中发帖
DeepSeek研究院赵成钢刚刚更新DeepSeek官方仓库DeepGEMM
110 个文件 +12684/-3209 行,commit 信息是 “Merge with private repo”
[image]
新模型暗示
信号很强。FP4 + Mega MoE + 分布式通信 + Blackwell 适配 + HyperConnection 训练支持,这个组合指向的是:
DeepSeek 正在训练/准备部署一个比 V3 更大的 MoE 模型
模型大到必须用 FP4 量化才能高效推理
专门为 Blackwell 做了硬件级优化
“Mega MoE” 这个命名本身就暗示专家数量或模型规模有质的飞跃