@HCPTangHYDeepSeek仓库DeepGEMM仓库更新 中发帖

DeepSeek研究院赵成钢刚刚更新DeepSeek官方仓库DeepGEMM 
110 个文件 +12684/-3209 行,commit 信息是 “Merge with private repo” 

 [image] 
新模型暗示 
信号很强。FP4 + Mega MoE + 分布式通信 + Blackwell 适配 + HyperConnection 训练支持,这个组合指向的是: 

DeepSeek 正在训练/准备部署一个比 V3 更大的 MoE 模型
模型大到必须用 FP4 量化才能高效推理
专门为 Blackwell 做了硬件级优化
“Mega MoE” 这个命名本身就暗示专家数量或模型规模有质的飞跃
 
 
Back to Top