@HCPTangHY对DeepSeek V4lite 0329的一些猜想 中发帖

昨天晚上,deepseek官网的模型出现了微妙变化 

综合测试发现,其所有其他能力全部没有明显进步(甚至可能退步),但只有SVG能力突飞猛进 
 [image] 
[image] 
并且有显著的Gemini风格 
并且我们发现,只有在绘制SVG的任务中,思维链会陡然变为Gemini风格,这在deepseek历史上都没有过 
 [image] 
结合研究员陈德里几天前在小红书开启的关于RP思维链的设计问题 
 [image] 
基本可以认为v4现在已经进入了后训练阶段。而官网的小模型进行了一种试验: 
使用某种特定方法来控制思维链格式 
我们可以明显看出0329的官网蒸馏了大量的Gemini 3.1 pro SVG内容。这对于模型本身和DeepSeek本身没有任何意义,甚至把其他能力变区了。SVG这个bench唯一的意义就是拿去X上给洋人烂炒。 
但是当模型识别到这是一个SVG任务,思维链...
 
 
Back to Top