@yacc 在 闭源模型会不会有隐形优势 中发帖
前排提示:本人对大模型了解非常基础,下面的很多内容都是脑洞,我没有任何证据证明他们在这么做,不要太关心具体可行性之类的问题。主要是我的文字表达能力有限,以举例的方式可能更形象
最近grok的多agent模式让我突发奇想,有没有可能闭源模型的功能有“水分”,或者说模型本身就很强,然后用系统工程进一步放大了,使得产品能力>>模型本身能力,但因为闭源我们只能看到产品能力。比如对外声称是一个新模型,实际内部是多agent,或者用了什么其他优化技巧,可以让一个本身90分的模型跑出95分的成绩。但是外界完全不知道他们怎么实现,要知道头部的几个模型很难说有决定性的差距,反正他们算力够多,通过一些trick提高1分可能就压倒对手了(什么提高一分,干掉千人)。
还有这几年的mcp、skill之类的东西,有跟没有的输出质量完全是两个档次,而在这些技术有人正式公开前,他们内部可能早就有差不多的东西,只是不叫...