neoneoneo为啥都喜欢说token1个亿2个亿啥的,这并不能代表什么,应该看实际$消耗才对,因为缓存命中率会导致这个波动能到几倍。 中发帖

看到大家讨论比如glm、opencode go之类的套餐的时候都喜欢说“我这个套餐可以用多少亿的token”: 
缓存命中率1%,跟缓存命中率99% 
之间价格相差很大的,能达到几倍甚至几十倍(特别ds mimo这种模型)。 
但是还是很多人喜欢直接说自己某个套餐可以用多少多少token,每次看到都觉得好难受。 
印象里记得是国产厂商营销文案起的头开始这么说的?
 
 
Back to Top