WD (@WenDavid)【纯水】一种基于Tokenizer测试Opus4.7相关计费的方法 中发帖

背景
这是今天在这位楼主的帖子下面突然想到的 

这种测Tokenizer的方法一定程度上可以测出Opus4.7和其他模型之间的区别。但是值得注意的是有这样一种可能: 

Claude Code相关的订阅转出来本身就是需要有一个You are Claude Agent SDK之类的预填充prompt;此外有的时候会填几个统一的预填充的prompt头,大概原理是让Anthropic的开头建立缓存的时候缓存到一起之类的?或者添加随机性? 
总之如果只看input_tokens,有可能会对应加一些随机的小常数(这实际上可能对应一些固定的手续费,或者可能会让缓存率偏低,所以理论上上下文比较长手续费占比可能比较高hh),按照这种分词器分出来的token数的比例,可能需要按照比较长的效果来评判。 
方法
那么有没有什么说服力更强的方法呢?这里想到一种用output_tokens来交叉检验。具体来讲,我...
 
 
Back to Top