WD (@WenDavid) 在【纯水】一种基于Tokenizer测试Opus4.7相关计费的方法中发帖背景

WD (@WenDavid) 在【纯水】一种基于Tokenizer测试Opus4.7相关计费的方法中发帖

背景
这是今天在这位楼主的帖子下面突然想到的 

这种测Tokenizer的方法一定程度上可以测出Opus4.7和其他模型之间的区别。但是值得注意的是有这样一种可能： 

Claude Code相关的订阅转出来本身就是需要有一个You are Claude Agent SDK之类的预填充prompt；此外有的时候会填几个统一的预填充的prompt头，大概原理是让Anthropic的开头建立缓存的时候缓存到一起之类的？或者添加随机性？ 
总之如果只看input_tokens，有可能会对应加一些随机的小常数（这实际上可能对应一些固定的手续费，或者可能会让缓存率偏低，所以理论上上下文比较长手续费占比可能比较高hh），按照这种分词器分出来的token数的比例，可能需要按照比较长的效果来评判。 
方法
那么有没有什么说服力更强的方法呢？这里想到一种用output_tokens来交叉检验。具体来讲，我...