dill今天我的 gpt-5.5 不到 40 tokens/s,这合理吗? 中发帖

美国甲骨文,docker 里面部署的 CPA 反代 Codex,本机 axonhub 连接到 CPA。本地 OPENCODE 接 axonhub 用。今天只有 38 tokens/s 的速度。TTFT 看着还比较正常。如图: 
 [image] 
[image] 
太慢了,同时跑 3 个项目才烧了 2 亿 tokens,pro 20x 怎么用得完啊。 
 [image]
 
 
Back to Top