dill 在今天我的 gpt-5.5 不到 40 tokens/s，这合理吗？中发帖美国甲骨文，docker 里面部署的 CPA 反代 Codex，本机 axonhub 连接到 CPA

dill 在今天我的 gpt-5.5 不到 40 tokens/s，这合理吗？中发帖

美国甲骨文，docker 里面部署的 CPA 反代 Codex，本机 axonhub 连接到 CPA。本地 OPENCODE 接 axonhub 用。今天只有 38 tokens/s 的速度。TTFT 看着还比较正常。如图： 
 [image] 
[image] 
太慢了，同时跑 3 个项目才烧了 2 亿 tokens，pro 20x 怎么用得完啊。 
 [image]