Zoro (@user1294)请问有人部署过GLM5.1 OR Kimi2.6 这种模型 配置到opencode吗 如何解决上下文长度问题 中发帖

我在H200 8卡 sglang 部署了 GLM-5.1-fp8 我配置好api 为什么上下文总是会超出长度呢? 如何解决这个问题? 
命令如下 
SGLANG_ENABLE_SPEC_V2=1 sglang serve \
  --model-path zai-org/GLM-5.1-FP8 \
  --tp 8 \
  --dp 8 \
  --enable-dp-attention \
  --reasoning-parser glm45 \
  --tool-call-parser glm47 \
  --speculative-algorithm EAGLE \
  --speculative-num-steps 3 \
  --speculative-eagle-topk 1 \
  --speculative-num-draft-tokens 4 \
  --mem-frac...
 
 
Back to Top