Haku271 在 佬们你们有实现编程CLI智能路由吗?有什么方案 中发帖
我想通过一个模型去根据用户问题判断难度然后分配模型,主要还是puls额度太低了.
ai给出了几种方案
一种是CPA + Judge转发
还有一个复杂的是
入口:Caddy
路由服务:FastAPI 或 Go
模型网关:LiteLLM Proxy
状态:Redis
判断模型:GPT-5.4 nano
疑难复核:GPT-5.4 mini
OpenAI调用:转发 Codex ChatGPT认证
其他模型:独立 API Key
路由策略:三档模型 + reasoning_effort
会话策略:首次判断,整段任务固定
想问问佬们有没有有搞过这方面的