ZheFox关于负载均衡缓存问题 中发帖

问佬们一个问题: 
现在的大模型的代理中转站的负载均衡是如何保证token缓存仍然有效的? 
换了个key发请求到比如智谱的服务器上为什么还可以保证缓存可以生效? 
这个缓存是可以在中转层做的吗? 
这个被缓存的token值会因为key的切换导致变少吗?
 
 
Back to Top