ZheFox 在 关于负载均衡缓存问题 中发帖
问佬们一个问题:
现在的大模型的代理中转站的负载均衡是如何保证token缓存仍然有效的?
换了个key发请求到比如智谱的服务器上为什么还可以保证缓存可以生效?
这个缓存是可以在中转层做的吗?
这个被缓存的token值会因为key的切换导致变少吗?