ZheFox 在关于负载均衡缓存问题中发帖问佬们一个问题：

ZheFox 在关于负载均衡缓存问题中发帖

问佬们一个问题： 
现在的大模型的代理中转站的负载均衡是如何保证token缓存仍然有效的？ 
换了个key发请求到比如智谱的服务器上为什么还可以保证缓存可以生效？ 
这个缓存是可以在中转层做的吗？ 
这个被缓存的token值会因为key的切换导致变少吗？