@heyuexi 在 稳定的速度快的大模型可以用,效果能和 Minimax2.7接近就可以 中发帖
最近在做一个类似 AI客服的项目,一直用的是 Minimax 官方套餐, 客户反馈每次生成回复的时间太慢了,上个月生成回复需要10~30s的样子,这个月极其不稳定升级了 highspeed套餐还是很慢,最少需要 30s;
本来打算用kimi,但是看了下kimi的套餐不让在编程工具之外使用,而且速度也不快;
GLM就算了;
现在想找一个快速稳定的渠道,能让回复时间缩短到 10s 以内;
我了解到小参数模型会快一点,有没有哪个平台提供了小参数模型的Token;
在考虑 DeepSeek是不是挺快的,还没试;