chinese learn 在 1.9w token/s 新架构AI专用推理芯片 中发帖
体验网址https://chatjimmy.ai/
官方网站Products | Taalas
测试了一下。运行8b参数确实能达到1.9万token每秒。
然后官网上写今年冬天会发布支持顶尖开源大模型的芯片,理论上能达到8000token/s