mumuyoo 在 多5090D模型集群管理 中发帖
新人过来发波求助帖,目前公司有五台5090D,用PVE搭了一个集群,现在我只是在每张卡上部署了一个模型,求问怎么多张卡部署一个大的或者把资源集中起来再分配,例如5张卡80%部署一个大模型剩下20%的资源部署一个或者多个小模型,有没有类似项目或者条件的,想跟大家学习下