suke119 (@wangsr_bus) 在 2026 大模型部署框架终极选型指南 中发帖
一句话总结:
云端高性能选 TensorRT-LLM ,云端灵活性选 vLLM ,Agent 场景选 SGLang ,Mac 用户闭眼选 oMLX ,本地试错选 Ollama ,手机端选 MLC LLM ,国产算力选 LMDeploy 。
懒人看板:
[llm]