题目 ID: q-12218 项目:模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐? 频次 3 机器学习系统 收藏 标记完成 当前状态:未收藏、未完成 常见追问 项目:模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐?模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐? 常见公司 美团通用题库