题目 ID: q-12218

项目:模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐?

频次 3
机器学习系统

当前状态:未收藏、未完成

常见追问

  • 项目:模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐?
  • 模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐?

常见公司

美团通用题库