题目 ID: q-4193

🔥 你怎么处理响应速度与推理精度之间的tradeoff?是先召回再精排,还是单次生成?

频次 11
NLP与大模型 高频

当前状态:未收藏、未完成

常见追问

  • 你怎么处理响应速度与推理精度之间的tradeoff?
  • 你怎么处理响应速度与推理精度之间的tradeoff?是先召回再精排,还是单次生成?

常见公司

通用题库字节跳动