题目 ID: q-4193 🔥 你怎么处理响应速度与推理精度之间的tradeoff?是先召回再精排,还是单次生成? 频次 11 NLP与大模型 高频 收藏 标记完成 当前状态:未收藏、未完成 常见追问 你怎么处理响应速度与推理精度之间的tradeoff?你怎么处理响应速度与推理精度之间的tradeoff?是先召回再精排,还是单次生成? 常见公司 通用题库字节跳动