题目 ID: q-5116 开放场景:如果你有一个待优化的模型和一堆query,你怎么利用PPO来优化模型? 频次 2 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 开放场景:如果你有一个待优化的模型和一堆query,你怎么利用PPO来优化模型?11.开放场景:如果你有一个待优化的模型和一堆query,你怎么利用PPO来优化模型? 常见公司 小红书