题目 ID: q-5116

开放场景:如果你有一个待优化的模型和一堆query,你怎么利用PPO来优化模型?

频次 2
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • 开放场景:如果你有一个待优化的模型和一堆query,你怎么利用PPO来优化模型?
  • 11.开放场景:如果你有一个待优化的模型和一堆query,你怎么利用PPO来优化模型?

常见公司

小红书