题目 ID: q-10195

为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?

频次 6
机器学习基础 高频

当前状态:未收藏、未完成

常见追问

  • 项目:为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?
  • 为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?
  • 训练稳定性:强化学习(RL)为何存在训练不稳定的问题?既然不稳定为何业界仍广泛使用?

常见公司

阿里巴巴蚂蚁集团通用题库京东