题目 ID: q-10195 为什么使用强化学习会存在训练不稳定问题?为什么业界还在用? 频次 6 机器学习基础 高频 收藏 标记完成 当前状态:未收藏、未完成 常见追问 项目:为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?训练稳定性:强化学习(RL)为何存在训练不稳定的问题?既然不稳定为何业界仍广泛使用? 常见公司 阿里巴巴蚂蚁集团通用题库京东