题目 ID: q-10422 仅在困难、低奖励样本上训练会使梯度被这些样本主导,导致参数向解决少数难题的方向迁移,而该参数配置对简单任务可能是次优的 频次 1 机器学习基础 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 未知