题目 ID: q-10424 极端下采样高奖励/‘已掌握’样本会降低对这些样本的长期表现,除非引入显式的重放或混合机制维持记忆 频次 1 机器学习基础 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 未知