题目 ID: q-10424

极端下采样高奖励/‘已掌握’样本会降低对这些样本的长期表现，除非引入显式的重放或混合机制维持记忆

频次 1

机器学习基础

当前状态：未收藏、未完成

常见追问

暂无追问变体。

未知