题目 ID: q-11710

大模型训练中常用的优化器有哪些?AdamW 和 Adam 的区别是什么?

频次 3
深度学习

当前状态:未收藏、未完成

常见追问

  • 大模型训练中常用的优化器有哪些?AdamW 和 Adam 的区别是什么?

常见公司

通用题库字节跳动