题目 ID: q-11710 大模型训练中常用的优化器有哪些?AdamW 和 Adam 的区别是什么? 频次 3 深度学习 收藏 标记完成 当前状态:未收藏、未完成 常见追问 大模型训练中常用的优化器有哪些?AdamW 和 Adam 的区别是什么? 常见公司 通用题库字节跳动