题目 ID: q-12458 你们训练框架用的啥?有没有了解过 deepspeed 的那几个阶段的区别,还有 offload? 频次 1 机器学习系统 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 蚂蚁集团