题目 ID: q-11732 假设训练一个 Ψ\PsiΨ 参数量的模型,使用Adam优化器,混合精度(FP16/FP32)训练,显存主要由哪几部分构成? 频次 2 深度学习 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 阿里巴巴