题目 ID: q-4888

混合专家模型（MoE）是如何在不显著增加推理成本的情况下，有效扩大模型参数规模的？请简述其工作原理。

频次 2

NLP与大模型

当前状态：未收藏、未完成

常见追问

通用题库