题目 ID: q-4888

混合专家模型(MoE)是如何在不显著增加推理成本的情况下,有效扩大模型参数规模的?请简述其工作原理。

频次 2
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • 混合专家模型(MoE)是如何在不显著增加推理成本的情况下,有效扩大模型参数规模的?请简述其工作原理

常见公司

通用题库