题目 ID: q-4888 混合专家模型(MoE)是如何在不显著增加推理成本的情况下,有效扩大模型参数规模的?请简述其工作原理。 频次 2 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 混合专家模型(MoE)是如何在不显著增加推理成本的情况下,有效扩大模型参数规模的?请简述其工作原理 常见公司 通用题库