题目 ID: q-4581 Transformer与Llama在LayerNorm实现上的区别 频次 3 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 transformer和llama关于layernorm的区别transformer和llama的LN有什么区别,手写RMSNormtransformer和llama关于layernorm的区别,ffn用swiglu的区别 常见公司 华为字节跳动