题目 ID: q-4581

Transformer与Llama在LayerNorm实现上的区别

频次 3
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • transformer和llama关于layernorm的区别
  • transformer和llama的LN有什么区别,手写RMSNorm
  • transformer和llama关于layernorm的区别,ffn用swiglu的区别

常见公司

华为字节跳动