题目 ID: q-4943

MQA、GQA和MHA的具体参数量推导,KV Cache在不同架构下的显存占用对比.

频次 2
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • MQA、GQA和MHA的具体参数量推导,KV Cache在不同架构下的显存占用对比。
  • 2.MQA、GQA和MHA的具体参数量推导,KV Cache在不同架构下的显存占用对比。

常见公司

字节跳动