题目 ID: q-4342

MLA是怎么做的?为什么它比LoRA快?同样是低秩分解,为啥推理时LoRA慢而MLA快?

频次 4
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • 为什么同样是低秩分解,推理是lora慢MLA快?
  • MLA怎么做的,为什么快?为什么同样是低秩分解,推理是lora慢MLA快?

常见公司

阿里巴巴滴滴字节跳动