题目 ID: q-4311

6.FlashAttention v1 和 v2 的主要改进点分别是什么?

频次 5
NLP与大模型 高频

当前状态:未收藏、未完成

常见追问

  • FlashAttention v2对比v1做了哪些优化?如何减少SRAM和HBM之间的IO?
  • 3.FlashAttention v2对比v1做了哪些优化?如何减少SRAM和HBM之间的IO?

常见公司

腾讯字节跳动