题目 ID: q-4311 6.FlashAttention v1 和 v2 的主要改进点分别是什么? 频次 5 NLP与大模型 高频 收藏 标记完成 当前状态:未收藏、未完成 常见追问 FlashAttention v2对比v1做了哪些优化?如何减少SRAM和HBM之间的IO?3.FlashAttention v2对比v1做了哪些优化?如何减少SRAM和HBM之间的IO? 常见公司 腾讯字节跳动