题目 ID: q-4164

🔥🔥 能介绍一下Flash Attention吗?它是怎么做到既省显存又提速的?

频次 26
NLP与大模型 高频

当前状态:未收藏、未完成

常见追问

  • 2. Flash Attention原理
  • flash attention
  • Flash Attention 的优化原理

常见公司

腾讯蚂蚁集团滴滴字节跳动小米