题目 ID: q-4165

🔥🔥 Multi-Head Attention 的作用是什么?

频次 24
NLP与大模型 高频

当前状态:未收藏、未完成

常见追问

  • 手写Multi-head Attention
  • 为什么要进行多头注意力?
  • 讲下多头注意力

常见公司

京东蚂蚁集团字节跳动阿里巴巴美团