题目 ID: q-4171

🔥 手撕多头注意力机制(不用PyTorch)

频次 19
NLP与大模型 高频

当前状态:未收藏、未完成

常见追问

  • 手撕代码:PyTorch 实现多头注意力机制
  • 代码

常见公司

腾讯华为小米字节跳动美团