题目 ID: q-5747

你觉得多头注意力能提高计算效率吗?结合公式推导一下?(矩阵计算)

频次 1
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

阿里巴巴