题目 ID: q-5118 Multi-Head 机制:并行计算多个注意力头,捕获不同子空间的特征 频次 1 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 通用题库