题目 ID: q-4483

transformer计算的时间复杂度和空间复杂度,deepseek对transformer主要做了哪些改进?

频次 3
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • transformer计算的时间复杂度和空间复杂度,deepseek对transformer主要做了哪些改进?

常见公司

字节跳动