题目 ID: q-4911

模型量化如何做的。 gptq , qat 等等,并说明为什么选择了w8a16的量化?

频次 2
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • 模型量化如何做的。gptq,qat等等,并说明为什么选择了w8a16的量化?

常见公司

蚂蚁集团