题目 ID: q-4911 模型量化如何做的。 gptq , qat 等等,并说明为什么选择了w8a16的量化? 频次 2 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 模型量化如何做的。gptq,qat等等,并说明为什么选择了w8a16的量化? 常见公司 蚂蚁集团