题目 ID: q-7597

sft有哪些方式?除了lora还有哪些?lora中为什么低秩矩阵是能够表示增量的?怎么初始化的?为什么要这么初始化?

频次 1
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

小米