题目 ID: q-6704

SFT lora的做法,原理,具体微调哪个矩阵,其他PEFT方法,为什么lora用的广泛,以及矩阵和数据序列N参数量的关系。

频次 1
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

蚂蚁集团