题目 ID: q-5065

LoRA微调中如何选择rank值?合并adapter权重时是否遇到梯度爆炸?

频次 2
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • 看你做过LoRA微调,那你是怎么选rank值的?合并adapter权重的时候有没有遇到梯度爆炸
  • 项目:看你做过LoRA微调,那你是怎么选rank值?合并adapter权重的时候有没有遇到梯度爆炸?

常见公司

美团