题目 ID: q-4546

SFT 的 loss 如何只计算回答部分?(如何 ignore padding token?)

频次 3
NLP与大模型

当前状态:未收藏、未完成

常见追问

  • SFT 的 loss 如何只计算回答部分?(如何 ignore padding token?)
  • 八股:SFT 的 loss 如何只计算回答部分?(如何 ignore padding token?)

常见公司

通用题库美团