题目 ID: q-4278

SFT使用的数据可能和原始模型预训练时的数据分布有较大区别,怎么解决?

频次 5
NLP与大模型 高频

当前状态:未收藏、未完成

常见追问

  • 数据分布:SFT 微调数据与预训练数据分布差异较大时,该如何处理?
  • SFT使用的数据可能和原始模型预训练时的数据分布有较大区别,怎么解决?
  • 项目:SFT使用的数据可能和原始模型预训练时的数据分布有较大区别,怎么解决?

常见公司

阿里巴巴蚂蚁集团通用题库