题目 ID: q-4278 SFT使用的数据可能和原始模型预训练时的数据分布有较大区别,怎么解决? 频次 5 NLP与大模型 高频 收藏 标记完成 当前状态:未收藏、未完成 常见追问 数据分布:SFT 微调数据与预训练数据分布差异较大时,该如何处理?SFT使用的数据可能和原始模型预训练时的数据分布有较大区别,怎么解决?项目:SFT使用的数据可能和原始模型预训练时的数据分布有较大区别,怎么解决? 常见公司 阿里巴巴蚂蚁集团通用题库