题目 ID: q-6469

LLM：数据集构造、是否出现DPO不收敛？或者DPO后的效果不如SFT？

频次 1

NLP与大模型

当前状态：未收藏、未完成

常见追问

暂无追问变体。

京东