题目 ID: q-5725

7. 预训练模式是啥?和sft的区别?(next token prediction;区别是sft不算prompt的loss)

频次 1
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

阿里巴巴