题目 ID: q-6743

那你认为, 你说的这几种能力,都是在模型训练流程的哪个部分获得的?(挺有意思的问题。 知识储备是预训练获取的, 指令跟随一般是做微调, 安全对齐可能是 SFT rlhf, 对话的逻辑性应该都有关)

频次 1
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

蚂蚁集团