题目 ID: q-4504 总结一下八股:强化学习(目前每个面试官都会问),L1 L2正则化,LoRA原理,其他PEFT方法,SFT和DPO的区别,SFT和DPO训练心得,Transformer结构,位置编码,长度外推,优化器,flash attention,分类为什么用cse而不是mse,BERT系列训练流程与各种变体,AUC指标,最近读过的论文。 频次 3 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 蚂蚁集团腾讯字节跳动