题目 ID: q-4504

总结一下八股:强化学习(目前每个面试官都会问),L1 L2正则化,LoRA原理,其他PEFT方法,SFT和DPO的区别,SFT和DPO训练心得,Transformer结构,位置编码,长度外推,优化器,flash attention,分类为什么用cse而不是mse,BERT系列训练流程与各种变体,AUC指标,最近读过的论文。

频次 3
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

蚂蚁集团腾讯字节跳动