题目 ID: q-6544

核心还是围绕项目相关的点来拷打八股,大概深挖了LoRa的原理和实现、训练过程中梯度的更新方式,transformer中多头注意力的作用、应用残差链接的原因和作用原理,决策树和svm的结构、原理和训练过程等到。

频次 1
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

京东