题目 ID: q-11721 代码题,不是传统的算法题,是手写深度学习模型的那种😭第一题是写mask self attention的代码,鼠鼠哪见过这阵势,根本写不出来,幸亏记得思路,就给面试官讲了思路;第二题是写出batch norm、layer norm、RMS norm区别,鼠鼠不会第三个,就讲了前两个的区别。 频次 3 深度学习 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 OPPO小米京东