题目 ID: q-11982

transformer用的归一化方法?BN、LN、IN、GN的适用场景和缺点?

频次 1
深度学习

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

京东