题目 ID: q-5053 transformer中softmax的作用、问题及解决方法 频次 2 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 transformer中softmax的作用?不做softmax会有什么问题?Softmax怎么解决上下溢的问题?除了减去最大值还有方法?transformer中用softmax有什么问题呢?该怎么解决 常见公司 美团京东