题目 ID: q-5475 Decoder-Only 的进行基于 Scaling Laws 的实际训练成本低,而 Encoder-Only 压根就不适合做生成任务 频次 1 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 未知