题目 ID: q-5257 请介绍几个目前行业内广泛使用的 LLM 综合性基准测试,并说明它们各自的侧重点。(例如:MMLU, Big-Bench, HumanEval) 频次 1 NLP与大模型 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 通用题库