题目 ID: q-5257

请介绍几个目前行业内广泛使用的 LLM 综合性基准测试,并说明它们各自的侧重点。(例如:MMLU, Big-Bench, HumanEval)

频次 1
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

通用题库