题目 ID: q-7545

随着上下文长度(context length)越来越长,但显存和算力跟不上,你觉得在模型架构或工程层面有哪些改进方向?

频次 1
NLP与大模型

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

小米