题目 ID: q-96

强化学习和RAG问的比较多,但是因为我本人都只是做过demo级别的项目,回答的不是很好,被面试官一直质疑,以及一些PPO和DPO的细节,输入数据集格式是否一样,评测标准(答的BLEU和ROUGE),了不了解其他框架,其他指标,论文也被质疑贡献

频次 1
AI系统设计 AI 系统设计

当前状态:未收藏、未完成

常见追问

暂无追问变体。

常见公司

蚂蚁集团