题目 ID: q-27

是否使用Verl框架进行RL?详细讲解Verl框架的训练流程,并说明配置文件中rollout_batchsize、global_batch_size、micro_batch_size_per_device_for_update、rollout.n等参数的关系及其对每张显卡上样本数的影响。

频次 2
AI系统设计 AI 系统设计

当前状态:未收藏、未完成

常见追问

  • 是不是用的Verl框架做的rl?详细讲一下verl框架的训练流程。并讲一下配置文件中rollout batchsize, global batch_sizemicro_batch_size_per_device_for_update,rollout.n等等参数的关系,以及他们如何影响最终更新时每张显卡上的样本数。
  • 是不是用的 Verl 框架做的 rl ?详细讲一下 verl 框架的训练流程。并讲一下配置文件中 rollout _ batchsize , global _ batch _ size , micro _ batch _ size _ per _ device _ for _ update , rollout . n 等等参数的关系,以及他们如何影响最终更新时每张显卡上的样本数。

常见公司

蚂蚁集团