题目 ID: q-27
是否使用Verl框架进行RL?详细讲解Verl框架的训练流程,并说明配置文件中rollout_batchsize、global_batch_size、micro_batch_size_per_device_for_update、rollout.n等参数的关系及其对每张显卡上样本数的影响。
AI系统设计 AI 系统设计
当前状态:未收藏、未完成
常见追问
- 是不是用的Verl框架做的rl?详细讲一下verl框架的训练流程。并讲一下配置文件中rollout batchsize, global batch_sizemicro_batch_size_per_device_for_update,rollout.n等等参数的关系,以及他们如何影响最终更新时每张显卡上的样本数。
- 是不是用的 Verl 框架做的 rl ?详细讲一下 verl 框架的训练流程。并讲一下配置文件中 rollout _ batchsize , global _ batch _ size , micro _ batch _ size _ per _ device _ for _ update , rollout . n 等等参数的关系,以及他们如何影响最终更新时每张显卡上的样本数。
常见公司
蚂蚁集团