题目 ID: q-12775 clip的文本编码器和图像编码器都是什么,它们分别如何提取特征 频次 1 计算机视觉 收藏 标记完成 当前状态:未收藏、未完成 常见追问 暂无追问变体。 常见公司 字节跳动