AI开源项目|Transformer模型|多模态学习|掩蔽模型|数据集预训练|时间序列分析|特征预测|空间-时间表示|编码器-预测器架构|自监督学习|视频处理

共 1 篇网址

排序

发布更新浏览点赞

V-JEPA

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

03401

AI开源项目 # AI开源项目|Transformer模型|多模态学习|掩蔽模型|数据集预训练|时间序列分析|特征预测|空间-时间表示|编码器-预测器架构|自监督学习|视频处理