大模型
多语言多模态视频文本对齐数据集

产品概述:

涵盖普通话、方言、英德越印芬瑞阿等30多个语种,每段视频都标注了话题类型、说话内容。

数据规模:

2万小时

数据类型:

avi


数据提供方:
发表评论
0评