选择频道搜索
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制印尼语native发音人的多人对话的音频和视频数据,共计约84小时的有效对话数据,音频和视频数据采集结果会进行对齐处理,误差在30毫秒以内。在稀缺资源语种的基础上具有非常高的信息丰富度,可提供更加全面的信息输入从而高效提升系统的表现和效率。
数据规模: 120条音频、120条转写文本、120条视频
数据格式:WAV、TextGrid、mp4
合作 咨询
15911018798数据合作联系电话
微信 联系