印尼语多模态语音视频数据集

产品概述：

多模态模型被认为是目前提高人工智能系统能力的最佳途径之一，而本产品库采用最新采集形式，同时采集录制印尼语native发音人的多人对话的音频和视频数据，共计约84小时的有效对话数据，音频和视频数据采集结果会进行对齐处理，误差在30毫秒以内。在稀缺资源语种的基础上具有非常高的信息丰富度，可提供更加全面的信息输入从而高效提升系统的表现和效率。

 数据规模:
  120条音频、120条转写文本、120条视频

 数据格式：
WAV、TextGrid、mp4

数据提供方：

公司:北京海天瑞声科技股份有限公司
状态:离线发送信件在线交谈
姓名:海天瑞声(先生)
电话:010-62660053
地址:北京市海淀区成府路28号4-801