选择频道搜索
本数据集招募了18226名说话者,男女近似1比1。语料覆盖领域多样,包含了对话、唤醒词、控制命令、数字串、新闻论坛、书面语。所有数据使用麦克风进行采集,具备48kHz高采样率,内容自然,是通用语音复刻模型的绝佳训练数据。此数据集已被数家AI头部企业用于声音克隆应用研发,数据质量经过实践检验认可。
数据规模:
4179024条音频、18226人,6692小时
数据格式:
wav、txt
合作 咨询
15911018798数据合作联系电话
微信 联系