首页
人工智能高质量数据集
数据提供方
手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
搜索
您可以
或
人机
对话
高质量语音评测数据集
涵盖7类
对话
场景,自然表达的音频数据集,可作为模型评测数据集,应用于语音
对话
与听觉大模型的研究。 数据规模:47056条 数据
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
30GB
中文千万轮
对话
语料库 DOTS-NLP-216
数据集构成:真实场景
对话
采集,高度还原真实场景的模拟
对话
。兼顾分布的代表性、多样性和样本规模。覆盖领域:工作、生活、校园
2023-09-12 23:50
应用场景:语料语义
北京海天瑞声科技股份有限公司
4G
大模型中文千万轮
对话
数据集
该数据集是一个上千万轮的双人
对话
的高质量工程化数据集,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。数据规模
2023-09-12 23:52
应用场景:大模型
北京海天瑞声科技股份有限公司
2GB
智能会议场景高质量
对话
式语音数据集
涵盖956场真实会议场景,多人多轮次
对话
音频数据集,可应用于语音
对话
与听觉大模型的研究。数据规模:666小时数据格式:WAV、txt
2023-09-03 13:53
应用场景:语料语义
北京希尔贝壳科技有限公司
3.2TB
生成式
对话
大模型精调语料
面向
对话
大模型的高质量、多类型指令数据集,包括但不限于单轮
对话
、多轮
对话
、个性化指令、上下文理解指令和推理思维链等数据规
2023-09-12 23:53
应用场景:通用领域和全球防务领域
中译语通科技股份有限公司
30G
超大规模中文多领域高质量多轮
对话
数据集
15w小时,5千万轮多领域自然式人人
对话
数据集,可显著优化中文多轮交互自然效果。数据规模:15w小时数据格式:wav
2023-09-02 19:47
应用场景:人机对话
北京晴数智慧科技有限公司
18TB
1,351小时普通话自然
对话
语音数据【数据堂】
格式16kHz/44.1kHz, 16bit,未压缩wav,单声道/双声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多
2024-02-23 14:37
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
1,351小时
377小时河南方言自然
对话
手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容不指定话题,录音人两人为一组自由交谈人员约762名
2024-02-23 14:51
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
377小时
12.6小时中文女声
对话
式客服合成库【数据堂】
格式48kHz,24bit,wav,单声道录音环境专业录音棚环境录音内容模拟电信场景的自然
对话
人员女性,20~30岁,声音甜美设备专业录音
2024-02-23 14:53
应用场景:语音合成
数据堂(北京)科技股份有限公司
12.6小时
1,136小时美式英语自然
对话
手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多个自己熟悉的话题
2024-02-23 14:37
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
1,136小时
2,657小时普通话自然
对话
手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容无预制文本,录音人以自然方式进行
对话
,同时录制
2024-02-23 14:45
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
2,657小时
607小时粤语自然
对话
语音数据【数据堂】
格式16kHz/44.1kHz,16bit,未压缩wav,单声道/双声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多个
2024-02-23 14:44
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
607小时
500小时闽南语自然
对话
手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多个自己熟悉的话题
2024-02-23 14:52
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
500小时
1,136小时美式英语自然
对话
手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容口语类;交互类;家居车载命令类;数字类;新闻类
2024-02-23 15:34
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
1,260小时
1,300万组人机
对话
交互文本数据[数据堂]
数据内容人机
对话
交互文本数据数据规模1,300万采集时间2,017年存储格式txt语言中文
2024-02-23 15:42
应用场景:可用于自然语言理解等任务
数据堂(北京)科技股份有限公司
1300万组
799小时四川方言自然
对话
手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容不指定话题,录音人两两之间以自然说话方式随意交
2024-02-23 14:45
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
799小时
830,276组人人多轮
对话
文本数据[数据堂]
数据内容真实的人人多轮
对话
文本数据规模830,276组采集时间2,015年存储格式txt语言中文用途智能客服及智能交互场景中的多轮
对话
2024-02-23 15:42
应用场景:可用于自然语言理解等任务
数据堂(北京)科技股份有限公司
830,276组
290小时韩语自然
对话
手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多个自己熟悉的话题
2024-02-23 14:52
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
290小时
相关搜索
在
数据提供方
找 对话
在
资讯
找 对话
在
产业范例库
找 对话
在
北京市通用人工智能产业创新伙伴计划
找 对话
今日排行
10条
1
方言
260条
2
数据集
18条
3
对话
2条
4
政策数据集
2条
5
扫地机器人
3条
6
车辆
4条
7
评测
3条
8
精细化
2条
9
科技
本周排行
41条
1
大模型
184条
2
数据堂
2条
3
政策数据集
2条
4
产业链数据集
10条
5
方言
2条
6
医学
5条
7
家居
9条
8
医疗
2条
9
科技
本月排行
41条
1
大模型
184条
2
数据堂
2条
3
政策数据集
2条
4
产业链数据集
10条
5
方言
2条
6
医学
5条
7
家居
9条
8
医疗
2条
9
科技
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能数据标注库平台 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局数字经济专班
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1
合作
咨询
15911018798
数据合作联系电话
微信
联系
微信联系