首页
人工智能高质量数据集
数据提供方
手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
搜索
您可以
或
中文普通话
语音
识别库(桌面)
该识别数据在安静办公室环境中完成录制,共有260位发音人参与,录音时长138.9小时,包括130位男性和130位女性,录音语种中文普通
2024-02-23 15:39
应用场景:智能客服、智能驾驶、人机交互
北京海天瑞声科技股份有限公司
20.5G
印尼语多模态
语音
视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制印尼语native发音人的多
2023-11-15 19:27
应用场景:多模态
北京海天瑞声科技股份有限公司
1.3T
美国英语多模态
语音
视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制美式英语native发音人的
2023-11-15 19:27
应用场景:多模态
北京海天瑞声科技股份有限公司
1.5T
多领域
语音
交互大模型高质量
语音
评测数据集
涵盖26个领域,真实场景音频数据集,可作为模型评测数据集,应用于
语音
对话与听觉大模型的研究。 数据规模: 6GB 数据格式:wa
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
6GB
人机对话高质量
语音
评测数据集
涵盖7类对话场景,自然表达的音频数据集,可作为模型评测数据集,应用于
语音
对话与听觉大模型的研究。 数据规模:47056条 数据
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
30GB
语音
复刻大模型高品质数据集-中文
本数据集招募了18226名说话者,男女近似1比1。语料覆盖领域多样,包含了对话、唤醒词、控制命令、数字串、新闻论坛、书面语。所
2023-11-15 19:43
应用场景:通用语音大模型
北京晴数智慧科技有限公司
2.6 TB
智能会议场景高质量对话式
语音
数据集
涵盖956场真实会议场景,多人多轮次对话音频数据集,可应用于
语音
对话与听觉大模型的研究。数据规模:666小时数据格式:WAV、txt
2023-09-03 13:53
应用场景:语料语义
北京希尔贝壳科技有限公司
3.2TB
大模型方言口语
语音
数据集
涵盖17种方言口语,自然表达的音频数据集,可应用于
语音
对话与听觉大模型的研究。数据规模:12000小时数据格式:WAV
2023-09-03 13:52
应用场景:语料语义
北京希尔贝壳科技有限公司
1TB
大模型多语种
语音
识别数据集
来自世界10多个国家的20万小时音频文本,主要包含中、英、维、藏等国内重点安防关注领域;数据规模20万+小时的音频与对应标注文
2023-09-12 23:53
应用场景:国防安全
中译语通科技股份有限公司
20T
藏语
语音
文本句对数据集
含卫藏、安多、康巴三种藏语方言的平行语料和
语音
对应文本的多模态数据集。数据规模:2000万秒350万条数据格式:文件
2023-09-02 13:19
应用场景:语音识别
网智天元科技集团股份有限公司
480GB
大模型多语种
语音
数据集
该数据集包含20万小时多人对话/单人的高质量工程化人机交互场景
语音
数据,覆盖汉语、英语、日语等200个语种和方言,可用于通用语
2023-09-02 13:23
应用场景:人机交互
北京海天瑞声科技股份有限公司
28TB
531小时麦克风手机采集车载噪音数据【数据堂】
格式麦克风 32kHz 32bit,wav,单声道;手机 16kHz 16bit,wav,单声道数据特点包含 5 类条件,每类包含多种情景;每段音频对应
2024-02-23 15:39
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
531小时
769小时法语手机采集
语音
数据【数据堂】
格式16kHz,16bit,无压缩wav,单声道;录音环境相对安静的室内,无回声录音内容口语类;交互类;家居车载命令类;数字类;新闻
2024-02-23 15:38
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
769小时
178小时中国儿童麦克风
语音
采集数据【数据堂】
格式44.1kHz, 16bit,未压缩wav,单声道录音环境相对安静的室内语言普通话录音内容儿童教科书;故事书;数字人员739名中国儿童
2024-02-23 15:41
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
178小时
20.1小时中文男声客服合成库【数据堂】
格式48kHz,16bit,wav,单声道录音环境专业录音棚环境录音内容客服场景的录音文本,音节音素音调都进行了平衡覆盖人员男性,20~
2024-02-23 14:53
应用场景:语音合成
数据堂(北京)科技股份有限公司
20.1
1,505小时普通话手机采集
语音
数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内;普通环境,包含不影响
语音
识别的噪音录音内容30万条口语化句子人
2024-02-23 14:46
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
1,505小时
67小时东北方言手机采集
语音
数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内;普通环境,包含不影响
语音
识别的噪音录音内容客户咨询(覆盖30多
2024-02-23 14:52
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
67小时
197小时韩语手机采集
语音
数据_朗读【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内;录音内容经济,娱乐,新闻,口语,数字,字母人员韩国人,朝鲜人
2024-02-23 14:51
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
197小时
1,003人情感视频数据【数据堂】
数据规模1,003人,一人采集一段或几段带有多种情感的视频人员分布人种分布:黄种人232人,白种人614人,黑种人157人 ;性别分布
2024-02-23 14:37
应用场景:可用于情感识别、情感分析等任务。
数据堂(北京)科技股份有限公司
1003人
1,351小时普通话自然对话
语音
数据【数据堂】
格式16kHz/44.1kHz, 16bit,未压缩wav,单声道/双声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多
2024-02-23 14:37
应用场景:语音识别;声纹识别
数据堂(北京)科技股份有限公司
1,351小时
«上一页
1
2
…
3
…
4
5
下一页»
共84条/5页
相关搜索
在
数据提供方
找 语音
在
资讯
找 语音
在
产业范例库
找 语音
在
北京市通用人工智能产业创新伙伴计划
找 语音
今日排行
3条
1
动物
41条
2
大模型
84条
3
语音
2条
4
政策数据集
2条
5
扫地机器人
4条
6
儿童
23条
7
人脸
5条
8
问答
2条
9
舆情
本周排行
2条
1
政策数据集
4条
2
儿童
2条
3
扫地机器人
3条
4
动物
23条
5
人脸
41条
6
大模型
184条
7
数据堂
10条
8
方言
10条
9
车
本月排行
2条
1
政策数据集
4条
2
儿童
2条
3
扫地机器人
3条
4
动物
23条
5
人脸
41条
6
大模型
184条
7
数据堂
10条
8
方言
10条
9
车
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能数据标注库平台 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局数字经济专班
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1
合作
咨询
15911018798
数据合作联系电话
微信
联系
微信联系