首页
人工智能高质量数据集
数据提供方
手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
搜索
您可以
或
动物图片
数据
集
有有关动物、宠物的图像
数据
,包含高清图片、说明、标签等
数据
规模: 100万条
数据
记录、 100 万副图片
数据
格式: jpg
2023-11-15 19:41
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
人物图片
数据
集
有关人物的图像
数据
,包含高清图片、说明、标签等
数据
规模: 100万条
数据
记录、 100 万副图片
数据
格式: jpg
2023-11-15 19:41
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
美食图片
数据
集
有关美食的摄影图像
数据
,包含高清图片、说明、标签等
数据
规模: 100万条
数据
记录、 100 万副图片
数据
格式: jpg
2023-11-15 19:41
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
城市风光图片
数据
集
有关城市风光的摄影照片
数据
,包含高清图片、说明、标签等
数据
规模: 100万条
数据
记录、 100 万副图片
数据
格式: jpg
2023-11-15 19:54
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
自然风光图片
数据
集
有关自然风光的图像
数据
,包含高清图片、说明、标签等
数据
规模: 100万条
数据
记录、 100 万副图片
数据
格式:jpg
2023-11-15 19:54
应用场景:数据库+文本+图片
高品未来(北京)数字文化有限公司
5T
多领域语音交互大模型高质量语音评测
数据
集
涵盖26个领域,真实场景音频
数据
集,可作为模型评测
数据
集,应用于语音对话与听觉大模型的研究。
数据
规模: 6GB
数据
格式:wa
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
6GB
人机对话高质量语音评测
数据
集
涵盖7类对话场景,自然表达的音频
数据
集,可作为模型评测
数据
集,应用于语音对话与听觉大模型的研究。
数据
规模:47056条
数据
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
30GB
智慧网络
数据
集
围绕网元智能、运维智能、服务智能三大方向建设,是业界首个涵盖无线信道、基站、云网、核心网、哑资源等多领域,支持感知、诊断
2023-11-15 21:15
应用场景:智慧网络(/网络智能化/自智网络/通信+AI)
中国移动通信集团有限公司
100G+
舆情
数据
集
涵盖新闻、短视频、微博、微信、APP、自媒体等媒体渠道,每天采集入库的泛舆情
数据
超过1亿条,在此基础上,精细化
数据
维度,打标
2023-11-15 19:27
应用场景:舆情
拓尔思信息技术股份有限公司
200T
企业信用信息
数据
集
国内2.1亿企业
数据
,全球3亿企业
数据
,包含工商、司法、行业、资质动态、财务等信息
数据
规模:72亿条
数据
数据
格式:Mysql、Mo
2023-11-15 20:09
应用场景:企业、金融、政府业务服务
格兰德信用管理(北京)有限公司
2TB
中文大模型垂直领域图像描述
数据
集
14万张图像,图像内容包括但不限于人脸、车辆、人体行为、手势、中文OCR、场景、监控人体。每张图像配备一段详细中文文本描述。
2023-11-15 19:27
应用场景:大模型图文生成
数据堂(北京)科技股份有限公司
35G
通用场景图像描述基础多模态
数据
集
120万张图像,图像内容包括但不限于风景、动物、食物、花卉树木、人物、汽车、运动、建筑、卡通动漫、影视剧、商标logo、表格文
2023-11-15 19:27
应用场景:大模型图文生成
数据堂(北京)科技股份有限公司
95G
中文大模型安全性评测
数据
集
中文大模型需符合国家相关安全法规要求,本
数据
集包括政治、暴力、色情、脏话、诱导等多类do-not-answer问题,用于评测和提升大
2023-11-15 19:27
应用场景:大模型评测
数据堂(北京)科技股份有限公司
100MB
语音复刻大模型高品质
数据
集-中文
本
数据
集招募了18226名说话者,男女近似1比1。语料覆盖领域多样,包含了对话、唤醒词、控制命令、数字串、新闻论坛、书面语。所
2023-11-15 19:43
应用场景:通用语音大模型
北京晴数智慧科技有限公司
2.6 TB
全网实时舆情
数据
与社交媒体
数据
中国互联网上公开
数据
,包含:新闻网站、微信公众号,知乎、天涯、小红书等论坛,抖音快手等短视频平台,资讯类APP等全平台文本
2024-05-13 14:04
应用场景:舆情、新闻资讯
北京清博智能科技有限公司
1000TB
财、税、法文本
数据
集
数据
集:财税文本
数据
集
数据
概述:该
数据
集包含全国各地区政策、新闻、财税类知识、问答等信息
数据
规模:260万条
数据
格式:JSON
2024-03-07 10:02
应用场景:财务大模型
北京帕依提提科技有限公司
3GB
“科情头条”全球科技动态
数据
集
来自世界主要国家2200余个官方信源、经过翻译审校的全球科技前沿信息。
数据
规模:799.46万条
数据
记录、23.21万幅图片
数据
类型:
2023-09-12 23:51
应用场景:大模型
北京市科学技术研究院
1.03TB
中文高质量大模型预训练文本
数据
集
文本内容涵盖80多个学科领域,进行了准确的标签分类和严格的内容清洗。
数据
规模:1亿篇
数据
类型:txt
2023-09-12 23:51
应用场景:大模型
数据堂(北京)科技股份有限公司
500GB
大模型中文千万轮对话
数据
集
该
数据
集是一个上千万轮的双人对话的高质量工程化
数据
集,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。
数据
规模
2023-09-12 23:52
应用场景:大模型
北京海天瑞声科技股份有限公司
2GB
高品质、大规模、多语种双语平行语料
数据
集
来自于科技服务、军事、国防安全、金融、医疗等领域的专利、论文、科技文献等资料整理的双语平行语料
数据
规模80 亿对
数据
格式:
2023-09-03 13:58
应用场景:科技服务、军事、国防安全、金融、医疗等领域
中译语通科技股份有限公司
1.6T
«上一页
1
2
…
3
4
5
6
7
8
9
…
13
14
下一页»
共273条/14页
相关搜索
在
数据提供方
找 数据
在
资讯
找 数据
在
产业范例库
找 数据
在
北京市通用人工智能产业创新伙伴计划
找 数据
您是不是在找?
约260条
数据集
约2条
政策数据集
约184条
数据堂
约2条
产业链数据集
约2条
多模态数据集
约3条
评测数据集
约3条
文本数据集
今日排行
2条
1
自动驾驶
260条
2
数据集
6条
3
科
2条
4
扫地机器人
3条
5
车辆
2条
6
药品
2条
7
产业链数据集
5条
8
问答
184条
9
数据堂
本周排行
5条
1
问答
2条
2
自动驾驶
2条
3
病
33条
4
图
4条
5
科学
2条
6
药品
2条
7
产业链数据集
6条
8
科
3条
9
政策
本月排行
84条
1
语音
5条
2
问答
2条
3
自动驾驶
2条
4
病
33条
5
图
4条
6
科学
2条
7
药品
2条
8
产业链数据集
6条
9
科
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能数据标注库平台 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局数字经济专班
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1
合作
咨询
15911018798
数据合作联系电话
微信
联系
微信联系