首页
人工智能高质量数据集
数据提供方
手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
按行业查看
大模型
(37)
金融
(7)
医疗
(9)
交通
(6)
工业
(2)
太空探索
(0)
通信
(1)
医药
(6)
安防
(2)
农业
(4)
林业
(1)
建筑业
(4)
零售业
(0)
餐饮业
(1)
旅游业
(1)
环境与地理
(9)
人文历史
(0)
教育业
(5)
体育业
(2)
房地产业
(0)
酒店与住宿
(0)
家居生活
(5)
计算机科学
(3)
人物形态
(45)
机器视觉
(27)
自然语言处理
(22)
游戏动漫
(0)
能源电力
(0)
生物微生物
(0)
语音识别
(77)
动物识别
(3)
商业信息
(8)
您可以
或
中文普通话语音识别库(桌面)
该识别数据在安静办公室环境中完成录制,共有260位发音人参与,录音时长138.9小时,包括130位男性和130位女性,录音语种中文普通
2024-02-23
应用场景:智能客服、智能驾驶、人机交互
北京海天瑞声科技股份有限公司
20.5G
中国古诗文数据库
包含了中国先秦、两汉、魏晋、南北朝、五代、金朝、隋代、唐代、宋代、元代 明代、清代、近代、现代等诗词样例数据:{ [{ id: 1,
2023-11-15
应用场景:文学创作
北京帕依提提科技有限公司
3G
金融知识问答语料库
包含股票、基金、外汇、期货、债券、理财等数据样例数据:{ itemid: 1, title: 股市中牛熊证的基本特点是什么, contents: 股市中
2023-11-17
应用场景:金融
北京帕依提提科技有限公司
10GB
企业管理服务问答语料库
包含企业管理中员工管理、时间管理、目标管理、团队管理、领导力等问答语料。样例数据:{ [{ id: 1, title: 如何保证物流专家系
2023-11-15
应用场景:企业管理
北京帕依提提科技有限公司
500MB
代码数据集
覆盖多种热门编程语言,Java、Python、C++、Javascript、Ruby、Go等,并且经过严格去重,确保数据集中重复数据最小化,提高大语
2023-11-15
应用场景:大模型
北京星尘纪元智能科技有限公司
354GB
问答数据集
涵盖网络问答对数据,包括知识问答、常识问答、娱乐新闻问答等主题,培养模型对问题的深刻理解和准确回答的能力 数据规模:6600
2023-11-15
应用场景:大模型
北京星尘纪元智能科技有限公司
62.87GB
政策数据集
包括国家部委、地方政府等的政策文件、政策研究报告、政策解读文章和政策问答数据 数据规模:14万条 数据格式:xlsx、json
2023-11-15
应用场景:大模型
北京星尘纪元智能科技有限公司
0.28GB
古今文化数据集
包含从辽、隋、明、魏、晋、唐、元、明、清等各朝代的古诗词以及其赏析,古文以及其翻译 数据规模:9万条 数据格式:json
2023-11-15
应用场景:大模型
北京星尘纪元智能科技有限公司
0.35GB
医疗影像数据集
医疗影像是通过医疗系统内成像设备(CT、核磁等)拍摄,形成患者DICOM格式影像数据,同时医生出具报告,形成“诊断报告+影像”交
2023-11-15
应用场景:医疗、AI辅助诊疗
北京云医康医疗科技集团有限公司
100亿张
印尼语多模态语音视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制印尼语native发音人的多
2023-11-15
应用场景:多模态
北京海天瑞声科技股份有限公司
1.3T
美国英语多模态语音视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制美式英语native发音人的
2023-11-15
应用场景:多模态
北京海天瑞声科技股份有限公司
1.5T
全球生物序列数据集
根据核苷酸和蛋白质序列获取到相似序列,以及相关专利、期刊文献和生物公共库中的公开信息;可帮助研发和IP人员进行序列创新信息
2023-11-15
应用场景:生物医药、知识产权、信息技术
智慧芽信息科技(苏州)有限公司
1T
全球药物数据集
借助药物、临床与专利的关联信息,全方位获取行业研发情报与药品临床信息研发人员可以快速获取当前市场的战略布局,迅速调整策略
2023-11-15
应用场景:知识产权、信息技术、生物医药
智慧芽信息科技(苏州)有限公司
5G
全球专利文本数据集
该数据集提供了专利文本数据,包括专利标题、摘要、权利要求、说明书,以及摘要附图,可以了解专利基本信息、保护范围、技术的创
2024-05-13
应用场景:知识产权、金融、信息技术
智慧芽信息科技(苏州)有限公司
文本6T 图片13T
工业车辆动态监控时序数据集
本数据集包罗了全国范围内17万工业车辆,尤其是场内物流设备领域的丰富时序数据,为研究者和工程师提供了深入分析和优化场内物流
2023-11-15
应用场景:工业互联网(智能装备)
爱动超越人工智能科技(北京)有限责任公司
30TB
国家政务问答
面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15
应用场景:政务服务
北京中科汇联科技股份有限公司
31.283M
北京政务事项
面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15
应用场景:政务服务
北京中科汇联科技股份有限公司
44.037M
北京政务问答
面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15
应用场景:政务服务
北京中科汇联科技股份有限公司
52.782M
问问基础评测集
动机:(1)市面上的已有评测集存在依赖国外开源数据的问题,翻译过来的题目存在文化bias,涉及语言类的题目缺乏汉语视角,不能
2023-11-15
应用场景:大语言模型测试集
出门问问信息科技有限公司
610条
医学图片数据集
有关医学、病症的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
100T
家居室内图片数据集
有关自然风光的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
运动图片数据集
有关健身、运动等人物和场景的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
肖像图片数据集
有关人物肖像的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
建筑图片数据集
有关城市建筑的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
生活方式图片数据集
有关生活方式的图像数据,包含高清图片、说明、标签等,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
商务图片数据集
有关商务办公、金融等场景的图像数据,包含高清图片、说明、标签等,包含高清图片、说明、标签等 数据规模: 100万条数据记录
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
植物图片数据集
有关植物、花的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
动物图片数据集
有有关动物、宠物的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
人物图片数据集
有关人物的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
美食图片数据集
有关美食的摄影图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
搜索排行
184条
1
数据堂
23条
2
人脸
10条
3
方言
2条
4
扫地机器人
2条
5
电梯
41条
6
大模型
2条
7
政策数据集
3条
8
印尼语
4条
9
儿童
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能数据标注库平台 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局数字经济专班
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1
合作
咨询
15911018798
数据合作联系电话
微信
联系
微信联系