首页
人工智能高质量数据集
数据提供方
手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
大模型
按行业查看
大模型
(37)
金融
(7)
医疗
(9)
交通
(6)
工业
(2)
太空探索
(0)
通信
(1)
医药
(6)
安防
(2)
农业
(4)
林业
(1)
建筑业
(4)
零售业
(0)
餐饮业
(1)
旅游业
(1)
环境与地理
(9)
人文历史
(0)
教育业
(5)
体育业
(2)
房地产业
(0)
酒店与住宿
(0)
家居生活
(5)
计算机科学
(3)
人物形态
(45)
机器视觉
(27)
自然语言处理
(22)
游戏动漫
(0)
能源电力
(0)
生物微生物
(0)
语音识别
(77)
动物识别
(3)
商业信息
(8)
您可以
或
更新时间
1天内
3天内
7天内
15天内
30天内
中国古诗文数据库
包含了中国先秦、两汉、魏晋、南北朝、五代、金朝、隋代、唐代、宋代、元代 明代、清代、近代、现代等诗词样例数据:{ [{ id: 1,
2023-11-15 21:25
应用场景:文学创作
北京帕依提提科技有限公司
3G
企业管理服务问答语料库
包含企业管理中员工管理、时间管理、目标管理、团队管理、领导力等问答语料。样例数据:{ [{ id: 1, title: 如何保证物流专家系
2023-11-15 21:27
应用场景:企业管理
北京帕依提提科技有限公司
500MB
代码数据集
覆盖多种热门编程语言,Java、Python、C++、Javascript、Ruby、Go等,并且经过严格去重,确保数据集中重复数据最小化,提高大语
2023-11-15 19:27
应用场景:大模型
北京星尘纪元智能科技有限公司
354GB
问答数据集
涵盖网络问答对数据,包括知识问答、常识问答、娱乐新闻问答等主题,培养模型对问题的深刻理解和准确回答的能力 数据规模:6600
2023-11-15 19:27
应用场景:大模型
北京星尘纪元智能科技有限公司
62.87GB
政策数据集
包括国家部委、地方政府等的政策文件、政策研究报告、政策解读文章和政策问答数据 数据规模:14万条 数据格式:xlsx、json
2023-11-15 19:27
应用场景:大模型
北京星尘纪元智能科技有限公司
0.28GB
古今文化数据集
包含从辽、隋、明、魏、晋、唐、元、明、清等各朝代的古诗词以及其赏析,古文以及其翻译 数据规模:9万条 数据格式:json
2023-11-15 19:27
应用场景:大模型
北京星尘纪元智能科技有限公司
0.35GB
印尼语多模态语音视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制印尼语native发音人的多
2023-11-15 19:27
应用场景:多模态
北京海天瑞声科技股份有限公司
1.3T
全球生物序列数据集
根据核苷酸和蛋白质序列获取到相似序列,以及相关专利、期刊文献和生物公共库中的公开信息;可帮助研发和IP人员进行序列创新信息
2023-11-15 19:48
应用场景:生物医药、知识产权、信息技术
智慧芽信息科技(苏州)有限公司
1T
国家政务问答
面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15 19:53
应用场景:政务服务
北京中科汇联科技股份有限公司
31.283M
北京政务事项
面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15 19:53
应用场景:政务服务
北京中科汇联科技股份有限公司
44.037M
北京政务问答
面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15 19:53
应用场景:政务服务
北京中科汇联科技股份有限公司
52.782M
问问基础评测集
动机:(1)市面上的已有评测集存在依赖国外开源数据的问题,翻译过来的题目存在文化bias,涉及语言类的题目缺乏汉语视角,不能
2023-11-15 21:11
应用场景:大语言模型测试集
出门问问信息科技有限公司
610条
多领域语音交互大模型高质量语音评测数据集
涵盖26个领域,真实场景音频数据集,可作为模型评测数据集,应用于语音对话与听觉大模型的研究。 数据规模: 6GB 数据格式:wa
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
6GB
人机对话高质量语音评测数据集
涵盖7类对话场景,自然表达的音频数据集,可作为模型评测数据集,应用于语音对话与听觉大模型的研究。 数据规模:47056条 数据
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
30GB
中文大模型垂直领域图像描述数据集
14万张图像,图像内容包括但不限于人脸、车辆、人体行为、手势、中文OCR、场景、监控人体。每张图像配备一段详细中文文本描述。
2023-11-15 19:27
应用场景:大模型图文生成
数据堂(北京)科技股份有限公司
35G
通用场景图像描述基础多模态数据集
120万张图像,图像内容包括但不限于风景、动物、食物、花卉树木、人物、汽车、运动、建筑、卡通动漫、影视剧、商标logo、表格文
2023-11-15 19:27
应用场景:大模型图文生成
数据堂(北京)科技股份有限公司
95G
中文大模型安全性评测数据集
中文大模型需符合国家相关安全法规要求,本数据集包括政治、暴力、色情、脏话、诱导等多类do-not-answer问题,用于评测和提升大
2023-11-15 19:27
应用场景:大模型评测
数据堂(北京)科技股份有限公司
100MB
语音复刻大模型高品质数据集-中文
本数据集招募了18226名说话者,男女近似1比1。语料覆盖领域多样,包含了对话、唤醒词、控制命令、数字串、新闻论坛、书面语。所
2023-11-15 19:43
应用场景:通用语音大模型
北京晴数智慧科技有限公司
2.6 TB
财、税、法文本数据集
数据集:财税文本数据集数据概述:该数据集包含全国各地区政策、新闻、财税类知识、问答等信息数据规模:260万条数据格式:JSON
2024-03-07 10:02
应用场景:财务大模型
北京帕依提提科技有限公司
3GB
“科情头条”全球科技动态数据集
来自世界主要国家2200余个官方信源、经过翻译审校的全球科技前沿信息。数据规模:799.46万条数据记录、23.21万幅图片数据类型:
2023-09-12 23:51
应用场景:大模型
北京市科学技术研究院
1.03TB
«上一页
1
2
下一页»
共37条/2页
搜索排行
184条
1
数据堂
23条
2
人脸
10条
3
方言
2条
4
扫地机器人
2条
5
电梯
41条
6
大模型
2条
7
政策数据集
3条
8
印尼语
4条
9
儿童
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能数据标注库平台 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局数字经济专班
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1
合作
咨询
15911018798
数据合作联系电话
微信
联系
微信联系