首页
人工智能高质量数据集
数据提供方
手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
搜索
您可以
或
中国古诗文数据库
包含了中国先秦、两汉、魏晋、南北朝、五代、金朝、隋代、唐代、宋代、元代 明代、清代、近代、现代等诗词样例数据:{ [{ id: 1,
2023-11-15 21:25
应用场景:文学创作
北京帕依提提科技有限公司
3G
企业管理服务问答语料库
包含企业管理中员工管理、时间管理、目标管理、团队管理、领导力等问答语料。样例数据:{ [{ id: 1, title: 如何保证物流专家系
2023-11-15 21:27
应用场景:企业管理
北京帕依提提科技有限公司
500MB
代码数据集
覆盖多种热门编程语言,Java、Python、C++、Javascript、Ruby、Go等,并且经过严格去重,确保数据集中重复数据最小化,提高大语
2023-11-15 19:27
应用场景:大模型
北京星尘纪元智能科技有限公司
354GB
问答数据集
涵盖网络问答对数据,包括知识问答、常识问答、娱乐新闻问答等主题,培养模型对问题的深刻理解和准确回答的能力 数据规模:6600
2023-11-15 19:27
应用场景:大模型
北京星尘纪元智能科技有限公司
62.87GB
政策数据集
包括国家部委、地方政府等的政策文件、政策研究报告、政策解读文章和政策问答数据 数据规模:14万条 数据格式:xlsx、json
2023-11-15 19:27
应用场景:大模型
北京星尘纪元智能科技有限公司
0.28GB
古今文化数据集
包含从辽、隋、明、魏、晋、唐、元、明、清等各朝代的古诗词以及其赏析,古文以及其翻译 数据规模:9万条 数据格式:json
2023-11-15 19:27
应用场景:大模型
北京星尘纪元智能科技有限公司
0.35GB
印尼语多模态语音视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制印尼语native发音人的多
2023-11-15 19:27
应用场景:多模态
北京海天瑞声科技股份有限公司
1.3T
全球生物序列数据集
根据核苷酸和蛋白质序列获取到相似序列,以及相关专利、期刊文献和生物公共库中的公开信息;可帮助研发和IP人员进行序列创新信息
2023-11-15 19:48
应用场景:生物医药、知识产权、信息技术
智慧芽信息科技(苏州)有限公司
1T
国家政务问答
面向政务服务
大模型
-慧政,是中科汇联自主研发的AiGCP智能生成
大模型
平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15 19:53
应用场景:政务服务
北京中科汇联科技股份有限公司
31.283M
北京政务事项
面向政务服务
大模型
-慧政,是中科汇联自主研发的AiGCP智能生成
大模型
平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15 19:53
应用场景:政务服务
北京中科汇联科技股份有限公司
44.037M
北京政务问答
面向政务服务
大模型
-慧政,是中科汇联自主研发的AiGCP智能生成
大模型
平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国
2023-11-15 19:53
应用场景:政务服务
北京中科汇联科技股份有限公司
52.782M
问问基础评测集
动机:(1)市面上的已有评测集存在依赖国外开源数据的问题,翻译过来的题目存在文化bias,涉及语言类的题目缺乏汉语视角,不能
2023-11-15 21:11
应用场景:大语言模型测试集
出门问问信息科技有限公司
610条
多领域语音交互
大模型
高质量语音评测数据集
涵盖26个领域,真实场景音频数据集,可作为模型评测数据集,应用于语音对话与听觉
大模型
的研究。 数据规模: 6GB 数据格式:wa
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
6GB
人机对话高质量语音评测数据集
涵盖7类对话场景,自然表达的音频数据集,可作为模型评测数据集,应用于语音对话与听觉
大模型
的研究。 数据规模:47056条 数据
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
30GB
中文
大模型
垂直领域图像描述数据集
14万张图像,图像内容包括但不限于人脸、车辆、人体行为、手势、中文OCR、场景、监控人体。每张图像配备一段详细中文文本描述。
2023-11-15 19:27
应用场景:大模型图文生成
数据堂(北京)科技股份有限公司
35G
通用场景图像描述基础多模态数据集
120万张图像,图像内容包括但不限于风景、动物、食物、花卉树木、人物、汽车、运动、建筑、卡通动漫、影视剧、商标logo、表格文
2023-11-15 19:27
应用场景:大模型图文生成
数据堂(北京)科技股份有限公司
95G
中文
大模型
安全性评测数据集
中文
大模型
需符合国家相关安全法规要求,本数据集包括政治、暴力、色情、脏话、诱导等多类do-not-answer问题,用于评测和提升大
2023-11-15 19:27
应用场景:大模型评测
数据堂(北京)科技股份有限公司
100MB
语音复刻
大模型
高品质数据集-中文
本数据集招募了18226名说话者,男女近似1比1。语料覆盖领域多样,包含了对话、唤醒词、控制命令、数字串、新闻论坛、书面语。所
2023-11-15 19:43
应用场景:通用语音大模型
北京晴数智慧科技有限公司
2.6 TB
财、税、法文本数据集
数据集:财税文本数据集数据概述:该数据集包含全国各地区政策、新闻、财税类知识、问答等信息数据规模:260万条数据格式:JSON
2024-03-07 10:02
应用场景:财务大模型
北京帕依提提科技有限公司
3GB
“科情头条”全球科技动态数据集
来自世界主要国家2200余个官方信源、经过翻译审校的全球科技前沿信息。数据规模:799.46万条数据记录、23.21万幅图片数据类型:
2023-09-12 23:51
应用场景:大模型
北京市科学技术研究院
1.03TB
«上一页
1
2
…
3
下一页»
共41条/3页
相关搜索
在
数据提供方
找 大模型
在
资讯
找 大模型
在
产业范例库
找 大模型
在
北京市通用人工智能产业创新伙伴计划
找 大模型
您是不是在找?
约2条
中文大模型
今日排行
41条
1
大模型
2条
2
扫地机器人
3条
3
动物
23条
4
人脸
2条
5
舆情
10条
6
方言
2条
7
政策数据集
4条
8
儿童
10条
9
车
本周排行
2条
1
政策数据集
4条
2
儿童
2条
3
扫地机器人
3条
4
动物
23条
5
人脸
41条
6
大模型
10条
7
方言
10条
8
车
2条
9
舆情
本月排行
2条
1
政策数据集
4条
2
儿童
2条
3
扫地机器人
3条
4
动物
23条
5
人脸
41条
6
大模型
10条
7
方言
10条
8
车
2条
9
舆情
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能数据标注库平台 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局数字经济专班
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1
合作
咨询
15911018798
数据合作联系电话
微信
联系
微信联系