首页
人工智能高质量数据集
数据提供方
手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
搜索
您可以
或
人物图片
数据集
有关人物的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15 19:41
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
美食图片
数据集
有关美食的摄影图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15 19:41
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
城市风光图片
数据集
有关城市风光的摄影照片数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式: jpg
2023-11-15 19:54
应用场景:人工智能
高品未来(北京)数字文化有限公司
5T
自然风光图片
数据集
有关自然风光的图像数据,包含高清图片、说明、标签等 数据规模: 100万条数据记录、 100 万副图片 数据格式:jpg
2023-11-15 19:54
应用场景:数据库+文本+图片
高品未来(北京)数字文化有限公司
5T
多领域语音交互大模型高质量语音评测
数据集
涵盖26个领域,真实场景音频
数据集
,可作为模型评测
数据集
,应用于语音对话与听觉大模型的研究。 数据规模: 6GB 数据格式:wa
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
6GB
人机对话高质量语音评测
数据集
涵盖7类对话场景,自然表达的音频
数据集
,可作为模型评测
数据集
,应用于语音对话与听觉大模型的研究。 数据规模:47056条 数据
2023-11-15 19:27
应用场景:人工智能大模型研发服务、语音交互能力评测
北京希尔贝壳科技有限公司
30GB
智慧网络
数据集
围绕网元智能、运维智能、服务智能三大方向建设,是业界首个涵盖无线信道、基站、云网、核心网、哑资源等多领域,支持感知、诊断
2023-11-15 21:15
应用场景:智慧网络(/网络智能化/自智网络/通信+AI)
中国移动通信集团有限公司
100G+
舆情
数据集
涵盖新闻、短视频、微博、微信、APP、自媒体等媒体渠道,每天采集入库的泛舆情数据超过1亿条,在此基础上,精细化数据维度,打标
2023-11-15 19:27
应用场景:舆情
拓尔思信息技术股份有限公司
200T
企业信用信息
数据集
国内2.1亿企业数据,全球3亿企业数据,包含工商、司法、行业、资质动态、财务等信息 数据规模:72亿条数据 数据格式:Mysql、Mo
2023-11-15 20:09
应用场景:企业、金融、政府业务服务
格兰德信用管理(北京)有限公司
2TB
中文大模型垂直领域图像描述
数据集
14万张图像,图像内容包括但不限于人脸、车辆、人体行为、手势、中文OCR、场景、监控人体。每张图像配备一段详细中文文本描述。
2023-11-15 19:27
应用场景:大模型图文生成
数据堂(北京)科技股份有限公司
35G
通用场景图像描述基础多模态
数据集
120万张图像,图像内容包括但不限于风景、动物、食物、花卉树木、人物、汽车、运动、建筑、卡通动漫、影视剧、商标logo、表格文
2023-11-15 19:27
应用场景:大模型图文生成
数据堂(北京)科技股份有限公司
95G
中文大模型安全性评测
数据集
中文大模型需符合国家相关安全法规要求,本
数据集
包括政治、暴力、色情、脏话、诱导等多类do-not-answer问题,用于评测和提升大
2023-11-15 19:27
应用场景:大模型评测
数据堂(北京)科技股份有限公司
100MB
语音复刻大模型高品质
数据集
-中文
本
数据集
招募了18226名说话者,男女近似1比1。语料覆盖领域多样,包含了对话、唤醒词、控制命令、数字串、新闻论坛、书面语。所
2023-11-15 19:43
应用场景:通用语音大模型
北京晴数智慧科技有限公司
2.6 TB
财、税、法文本
数据集
数据集
:财税文本
数据集
数据概述:该
数据集
包含全国各地区政策、新闻、财税类知识、问答等信息数据规模:260万条数据格式:JSON
2024-03-07 10:02
应用场景:财务大模型
北京帕依提提科技有限公司
3GB
“科情头条”全球科技动态
数据集
来自世界主要国家2200余个官方信源、经过翻译审校的全球科技前沿信息。数据规模:799.46万条数据记录、23.21万幅图片数据类型:
2023-09-12 23:51
应用场景:大模型
北京市科学技术研究院
1.03TB
中文高质量大模型预训练文本
数据集
文本内容涵盖80多个学科领域,进行了准确的标签分类和严格的内容清洗。数据规模:1亿篇数据类型:txt
2023-09-12 23:51
应用场景:大模型
数据堂(北京)科技股份有限公司
500GB
大模型中文千万轮对话
数据集
该
数据集
是一个上千万轮的双人对话的高质量工程化
数据集
,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。数据规模
2023-09-12 23:52
应用场景:大模型
北京海天瑞声科技股份有限公司
2GB
高品质、大规模、多语种双语平行语料
数据集
来自于科技服务、军事、国防安全、金融、医疗等领域的专利、论文、科技文献等资料整理的双语平行语料数据规模80 亿对数据格式:
2023-09-03 13:58
应用场景:科技服务、军事、国防安全、金融、医疗等领域
中译语通科技股份有限公司
1.6T
绿色投资标的评估
数据集
是根据绿色投资相关标准和框架形成的评估
数据集
,该
数据集
包含各类绿色相关评估标签和信息语料,有助于构建绿色投资标的评估模型
2023-09-03 13:56
应用场景:金融
网智天元科技集团股份有限公司
20G
区域产业链
数据集
说明:全国信息化、数字化建设项目公开信息数据。同时,对文本进行了清洗,形成了结构化字段。 字段:包括建设单位、项目名称、
2023-09-03 13:56
应用场景:金融、政务
网智天元科技集团股份有限公司
500G
«上一页
1
2
…
3
4
下一页»
共76条/4页
相关搜索
在
数据提供方
找 数据集
在
资讯
找 数据集
在
产业范例库
找 数据集
在
北京市通用人工智能产业创新伙伴计划
找 数据集
您是不是在找?
约2条
政策数据集
约2条
产业链数据集
约2条
多模态数据集
约3条
评测数据集
约3条
文本数据集
今日排行
5条
1
问答
2条
2
政策数据集
33条
3
图
260条
4
数据集
18条
5
对话
2条
6
产业链数据集
4条
7
新闻
4条
8
农业
3条
9
精细化
本周排行
5条
1
问答
2条
2
政策数据集
2条
3
自动驾驶
260条
4
数据集
18条
5
对话
4条
6
工业
277条
7
数据
2条
8
扫地机器人
2条
9
药品
本月排行
5条
1
问答
2条
2
政策数据集
2条
3
自动驾驶
260条
4
数据集
18条
5
对话
4条
6
工业
277条
7
数据
2条
8
扫地机器人
2条
9
药品
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能数据标注库平台 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局数字经济专班
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1
合作
咨询
15911018798
数据合作联系电话
微信
联系
微信联系