返回
大模型
中文高质量大模型预训练文本数据集
500GB
数据堂(北京)科技股份有限公司
大模型中文千万轮对话数据集
2GB
北京海天瑞声科技股份有限公司
高品质、大规模、多语种双语平行语料数据集
1.6T
中译语通科技股份有限公司
生成式对话大模型精调语料
30G
中译语通科技股份有限公司
声誉风险事件数据集
40TB
网智天元科技集团股份有限公司
藏语语音文本句对数据集
480GB
网智天元科技集团股份有限公司
多语言多模态视频文本对齐数据集
20TB
数据堂(北京)科技股份有限公司
超大规模中文多领域高质量多轮对话数据集
18TB
北京晴数智慧科技有限公司
大模型多语种语音数据集
28TB
北京海天瑞声科技股份有限公司
北京市中小企业惠企政策数据集
108GB
北京市中小企业服务中心
产业要素数据集
60TB
拓尔思信息技术股份有限公司
产业风险数据集
40TB
拓尔思信息技术股份有限公司
中国科学引文数据库数据集
60GB
中国科学院文献情报中心
科技文献挖掘语义标注数据集
20GB
中国科学院文献情报中心
国家法律法规语料库
2.58GB
人民网科技(北京)有限公司
两会参政议政建言数据集
2.6GB
北京市科学技术研究院
人民日报语料库
0.8GB
人民网科技(北京)有限公司
2
/2
下一页
上一页
首页
尾页
首页
数据集
我的
更多