代码数据集

数据规模: 6000万条
数据大小: 354GB
应用场景: 大模型
数据类型: 文本
最后更新: 2023-11-15 19:27
 
数据简介

覆盖多种热门编程语言,Java、Python、C++、Javascript、Ruby、Go等,并且经过严格去重,确保数据集中重复数据最小化,提高大语言模型的逻辑推理能力


数据规模:


6000万条


数据格式:
json

0相关评论
数据提供方信息查看主页

北京星尘纪元智能科技有限公司

星尘数据,是一家提供数据标注服务和AI数据中台系统的SaaS公司。我们为全球人工智能企业提供服务,为计算机视觉、语音识别、NLP任务提供了高质量的训练数据
  • 537
更多>本企业其它数据
古今文化数据集 政策数据集 问答数据集 代码数据集

北京人工智能高质量数据集服务平台

创新数据服务,积极推进数据拓展应用

关于我们

联系我们

合作
咨询

15911018798
数据合作联系电话

微信
联系

微信联系