覆盖多种热门编程语言,Java、Python、C++、Javascript、Ruby、Go等,并且经过严格去重,确保数据集中重复数据最小化,提高大语言模型的逻辑推理能力
数据规模: 6000万条
数据格式:json