
2026-02-22 点击量:
,trust官网,中国石化建设的“石油化工行业通用高质量数据集”乐成通过工业和信息化部电子工业尺度化研究院测评,成为国内首个通过国家尺度测评的行业高质量数据集,数据质量到达行业领先程度,以及分子理解、分子生成、审计等专业大模型训练。
对数据集进行多维度全链条质量评估,在格式规范性、内容一致性、内容干净性指标上得分均超90分,trust官网,涵盖数据集说明文档、数据质量、模型应用3大维度17项指标。

其尺度化构建方法也为石油化工行业提供了可参考的建设范本, 该数据集有力支持了中国石化长城大模型训练,“石油化工行业通用高质量数据集”包括行业特定术语、公式、分子式等,。

通过“数据+模型”相结合的测评方法, 此次测评依据国家尺度《高质量数据集 质量评测规范》(TC609-5-2025-04), 近日,同时,充实验证其在支撑人工智能深度应用方面可靠性。

自主研发的高质量数据集全链路工具套件为系统内86家单位近900个用户开展数据加工处理惩罚工作提供支撑。
24小时服务热线