中国信通院此前成立大模型工作组,吸纳成员单位 60 余家,覆盖大模型头部企业、互联网企业、科研院所、电信运营商、金融机构等,围绕技术研讨、产业交流、标准研制、评估测试、案例征集等方面开展多项工作。
中国信通院联合工作组 60 余家单位,共同研制了《大规模预训练模型技术和应用评估方法》系列标准,包含模型开发、模型能力、模型应用和可信要求四个重要部分。目前模型开发、模型能力两部分标准已发布,模型开发标准包括数据构建、模型训练、模型管理、模型部署 4 个能力域、16 个能力子域、60 余个能力项,全面评估研究主体开发大模型的能力。
模型能力标准包含功能丰富度、性能优越度、服务成熟度 3 个评测维度、8 个能力域、30 余个能力项,全面评估大模型的各项技术能力。模型应用标准初步定稿,包含应用丰富度、服务成熟度、运营管理能力 3 个能力域、14 个能力子域、30 余个能力项,综合评估大模型应用成熟度。可信要求标准正在前期研究中,近期将启动编制工作。
从官方获悉,中国科学院自动化研究所、武汉人工智能研究院研发的“紫东太初”大模型,在 2 月 12 日-3 月 3 日参与可信 AI 评测工作,模型开发和模型能力两部分获得 4 + 级评分,成为国内首家通过该项评测的学术机构。