盘古大模型加持，润医医疗大模型在MedBench评测中再获双料冠军

C114通信网

专业评测榜单

自测榜单

6月18日，医疗大模型评测平台MedBench发布新版评测榜单，润达医疗与华为基于盘古大模型创新研发的润医医疗大模型在专业评测榜单和自测榜单中再次登顶，分别以96.4分和93.2分荣膺双料冠军。

尤为瞩目的是，润医医疗大模型在自测榜单的医学知识问答、医学语言生成、医学语言理解、医疗安全伦理四个维度分别取得91.2、85.1、123.1、106.6的优异成绩，在参评团队激烈的竞争中脱颖而出。在专业评测榜单中，模型同样表现不俗，在医学知识问答、复杂医学推理、医学语言理解和医疗安全伦理能力评测中分别获得87.7、84.8、122.4、98.7的出色成绩，荣登榜首，成为参评医疗大模型中的佼佼者。

润医医疗大模型在2025华为开发者大会备受瞩目

6月20日，在2025华为开发者大会（HDC）上，华为常务董事、华为云CEO张平安在主题演讲中特别提及润医医疗大模型，对其在医疗AI领域取得的突破性进展给予高度评价。张平安在演讲中引用了MedBench最新评测结果，充分肯定了基于盘古大模型强大底座能力，通过医疗领域专业增训打造的润医医疗大模型所展现的技术实力和创新成果。这一成就不仅体现了盘古大模型团队在医疗AI垂域的专业能力，更彰显了盘古大模型作为通用人工智能底座的强大实力，进一步确立了润医医疗大模型在行业内的领先地位和影响力。

MedBench作为中文医疗大模型权威评测平台，由上海人工智能实验室、上海市数字医学创新中心联合多家机构打造，已成为全球医疗AI领域重要参照标准之一。目前，平台已累计评测全球百余医疗大模型，从医学知识问答、医学语言生成、复杂医学推理、医学语言理解、及医疗安全和伦理五大维度，提供客观科学的模型能力评估。

润医医疗大模型在MedBench评测中斩获佳绩，充分展示了盘古大模型团队在医疗AI领域深厚的技术积累和卓越的创新硬实力。这一硕果是团队面向医学领域大模型研发的重要里程碑，也是团队在医学垂直领域深耕、持续突破技术边界的有力证明。

在华为盘古大模型L0层的基础上，盘古大模型团队使用了千亿级高质量的中英文医学文献、医学指南、书籍，及千万量级医疗健康档案和知识图谱等数据进行训练，强化了润医医疗大模型医学知识储备，显著提升模型的医学专业表达与理解能力。

为了使模型能够精准捕捉医疗数据中的复杂模式与内在关系，显著提升医学知识问答、语言生成和理解、复杂医学推理等高阶能力，盘古大模型团队提出了基于多智能体的医学数据合成工作流自演进技术。工作流生成智能体首先对题目从医学领域、难度、题型等维度深入分析，并从记忆模块召回高相似度问题示例进行知识预热，自动构建包含多模型采样和信息整合的数据合成工作流。反思智能体通过评估采样数据一致性、问题完成度、回复风格多样性以及信息整合的合理性与完整性等，对数据合成工作流提出优化建议，推动工作流持续迭代演进，从而进一步提升医学数据质量。同时，迭代优化后的工作流在记忆模块中保存，不断反哺工作流生成智能体，实现自演进学习。

数据合成工作流自演进技术为润医医疗大模型后训练阶段合成知识完备、表达准确、要素全面、逻辑清晰的高质量训练数据，不仅让模型学会了知识，更学会了“推理”、“诊断”、“表达”等高阶认知技能，使润医医疗大模型成为懂医学、会思考、会表达的行业领先的医疗垂域模型。

盘古大模型作为医疗AI的强大基础底座，正以前沿的医学数据训练技术和深厚的垂域模型开发能力，推动医疗行业迈向智能化、精准化、个性化的崭新时代。伴随技术的日臻成熟和应用场景深度扩展，盘古医疗垂域模型将成为重塑医疗生态的关键引擎，不仅为医院数字化转型提供强劲动力，更将深刻变革传统医疗服务质量、效率与可及性。盘古大模型及其在医学垂域上技术突破将为构建智慧医疗体系，实现健康中国战略目标奠定坚实的数字化基石，开启AI赋能医疗健康事业的全新篇章。

免责声明：本文仅代表作者个人观点，与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

给作者点赞

0 VS 0

写得不太好