C114讯 6月21日消息(水易)“芯片问题其实没必要担心,用叠加和集群等方法,计算结果上与最先进水平是相当的。”华为首席执行官任正非在公开场合表示。
在2025年华为开发者大会(HDC 2025)上,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,同时宣布盘古大模型5.5正式发布,对自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型进行全面升级。
基于CloudMatrix 384超节点的新一代昇腾AI云服务
随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。从单节点向超节点架构演进成为重要发展趋势,其中超高性能网络的关键。这对于国产算力而言是弯道超车的机会,弥补单卡的性能鸿沟。
正如任正非所言:“我们单芯片还是落后美国一代,我们用数学补物理、非摩尔补摩尔,用群计算补单芯片,在结果上也能达到实用状况。”
华为云新一代昇腾AI云服务基于CloudMatrix 384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s,与非超节点相比提升近4倍。
据了解,超节点架构能更好地支持混合多专家MoE大模型的推理,可以实现“一卡一专家”,一个超节点可以支持384个专家并行推理,极大提升效率;同时,超节点还可以支持“一卡一算子任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。
对于万亿、十万亿参数的大模型训练任务,在云数据中心,还能将432个超节点级联成最高16万卡的超大集群;同时,超节点还可以支持训推算力一体部署,如“日推夜训”,训推算力可灵活分配,帮助客户资源使用最优。
据悉,目前昇腾AI云服务已经成为AI基础设施的最优选择,为科大讯飞、新浪、硅基流动、面壁智能、中科院、360等超过1300家客户提供澎湃的AI算力。
基于昇腾全栈软硬件能力,盘古大模型5.5全面升级
与市面上的其他大模型厂商不同,华为云盘古大模型坚定聚焦行业,其使命是让各个行业不必重复“造轮子”,不必从零打造自己的企业大模型。本次大会上,华为云重磅发布盘古大模型5.5,五大基础模型全面升级。
盘古自然语言处理NLP大模型:全新的718B 深度思考模型是一个由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域大幅增强,实现能力领先。盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级,提升用户体验。
盘古预测大模型:采用业界首创的triplet transformer统一预训练架构,将不同行业的数据,包括工艺参数的表格数据,设备运行日志的时间序列数据,产品检测的图片数据进行统一的三元组编码,并在同一框架内高效处理和预训练,极大地提升预测大模型的精度。以应用于水泥、钢铁、有色金属、供热等多个行业。
盘古科学计算大模型:持续扩展与更多科学应用领域的结合。深圳气象局基于盘古升级“智霁”大模型,首次实现AI集合预报,减少单一预报模型的误差。重庆市气象局基于盘古打造“天资·12h“气象大模型,提升灾害天气的日内预报预警能力。深圳能源采用盘古进行中短期风光水发电量预测,减少发电侧弃电,提升能源开发效率。
盘古计算机视觉CV大模型:华为云发布全新MoE架构的300亿参数视觉大模型,全面支持图像、红外、激光点云、光谱、雷达等多维度、泛视觉的感知、分析与决策。另外,盘古CV大模型通过跨维度生成模型,构建油气、交通、煤矿等工业场景稀缺的泛视觉故障样本库,极大地提升了业务场景的可识别种类与精度。
盘古多模态大模型:基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练,构建所需要的数字物理空间,实现持续优化迭代。本次大会,华为云基于盘古大模型的多模态能力及思维能力,正式发布CloudRobo具身智能平台。
值得一提的是,盘古大模型是基于昇腾云的全栈软硬件训练而成的,这标志着基于昇腾架构可以打造出世界一流大模型。
在过去的一年中,盘古大模型持续深耕行业,已在30多个行业、500多个场景中落地,在政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值,重塑千行万业,成就行业AI先锋。
打造AI Native的云,重塑云服务模式
华为云不仅在基础设施和大模型方面持续创新,也在不断通过AI技术重塑云服务,打造AI Native的云,帮助客户更好地拥抱AI,让客户通过华为云服务,更便捷地拥抱AI创新,加速智能化。
华为云CTO张宇昕发布的最佳企业Agent平台ModelArts Versatile,内置了各类业务场景的经验模板,支持自助式的智能体开发。Versatile还提供了智能化工具链,实现Agent分钟级工作输出,达成传统人工天级工作成果,有效降低Agent开发的复杂度与专业性。
同时,华为云基于AI算力、盘古大模型和Agent能力,对智能助手盘古Doer进行全面升级。
CodeArts Doer构建了业界最全的6大开发领域专业Agent,覆盖项目经理、产品管理、开发、构建、测试和部署全流程,将软件研发端到端提效40%以上。GaussDB Doer在精准查询方面,利用全球上万个GaussDB运维案例的百亿Tokens数据微调,构建专业运维基模型,让故障处置更加高效。MetaStudio通过个性化TTS语音合成,数字人的音色相似度、读音准确率都达到业界领先,同时结合更精准的口型匹配、更丰富的动作,实现数字人形象高拟真。
另外,华为云提供包含语料数据安全、模型安全、推理安全、应用安全在内的全生命周期模型安全方案。大模型防火墙通过提示词攻击防范和敏感内容实时检测,保障大模型推理安全。一方面识别越狱、角色扮演、恶意指令等主流提示词攻击手段;另一方面预置了百万级规则库,针对提示词攻击的检出率大于95%,整体能够帮助模型综合安全评测得分提升20%以上。
华为云是华为公司面向开发者的统一底座,目标打造昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等各项根技术的生态,给广大开发者一个更优的选择。
为了给开发者提供AI时代的智能应用开发体验,华为开发者空间全面升级,开发者可以便捷的调用算力、大模型、Agent工具等华为云服务来开发智能应用。如今,华为云开发者已超过800万;华为云作为云底座,支持鲲鹏、昇腾、鸿蒙等生态的开发者总计达到1300万。