移动平台
`
2025/6/21 07:06
基于CloudMatrix 384超节点云服务训练,华为云发布盘古大模型5.5
0
0

C114讯 6月21日消息(水易)“芯片问题其实没必要担心,用叠加和集群等方法,计算结果上与最先进水平是相当的。”华为首席执行官任正非在公开场合表示。

在2025年华为开发者大会(HDC 2025)上,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,同时宣布盘古大模型5.5正式发布,对自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型进行全面升级。

基于CloudMatrix 384超节点新一代昇腾AI云服务

随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。从单节点向超节点架构演进成为重要发展趋势,其中超高性能网络的关键。这对于国产算力而言是弯道超车的机会,弥补单卡的性能鸿沟。

正如任正非所言:“我们单芯片还是落后美国一代,我们用数学补物理、非摩尔补摩尔,用群计算补单芯片,在结果上也能达到实用状况。”

华为云新一代昇腾AI云服务基于CloudMatrix 384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s,与非超节点相比提升近4倍。

据了解,超节点架构能更好地支持混合多专家MoE大模型的推理,可以实现“一卡一专家”,一个超节点可以支持384个专家并行推理,极大提升效率;同时,超节点还可以支持“一卡一算子任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。

对于万亿、十万亿参数的大模型训练任务,在云数据中心,还能将432个超节点级联成最高16万卡的超大集群;同时,超节点还可以支持训推算力一体部署,如“日推夜训”,训推算力可灵活分配,帮助客户资源使用最优。

据悉,目前昇腾AI云服务已经成为AI基础设施的最优选择,为科大讯飞、新浪、硅基流动、面壁智能、中科院、360等超过1300家客户提供澎湃的AI算力。

基于昇腾全栈软硬件能力盘古大模型5.5全面升级

与市面上的其他大模型厂商不同,华为云盘古大模型坚定聚焦行业,其使命是让各个行业不必重复“造轮子”,不必从零打造自己的企业大模型。本次大会上,华为云重磅发布盘古大模型5.5,五大基础模型全面升级。

盘古自然语言处理NLP大模型:全新的718B 深度思考模型是一个由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域大幅增强,实现能力领先。盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级,提升用户体验。

盘古预测大模型:采用业界首创的triplet transformer统一预训练架构,将不同行业的数据,包括工艺参数的表格数据,设备运行日志的时间序列数据,产品检测的图片数据进行统一的三元组编码,并在同一框架内高效处理和预训练,极大地提升预测大模型的精度。以应用于水泥、钢铁、有色金属、供热等多个行业。

盘古科学计算大模型:持续扩展与更多科学应用领域的结合。深圳气象局基于盘古升级“智霁”大模型,首次实现AI集合预报,减少单一预报模型的误差。重庆市气象局基于盘古打造“天资·12h“气象大模型,提升灾害天气的日内预报预警能力。深圳能源采用盘古进行中短期风光水发电量预测,减少发电侧弃电,提升能源开发效率。

盘古计算机视觉CV大模型:华为云发布全新MoE架构的300亿参数视觉大模型,全面支持图像、红外、激光点云、光谱、雷达等多维度、泛视觉的感知、分析与决策。另外,盘古CV大模型通过跨维度生成模型,构建油气、交通、煤矿等工业场景稀缺的泛视觉故障样本库,极大地提升了业务场景的可识别种类与精度。

盘古多模态大模型:基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练,构建所需要的数字物理空间,实现持续优化迭代。本次大会,华为云基于盘古大模型的多模态能力及思维能力,正式发布CloudRobo具身智能平台。

值得一提的是,盘古大模型是基于昇腾云的全栈软硬件训练而成的,这标志着基于昇腾架构可以打造出世界一流大模型。

在过去的一年中,盘古大模型持续深耕行业,已在30多个行业、500多个场景中落地,在政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值,重塑千行万业,成就行业AI先锋。

打造AI Native的云重塑云服务模式

华为云不仅在基础设施和大模型方面持续创新,也在不断通过AI技术重塑云服务,打造AI Native的云,帮助客户更好地拥抱AI,让客户通过华为云服务,更便捷地拥抱AI创新,加速智能化。

华为云CTO张宇昕发布的最佳企业Agent平台ModelArts Versatile,内置了各类业务场景的经验模板,支持自助式的智能体开发。Versatile还提供了智能化工具链,实现Agent分钟级工作输出,达成传统人工天级工作成果,有效降低Agent开发的复杂度与专业性。

同时,华为云基于AI算力、盘古大模型和Agent能力,对智能助手盘古Doer进行全面升级。

CodeArts Doer构建了业界最全的6大开发领域专业Agent,覆盖项目经理、产品管理、开发、构建、测试和部署全流程,将软件研发端到端提效40%以上。GaussDB Doer在精准查询方面,利用全球上万个GaussDB运维案例的百亿Tokens数据微调,构建专业运维基模型,让故障处置更加高效。MetaStudio通过个性化TTS语音合成,数字人的音色相似度、读音准确率都达到业界领先,同时结合更精准的口型匹配、更丰富的动作,实现数字人形象高拟真。

另外,华为云提供包含语料数据安全、模型安全、推理安全、应用安全在内的全生命周期模型安全方案。大模型防火墙通过提示词攻击防范和敏感内容实时检测,保障大模型推理安全。一方面识别越狱、角色扮演、恶意指令等主流提示词攻击手段;另一方面预置了百万级规则库,针对提示词攻击的检出率大于95%,整体能够帮助模型综合安全评测得分提升20%以上。

华为云是华为公司面向开发者的统一底座,目标打造昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等各项根技术的生态,给广大开发者一个更优的选择。

为了给开发者提供AI时代的智能应用开发体验,华为开发者空间全面升级,开发者可以便捷的调用算力、大模型、Agent工具等华为云服务来开发智能应用。如今,华为云开发者已超过800万;华为云作为云底座,支持鲲鹏、昇腾、鸿蒙等生态的开发者总计达到1300万。

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销