在鲲鹏昇腾开发者大会——鲲鹏开发者峰会2026上,华为鲲鹏计算产品部部长刘林超发表《鲲鹏携手开发者,构筑IT基础设施新架构,共赢Agentic AI新时代》主题演讲,系统阐述了Agentic AI浪潮下基础设施的架构变革与生态布局,全方位展示鲲鹏面向Agentic AI时代的技术创新与落地成果。

华为鲲鹏计算产品部部长 刘林超
以下是演讲全文
大家下午好!我是刘林超。非常荣幸与广大开发者们相聚北京中关村国际创新中心,共赴鲲鹏开发者峰会2026,一同探讨Agentic AI时代的技术变革、产业机遇与生态共建之路。
七载深耕开源开放,百万开发者繁茂鲲鹏生态
回首鲲鹏产业走过的七年,我们始终坚持“硬件开放、软件开源”的生态策略。全面开源基础软件与应用加速软件,向开发者分享技术成果。经过长期的生态共建,鲲鹏生态规模实现跨越式增长。目前已汇聚7000余家合作伙伴,联合孵化27000个行业解决方案,累计培育415万名专业鲲鹏开发者。鲲鹏生态的蓬勃生长,离不开广大开发者的鼎力支持和悉心相伴,在此由衷向每一位同行者致以诚挚感谢。
鲲鹏超节点:Agentic AI时代IT基础设施的理想选择
AI正从对话式Chatbot迈入自主执行任务的Agent时代。过去半年内Token消耗量暴涨6倍,给IT基础设施带来四大挑战:调用范式从人机交互转向机机并发,需超高弹性并发架构;网络拓扑从星型辐射转向全互联网格,要求纳秒级时延;数据供给从被动存储变为主动推送,通算与智算必须深度融合;安全边界动态调用链需可信执行环境。从“智算为中心”到“通算+智算协同”是最大架构范式转变。
上述四大挑战倒逼内存带宽和容量、网络时延性能需要有百倍级增长,传统硬件能力与Agentic AI场景的供需间的“剪刀差”,已成为智能体规模化落地的瓶颈。
那么,鲲鹏如何应对?我们的答案是:鲲鹏超节点是Agentic AI时代IT基础设施的理想选择。
● 灵衢大带宽:提供单节点TB级超大带宽,较传统组网性能提升十倍以上
● 灵衢低延时:节点通信时延达到百纳秒级,比传统以太网降低10倍
● 内存语义通信:实现全局内存,统一编址。
鲲鹏超节点全面适配Agentic AI多元化场景,鲲鹏超节点重构大数据、数据库、存储、LLM推理、虚拟化、RPC通信、安全等各个场景。
面向虚拟化场景:AI Agent规模化落地离不开沙箱,我们提出了鲲鹏超节点沙箱系统解决方案,依托多级缓存共享架构,通过快照资源共享,还有remote-fork能力,可以快速拉起1000沙箱;通过构建三级内存的流动能力与CPU分时复用技术,可以实现超高密度的部署,具备单机部署超过两千个沙箱的能力;通过构建的增量快照共享与任意状态快速fork能力,实现十毫秒级别的快速回滚,生态上支持高效Agent Scaling,支撑任务成功率提升10%以上。
面向通信场景:Agent的爆发调用还需要极致通信的能力,鲲鹏超节点通过灵衢SGL、透明UBSocket、共享TP三大创新技术,实现通信时延与通信内存开销大幅降低。
面向数据库场景:Agentic AI时代核心需要处理好三类关键数据:Agent主导的高并发业务交易数据、智能体的海量多模态知识数据、引发上下文爆炸的智能记忆数据,分别带来TPS暴涨与数据库启停时延要求、QPS激增、Token成本飙升等全新挑战,对AI数据底座提出极高要求。鲲鹏超节点推出针对性方案:依托共享内存预热技术,将数据库启动时延压缩至500毫秒内,凭借内存UB语义实现分布式全局锁和全局事务;基于全局图索引技术实现多模态融合查询,检索性能翻倍;积极拥抱开源记忆生态,优化上下文缓存,通过上下文缓存减少重复注入,Token数可以降低一倍。同时我们任务完成以后还可以提升20%以上。
面向安全场景:Agent给大家带来效率和创新的同时,安全问题成为Agent大规模部署的最大障碍。鲲鹏推出基于CCA架构的机密Agent解决方案,提供一个安全的环境,让Agent跑在机密虚拟机里。该方案具备三大核心能力:首先是可信授权,通过限定容器只能访问预设的资源,防止恶意进程的越狱访问。第二个是安全隔离,基于CCA机密计算架构,Agent独占系统内存,有效抵御Memory Dump攻击,管理员也无法窥探敏感信息。第三个是数据加密与秒级回滚,结合自研内生密码模块与openGauss回滚技术,实现重要数据加密存储和秒级恢复。
面向大数据场景:在AI大模型高速迭代的当下,大模型训练普遍面临训练速度慢的问题,关键痛点是CPU集群与训练集群彼此等待,利用率偏低。鲲鹏超节点提供的共享内存通信技术,通过动态分组算法实现负载自适应调度,结合灵衢内存池化,可以大幅削减 Shuffle 通信开销,让 CPU 与 XPU 实现无感协同、同频工作,告别数据排队搬运。同时,鲲鹏亲和多模态算子库提供丰富的多模态处理算子,帮助企业按期实现模型的快速迭代。
面向分布式存储场景:鲲鹏KV Cache缓存解决方案通过增强开源MoonCake社区,支持内存与SSD多级池化,并依托灵衢对等互联技术,有效应对大容量与大带宽挑战。相比传统组网,KV Cache传输带宽倍级提升,小包P99时延下降50%,首token时延可降低70%以上。同时,鲲鹏将推出基于灵衢互联的SSU硬盘,与传统的“网卡+SSD”服务器方案相比,该方案可节省网卡、CPU及DDR的硬件成本。配合鲲鹏解决方案的压缩技术与动态OP技术,整体缓存成本可下降20%,同时比DPU方案带宽高1倍。
面向LLM场景:DeepSeek推出了Engram技术,核心原理是以查代算,把重复编码固定模式,交给高效的查表。但该技术也对基础设施提出严苛要求:一方面CPU查表速度需超越GPU单层推理速度,否则将拖累整体吞吐;另一方面多机并行场景下,各节点独立存储Engram查询表会产生大量内存冗余,大幅提升部署成本。基于灵衢互联,鲲鹏超节点实现节点间内存共享,将Engram冗余内存占用降低至少50%。同时,通过极致软硬协同优化,CPU查表时延降低至少40%,确保稳定低于计算卡单层推理时延,彻底满足“吞吐不下降”的苛刻要求。同时内存共享消除冗余,软硬协同压缩时延。
鲲鹏超节点软件全面开源开放,升级开发者生态赋能体系
2025年华为全联接大会上公司正式发布了灵衢互联协议,到目前为止,应用使能套件、灵衢云化使能、灵衢系统高阶服务、操作系统灵衢组件、灵衢总线管理已经全部在openEuler、openFuyao、鲲鹏社区开源开放,广大开发者可以获取社区已经发布的版本,或使用源码编译方式集成使用。上述5个组件共计新增180+ API,使用新的API,应用针对UB进行深度修改和优化,可获得50%以上性能增益。同时也提供POSIX兼容接口,应用零修改就可使用灵衢能力。开发者可根据业务场景选择使用或组合使用。相关代码仓和使用文档我们已经整理放在灵衢社区和鲲鹏社区,欢迎广大开发者直接访问。
在这个技术快速发展的时代,人才是计算行业核心发展的推动力量。鲲鹏联合头部企业打造了全新的“开发者认证”计划,帮助开发者快速构建关键能力;积极联合工信部、教育部以及头部企业,开展认证互信,将我们的认证打造为鲲鹏行业的通用人才标准,让开发者有更多的岗位机会,助力开发者的职业发展。同时,鲲鹏提供丰富的权益和物质激励,充分激活生态创新活力,持续壮大鲲鹏开发者生态规模。
心怀挚爱,共绽光芒,鲲鹏七载耕耘,共筑了今天的华章。鲲鹏愿与所有开发者继续携手并肩,共赢Agentic AI新时代,谢谢大家! 






































