鲲鹏携手开发者，打造Agentic AI时代IT基础设施理想选择

C114通信网

在鲲鹏昇腾开发者大会——鲲鹏开发者峰会2026上，华为鲲鹏计算产品部部长刘林超发表《鲲鹏携手开发者，构筑IT基础设施新架构，共赢Agentic AI新时代》主题演讲，系统阐述了Agentic AI浪潮下基础设施的架构变革与生态布局，全方位展示鲲鹏面向Agentic AI时代的技术创新与落地成果。

图片1.png

华为鲲鹏计算产品部部长刘林超

以下是演讲全文

大家下午好！我是刘林超。非常荣幸与广大开发者们相聚北京中关村国际创新中心，共赴鲲鹏开发者峰会2026，一同探讨Agentic AI时代的技术变革、产业机遇与生态共建之路。

七载深耕开源开放，百万开发者繁茂鲲鹏生态

回首鲲鹏产业走过的七年，我们始终坚持“硬件开放、软件开源”的生态策略。全面开源基础软件与应用加速软件，向开发者分享技术成果。经过长期的生态共建，鲲鹏生态规模实现跨越式增长。目前已汇聚7000余家合作伙伴，联合孵化27000个行业解决方案，累计培育415万名专业鲲鹏开发者。鲲鹏生态的蓬勃生长，离不开广大开发者的鼎力支持和悉心相伴，在此由衷向每一位同行者致以诚挚感谢。

鲲鹏超节点：Agentic AI时代IT基础设施的理想选择

AI正从对话式Chatbot迈入自主执行任务的Agent时代。过去半年内Token消耗量暴涨6倍，给IT基础设施带来四大挑战：调用范式从人机交互转向机机并发，需超高弹性并发架构；网络拓扑从星型辐射转向全互联网格，要求纳秒级时延；数据供给从被动存储变为主动推送，通算与智算必须深度融合；安全边界动态调用链需可信执行环境。从“智算为中心”到“通算+智算协同”是最大架构范式转变。

上述四大挑战倒逼内存带宽和容量、网络时延性能需要有百倍级增长，传统硬件能力与Agentic AI场景的供需间的“剪刀差”，已成为智能体规模化落地的瓶颈。

那么，鲲鹏如何应对？我们的答案是：鲲鹏超节点是Agentic AI时代IT基础设施的理想选择。

● 灵衢大带宽：提供单节点TB级超大带宽，较传统组网性能提升十倍以上

● 灵衢低延时：节点通信时延达到百纳秒级，比传统以太网降低10倍

● 内存语义通信：实现全局内存，统一编址。

鲲鹏超节点全面适配Agentic AI多元化场景，鲲鹏超节点重构大数据、数据库、存储、LLM推理、虚拟化、RPC通信、安全等各个场景。

面向虚拟化场景：AI Agent规模化落地离不开沙箱，我们提出了鲲鹏超节点沙箱系统解决方案，依托多级缓存共享架构，通过快照资源共享，还有remote-fork能力，可以快速拉起1000沙箱；通过构建三级内存的流动能力与CPU分时复用技术，可以实现超高密度的部署，具备单机部署超过两千个沙箱的能力；通过构建的增量快照共享与任意状态快速fork能力，实现十毫秒级别的快速回滚，生态上支持高效Agent Scaling，支撑任务成功率提升10%以上。

面向通信场景：Agent的爆发调用还需要极致通信的能力，鲲鹏超节点通过灵衢SGL、透明UBSocket、共享TP三大创新技术，实现通信时延与通信内存开销大幅降低。

面向数据库场景：Agentic AI时代核心需要处理好三类关键数据：Agent主导的高并发业务交易数据、智能体的海量多模态知识数据、引发上下文爆炸的智能记忆数据，分别带来TPS暴涨与数据库启停时延要求、QPS激增、Token成本飙升等全新挑战，对AI数据底座提出极高要求。鲲鹏超节点推出针对性方案：依托共享内存预热技术，将数据库启动时延压缩至500毫秒内，凭借内存UB语义实现分布式全局锁和全局事务；基于全局图索引技术实现多模态融合查询，检索性能翻倍；积极拥抱开源记忆生态，优化上下文缓存，通过上下文缓存减少重复注入，Token数可以降低一倍。同时我们任务完成以后还可以提升20%以上。

面向安全场景：Agent给大家带来效率和创新的同时，安全问题成为Agent大规模部署的最大障碍。鲲鹏推出基于CCA架构的机密Agent解决方案，提供一个安全的环境，让Agent跑在机密虚拟机里。该方案具备三大核心能力：首先是可信授权，通过限定容器只能访问预设的资源，防止恶意进程的越狱访问。第二个是安全隔离，基于CCA机密计算架构，Agent独占系统内存，有效抵御Memory Dump攻击，管理员也无法窥探敏感信息。第三个是数据加密与秒级回滚，结合自研内生密码模块与openGauss回滚技术，实现重要数据加密存储和秒级恢复。

面向大数据场景：在AI大模型高速迭代的当下，大模型训练普遍面临训练速度慢的问题，关键痛点是CPU集群与训练集群彼此等待，利用率偏低。鲲鹏超节点提供的共享内存通信技术，通过动态分组算法实现负载自适应调度，结合灵衢内存池化，可以大幅削减 Shuffle 通信开销，让 CPU 与 XPU 实现无感协同、同频工作，告别数据排队搬运。同时，鲲鹏亲和多模态算子库提供丰富的多模态处理算子，帮助企业按期实现模型的快速迭代。

面向分布式存储场景：鲲鹏KV Cache缓存解决方案通过增强开源MoonCake社区，支持内存与SSD多级池化，并依托灵衢对等互联技术，有效应对大容量与大带宽挑战。相比传统组网，KV Cache传输带宽倍级提升，小包P99时延下降50%，首token时延可降低70%以上。同时，鲲鹏将推出基于灵衢互联的SSU硬盘，与传统的“网卡+SSD”服务器方案相比，该方案可节省网卡、CPU及DDR的硬件成本。配合鲲鹏解决方案的压缩技术与动态OP技术，整体缓存成本可下降20%，同时比DPU方案带宽高1倍。

面向LLM场景：DeepSeek推出了Engram技术，核心原理是以查代算，把重复编码固定模式，交给高效的查表。但该技术也对基础设施提出严苛要求：一方面CPU查表速度需超越GPU单层推理速度，否则将拖累整体吞吐；另一方面多机并行场景下，各节点独立存储Engram查询表会产生大量内存冗余，大幅提升部署成本。基于灵衢互联，鲲鹏超节点实现节点间内存共享，将Engram冗余内存占用降低至少50%。同时，通过极致软硬协同优化，CPU查表时延降低至少40%，确保稳定低于计算卡单层推理时延，彻底满足“吞吐不下降”的苛刻要求。同时内存共享消除冗余，软硬协同压缩时延。

鲲鹏超节点软件全面开源开放，升级开发者生态赋能体系

2025年华为全联接大会上公司正式发布了灵衢互联协议，到目前为止，应用使能套件、灵衢云化使能、灵衢系统高阶服务、操作系统灵衢组件、灵衢总线管理已经全部在openEuler、openFuyao、鲲鹏社区开源开放，广大开发者可以获取社区已经发布的版本，或使用源码编译方式集成使用。上述5个组件共计新增180+ API，使用新的API，应用针对UB进行深度修改和优化，可获得50%以上性能增益。同时也提供POSIX兼容接口，应用零修改就可使用灵衢能力。开发者可根据业务场景选择使用或组合使用。相关代码仓和使用文档我们已经整理放在灵衢社区和鲲鹏社区，欢迎广大开发者直接访问。

在这个技术快速发展的时代，人才是计算行业核心发展的推动力量。鲲鹏联合头部企业打造了全新的“开发者认证”计划，帮助开发者快速构建关键能力；积极联合工信部、教育部以及头部企业，开展认证互信，将我们的认证打造为鲲鹏行业的通用人才标准，让开发者有更多的岗位机会，助力开发者的职业发展。同时，鲲鹏提供丰富的权益和物质激励，充分激活生态创新活力，持续壮大鲲鹏开发者生态规模。

心怀挚爱，共绽光芒，鲲鹏七载耕耘，共筑了今天的华章。鲲鹏愿与所有开发者继续携手并肩，共赢Agentic AI新时代，谢谢大家！

免责声明：本文仅代表作者个人观点，与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

给作者点赞

0 VS 0

写得不太好