AI大模型时代,运营商网络的核心入口迎来关键变革!Token经营模式的兴起,驱动传统BRAS设备从“宽带收费站”向算网融合智能网关全面升级。它将承担起Token流量精准识别、按调用量灵活计费、AI任务就近卸载、Token智能调度等核心职能,助力运营商从“卖带宽”转向“卖算力、卖Token”的全新商业模式,全面激活数字生态新增长极。
Token经营的兴起,推动宽带远程接入服务器(BRAS)从“宽带网关”向“算网融合智能网关”演进。作为用户接入网络的“第一跳”及流量与算力调度的关键节点,BRAS的核心需求正从传统的用户认证与流量转发,升级叠加业务感知、算力开放、智能调度等功能。
业务感知:Tokens无感鉴权计费与场景化运营
BRAS不再仅仅是流量的入口,更成为算力服务的锚点。面向Token经营,BRAS需升级具备深度业务感知能力,实现对Token流量的精准识别与场景分类,为Token计费提供精准数据依据。
通常Token统计是在应用层(API网关或模型服务层)完成。BRAS可通过对接应用层的计费接口(如通过API查询或信令交互)获取Token用量,或在本地部署轻量级代理,实现按Token调用量的实时计量。BRAS需具备不同业务模型的计量规则,适配个人普惠包、中小微企业阶梯包、政企私有化专属包的差异化场景。
在运营方面,BRAS需具备单用户Token使用质量的精准溯源、质差问题快速定位,支撑Token业务的运维闭环。同时,通过对Token消耗的时段分布、峰值消耗规模、业务流向等维度的分析,捕捉AI应用热点,为前端精准营销的场景化触达、算力资源的动态精准扩容提供数据底座支撑。
云边协同:支持算力开放,支撑AI推理加速,超低时延
AI交互(尤其是Agent多轮调用)对时延敏感。BRAS需配合边缘算力节点,实现就近路由与算力调度,减少Token请求的传输时延。BRAS需支持SRv6等新型协议,实现基于应用感知的路径选择,确保高价值Token业务(如云端推理、私有模型训练)的低时延和高可靠性。 可通过在BRAS搭载智能板卡或容器开放模式,实现AI推理的“协议转换/加速”,显著降低时延。
据报导,中国移动BRAS搭载2025年集采的MPC单板,已具备多址组网与私网随行 场景,支持跨家庭、跨局域网的设备协同,结合5G技术实现用户无论身处何地都能无缝接入家庭内网或边缘算力资源,支撑智能家居、远程办公等场景。
智能调度:Token差异化保障及资源按需调整
面向Token经营场景,BRAS作为算力网络的核心接入关口,在传统通断监测、带宽统计的基础能力之上,需完成核心能力升级。首先要构建完整的Token-QoS-网络资源动态映射体系,以Token单价、TPS(每秒Token处理量)、端到端网络时延、算力节点负载率等核心维度作为依据,分层分级为不同优先级的Token服务匹配对应的网络资源与边缘算力资源,从接入侧保障高并发Token流的低时延传输,避免大模型推理过程中出现Token丢包、乱序导致的卡顿问题。
其次,BRAS需与智算调度平台协同,搭建“用户侧AI请求发起-接入侧Token感知-网络资源动态匹配-算力节点最优调度”的全闭环链路。当用户发起AI请求时,BRAS应具备TokenHub智能路由调度能力,能感知后端算力负载,引流至最优算力节点,实现Token的高效供给,避免因网络拥塞、调度不均等问题拉高Token的单位生产成本,实现普惠化供给。
总结:Token经营对BRAS的需求核心在于,从“管道”变为“智能调度器” 。BRAS不再仅仅是接入设备,而是成为 Token价值的感知点、计量点和调度点 ,需要具备更强的智能化和服务保障能力,以支撑运营商从“卖带宽”向“卖算力/卖Token”的商业模式转型。 






































