专题
`
2025/8/18 14:38
大模型推动的通用机器人创新
0
0

本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部

摘 要:在由ChatGPT引爆的新一轮人工智能浪潮下,大语言模型、推理模型、多模态语言模型、扩散模型等技术快速发展,相关的大模型技术也从离身智能向具身智能延伸,加快推动通用机器人领域的技术创新。分析了通用机器人产业的发展趋势和机遇,梳理总结了对通用机器人发展最为重要的大脑、小脑、数据、本体等4个方面的进展,以近2年业界若干重要的具身模型为例详细剖析了具身基础模型、具身推理模型、视觉语言动作模型等技术的发展脉络,最后对未来具身智能技术发展方向进行了展望。

关键词:通用机器人;具身智能体;具身基础模型;视觉语言动作模型;具身推理模型

doi:10.12045/j.issn.1007-3043.2025.07.002

通用机器人产业发展趋势和重要机遇

具身智能是可通过物理实体与环境交互并能从经验反馈中实现智能增长和行动自适应的智能系统,是将人工智能应用于物理世界的关键使能技术,也被认为是实现通用人工智能的基础路径。

具身智能机器人从形态上可分为固定基座型机器人、轮式机器人、履带机器人、四足机器人、人形机器人、仿生机器人等。虽然以工业机械臂和AGV为代表的传统专用机器人已在一定范围内应用于面向单一任务的结构化环境中,但是产业亟需更具通用智能、具备任务泛化能力、可高质量完成操作任务和运动控制的通用机器人。从训练数据构建难度、潜在市场规模、基础设施兼容性等维度来看,人形/类人形的形态是最适宜的通用机器人形态。经过多年发展,机器人的运动控制算法已从基于运动学/动力学模型的经典控制算法和以模型预测控制(Model Predictive Control,MPC)为代表的优化控制算法演进到基于深度强化学习的模仿学习算法,人形/类人形的机器人已可在遥控下较好地进行平衡行走或慢跑,或表演一套预设的舞蹈或武术动作,甚至进行前后空翻等高动态的动作;灵巧手在刚性物体抓取放置或柔性物体叠放等简单的操作类单点技能上已取得长足进步并展现了一定的环境适应性和针对各类物体的技能泛化性。然而,现阶段人形/类人形机器人在场景理解、任务规划及技能泛化、精细操作等方面距离通用机器人的愿景还有相当大的差距。借鉴自动驾驶的技术分级方法,可针对移动、操作和交互等主要任务场景,将感知、决策、行动、技能等要素按照泛化能力、自适应性、智能水平等维度进行评估,把具身智能智能化等级分为五级。根据这个分级方法,现今具身智能技术大致处于L1~L2。工信部人工智能标准化技术委员会正在组织该分级分类标准的研究制定工作。

在技术发展上,随着大模型技术向具身智能领域的迁移应用和关节电机等机器人技术的逐步成熟,通用机器人已确定成为具身智能技术创新的重要领域。在产业发展上,据预测,到2029年中国人形机器人市场规模将从2024年的30亿元扩大到750亿元,到2030年有望达到3000亿元。国内人形机器人已成为全球最重要的产业力量,在CES2025上,在黄仁勋身后的14款人形机器人中,有6款来自中国企业。在国家布局上,2023年11月,工信部发布了《人形机器人创新指导意见》。2024年5月,工信部与上海市政府成立“国家地方共建人形机器人创新中心”。2024年10月,工信部与北京市政府成立“国家地方共建具身智能机器人创新中心”。在商业闭环上,国内人形机器人厂商正积极探索面向娱乐表演、迎宾导引、零售物流、食品加工等场景的产业化规模应用。

面对通用机器人和具身智能的产业机遇,运营商可通过与国家级实验室和领先高校的产学研联合创新来夯实具身智能基础能力,发挥与下一代网络、大数据、网络安全等领域融合创新的协同优势,借助具身智能基础模型、端边云智能协同计算、机器人联网服务、机器人技能训练服务、机器人数据和运营管理服务等进入面向机器人产业的算网数智市场,培育和抢占随着机器人普及而拉动的增量联网通信市场,探索Robot as a Service模式下的运营服务体系,成为通用机器人产业重要的赋能者、聚合者和运营者,使具身智能成为推进网络向新、技术向新、服务向新的重要的驱动力。

点击查看全文(PDF)>

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销