2025年6月6日,第七届“北京智源大会”在中关村展示中心开幕。
北京智源大会是智源研究院主办的“AI内行学术盛会”,以“全球视野、思想碰撞、前沿引领”为特色,汇聚海内外研究者分享研究成果、探寻前沿知识、交流实践经验。2025北京智源大会邀请到了图灵奖得主、深度学习代表人物Yoshua Bengio,图灵奖得主、强化学习之父Richard S. Sutton,图灵奖得主Joseph Sifakis、姚期智,Google、DeepMind、Meta、Mila、Physical Intelligence、MIT、斯坦福、UC Berkeley、Linux基金会等国际明星机构与技术团队代表,华为、百度、字节跳动、腾讯、阿里等互联网大厂以及智谱、宇树科技、生数科技、面壁等30余位AI公司创始人、CEO,同时,大会还汇聚了100余位全球青年科学家、200余位人工智能顶尖学者和产业专家,围绕多模态、深度推理、下一代AI路径、Agent智能体、具身智能、AI4S、AI产业、AI安全、AI开源展开精彩演讲和前瞻性对话。
开幕式由智源研究院理事长黄铁军主持。
智源研究院院长王仲远做2025研究进展报告,发布智源研究院在大模型前沿技术路径的探索成果和开源生态建设的最新动态。
在2025北京智源大会上,继“悟道”系列大模型之后,智源研究院推出“悟界”系列大模型,其中,“悟道”的“道”代表智源对大语言模型系统化方法和路径的探索,“悟界”的“界”代表虚实世界边界的不断突破。“悟界”系列大模型承载的是智源对人工智能从数字世界迈向物理世界的技术趋势的判断。
“悟界”大模型系列,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。
Emu3作为原生多模态统一架构让大模型具备理解和推理世界的能力,Brainμ基于Emu3架构,引入脑信号这一新的模态数据,实现了单一模型完成多种神经科学任务的大一统。多模态与脑科学模型未来可成为人机交互具身场景下的基础模型。
RoboOS 2.0与RoboBrain 2.0在初代版本基础上,原有性能大幅提升,并新增多机协作规划与物理常识驱动的空间推理能力。OpenComplex2可在原子分辨率层面捕捉分子相互作用及平衡构象,探索微观构象波动与宏观生物功能的跨尺度关联。
从微观生命体到具身智能体,'悟界'系列大模型试图揭示生命机理本质规律,构建人工智能与物理世界交互基座。
智源作为非营利科研机构,一直坚持开源开放的原则,智源打造的覆盖模型、算法、数据、评测、系统的大模型开源技术体系FlagOpen,截至目前,已开源约200个模型和160个数据集,其中,模型全球总下载量超6.4亿次,开源数据集下载量近113万次,开源项目代码下载量超140万次,为人工智能技术普惠与开源社区繁荣做出持续贡献。
其中,开源、统一的 AI 系统软件栈 FlagOS进一步升级,新增统一编译器FlagTree、统一通信库FlagCX、自动发版平台工具FlagRelease等重要板块,全面覆盖统一生态技术需求;实现对11家国内外厂商的18款异构AI硬件的统一支持;FlagGems的算子平均性能已优于国际主流算子,并行训推框架FlagScale与人工优化相比,实现了最高23%的自动并行加速。升级后的FlagOS已支持DeepSeek、通义千问等更多开源大模型实现跨硬件平台运行,为开发者提供更多选择,推动 AI 技术的普及和多元发展。
此外在大会圆桌论坛环节,智源研究院王仲远与Physical Intelligence联合创始人兼CEO Karol Hausman,宇树科技创始人王兴兴,银河通用创始人兼CTO、北京大学助理教授、智源具身智能研究中心主任王鹤,穹彻智能联合创始人、上海交通大学教授卢策吾,北京人形机器人创新中心总经理熊友军,就具身智能的不同技术路线、商业化路径探索、典型应用场景拓展、产业生态构建等议题展开深度探讨。