前所未有的“百模大战”,当属如今科创圈顶流。
截至7月3日,我国10亿级参数规模以上大模型已超80个,从互联网巨头到细分行业厂商,赛道热度不断高涨。随着群雄逐鹿进入后半赛程,大模型如何着陆应用场景、推动领域创新,成为下一个赛点。
在市场的大浪淘洗下,谁能引领产业变革,跑通大模型商业化?是否有厂商会在垂直领域率先突破,成为这场生存之战的最后赢家?
01 “能应用”才是硬道理
大模型狂热期已经过去,大众对AIGC的追捧不复从前。是时候冷静下来,真正聊一聊这个赛道的机会。
从产品的细分角度来看,大模型基本可以分为三类:
● 一是通用大模型,国外的像OpenAI的ChatGPT,国内的有百度的文心一言、阿里的通义千问等;
● 二是行业大模型,最有代表性的自然是华为盘古政务大模型;
● 三是基于通用大模型或行业大模型的应用型服务,这一类多集中在初创公司,参数量在10亿级别的居多,发育相对缓慢。
整体来讲,市面上流行的大模型,主要集中在第一类和第二类。从它们身上,能够总结出现阶段的真实水平。
通用大模型,主打泛化、适普性,拥有跨领域的知识储备、多元强大的功能和不断增强的语言理解能力等,但硬伤是不聚焦。行业大模型是专才,需要具备长期的专业类信息、技术积累,比如金融知识、政府经验、工业数据等,路走的窄但胜在专精。
比较之下,哪一条路更有可能突出重围?短时间内,没法给出答案,但要论大模型应用的最终落点,很显然,能解决行业、场景问题,帮助生产力升级的更有优势。
在这场模型落地攻坚战中,华为自然不会缺席。早在今年7月,华为云盘古大模型3.0发布,是AI产业界首个全栈式预训练大模型。9月20日的华为全联接大会上,华为携手业界正式推出完全面向行业的华为盘古政务大模型。细心的人会发现,这两者之间的内生关系。
华为云盘古大模型3.0采用的是5+N+X三层架构。
“5”代表L0层提供的五大基础模型,包括语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型;
“N”代表L1层的多行业,比如刚刚提到的华为盘古政务大模型,没有通用大模型的局限性,能够调用千亿级参数、海量政务知识预训练等专项能力,解决政务特定场景和专业问题。
“X”代表L2层的大量细分场景,比如我们因为更改姓名,要更新个人证件,传统政务模型要么答非所问,要么一问多答,很难快速提供解决路径。基于华为盘古政务大模型开发的应用场景模型则不同,融合政策文件、政务事项等海量数据进行SFT,从根源上优化问答、理解等能力,让智慧政企真正的利民、便民。
三层结构层层递进,同样层层解耦,把选择权交给用户,把大模型变成可拆卸、组合的行业工具,华为这一次又领先一步。
02 全局视角,找准服务捷径
在做大模型这件事上,华为起步早、理念新,不仅2019年就投入建设,还将应用领域从政务扩展到气象、金融、铁路等,几乎形成行业全覆盖。
只不过要真正进入细分行业,并不容易。从华为的经验来看,有三点路径可以明确:
一是产业层面,深度融入新业态、新生态,激发企业、组织活力。大模型的出现,拉近人与智能技术的距离,令原本模糊的智慧医疗、智能制造等有了清晰的形象。比如,深圳福田区上线了智慧助手,在高达几十万条数据的精心喂养下,解决了政务热线在问题拆解、政务政策关联等方面的难题,服务专业又有温度,被亲切地称呼为“小福”。
还有超过1000家企业牵手华为大模型,制造产线产能提升了,软件开发效率至少提高20%,新药研发周期从数年缩短至一个月……
二是政策层面,与建设规划同频共振,在政务发展节奏中找到立足点、切入点。随着“数字中国”建设按下了加速键,“十四五”规划和数字政府、数字经济等纷纷加入“试验田”,这正是大模型应用和创新的桥头堡。
为了牢牢抓住这次机遇,在9月20日的2023数字经济峰会·城市智能升级论坛上,“华为盘古政务大模型联合创新行动”正式成立。
这次专项行动由华为政务一网通军团、华为云与国内智慧城市、数字政府领域的生态伙伴及城市共同发起,旨在“赋能政务和城市数字化向智能化升级”,推进大模型在政务服务、政务办公、城市治理等场景的联合创新方案开发。华为公司高级副总裁、政务一网通军团CEO杨瑞凯,华为公司副总裁、华为云中国区总裁张修征携众生态伙伴启动项目,活动吸引了全国各地的800多位城市主官共聚,探讨为L2层细分场景模型智能升级的创新路径。
三是战略层面,开放生态促创新,让技术、伙伴能以“插件”的方式融入大模型。华为大模型秉持一个全开放、联创的姿态,不管是数据资源资产、技术,还是合作伙伴,都能融入大模型,进行政务联合创新开发、场景模型适配打磨等,此次联合创新专项成立就是一个讯号。
可以说,在华为大模型中,软件伙伴、服务伙伴、数字化转型咨询与系统集成伙伴等都能找到一席之地,发挥特有价值。这是华为的大局观,也是对开放即未来的预判。
03 落地行业,智慧政务看得见
大模型从基础泛用走向行业专用,靠的不单是宏观层面的技术升级、战略加速,还包括能不能吃透领域知识?对行业理解的深度够不够?
华为盘古政务大模型构建了六大场景解决方案,让政务、城市智能化升级一步到位。
在政务服务领域,结合大模型的语义理解、知识问答、文本生成等原子能力,赋能政务智能问答、政务办事助手、数字营商助理三大核心场景,使匹配识别更精准、归类更智能。了解一组数据,咨询类业务分流率从40%提升到95%、企业标签自动生成精度超过90%。
在政务办公领域,全流程赋能轻松实现六大能力,包含生成公文草稿和标签、智能校对和语义纠错、生成摘要和草拟批示意见等。特别要提的是,进入深圳POC公文辅助生成场景,一分钟6000字,既规范又高效。
在城市活动保障方面,大模型化身“效率派”,3分钟生成预案初稿、3分钟形成报告初稿、实时统计最新数据、数字人运用等,让整体活动周期缩短、人员成本降低,同时高效率、高质量达成活动目标。
在城市治理领域,充分调动大模型泛化能力,单个摄像头“扫描”所有事件,排查效率直接提升80%。更能深度优化工单分派、时间分析等环节,精准匹配责任部门,智能辅助发现问题、解决问题。
在城市事件感知、城市数字孪生上,基于大模型能力还可以为城市“体检”,识别多种城市部件的异常问题,及时发现潜在风险并上报,同时实现云端自动建模,让城市建模全周期缩短40%、成本降低30%。
总而言之,有了基础大模型的全能土壤,再立足政务服务、城市治理、政府办公、数字孪生城市四大优势业务,华为盘古政务大模型势必拔节生长,成为政务数字化、城市智能化的一把好手。
04 生态大同,让开放“大有不同”
很显然,华为不满足大模型停留在行业层面。上文提到,为了行业下沉到细分场景,已经携手业界标准组织、专家、客户和伙伴共同发起“华为盘古政务大模型联合创新行动”。
这场联合创新专项的本质是什么?生态开放又究竟能发挥多大的价值?华为政务一网通军团全球MKT与解决方案总裁王彬做了准确解读,肯定了政务业务对连接政府、企业和市民的重要价值,此次联合专项的创新示范应用意义和提升数字政府、城市管治的能力。
从诸多落地合作中也可以看到,这次盛举正如“星星之火”般扩大蔓延。
作为AI行业新秀、也是此次专项成员之一,竹间智能深度参与了盘古大模型的核心技术,同时依据企业场景、业务需求等私有数据打造出“语言模型训练场”,以最低成本保障最佳实际应用效果。
除此之外,竹间智能的EmotiBrain模型工厂,相当于定制化大模型车间,能够依据行业特点、企业要求对大模型进行个性化“整形”,从适配上达到最优。这是通用大模型、一般行业模型,没有办法做到的。
对于竹间智能本身而言,与华为的强强联合不但证明自身的行业实力,也拓宽了业务侧的发展,在更多真实场景中为用户创造价值。以盘古为底座的政务助手、培训教练、写作、知识库四大场景中,竹间智能加速了政务场景的大模型落地。
比如,在某省级政府部门,竹间科技提供的知识管理解决方案极受青睐,实现了大量政务文档的智能归档、检索和推荐;AI培训教练则帮助某政府关联企业员工培训;定制版大语言模型,汇总分析大量公众意见和建议,为政策决策提供智能支撑;政务助手提供了政府办公与政务服务各场景,提高了政府员工的生产力。
像竹间智能这样的生态伙伴,还有很多很多,强强联合的例子不断发生:华为政务一网通军团与中软国际共同发布政务问数大模型,让数据到应用的距离更短、数字政府的治理能力更敏捷;湖南长沙作为专项联合发起方之一,积极试点,将政务大模型技术应用于城市治理、政务服务等领域,扛起大模型示范应用大旗……
那么,站在企业组织、市民等最终用户角度,这些合作会带来什么?是高效便捷的服务、强大的技术保障、安全的运营后盾、舒心的城市环境,是降本增效、生产力提高,更是市场竞争力的持续增强。
这样的利己、利他正是华为愿意看到的,也是其对于发展的态度。大模型,具有划时代意义,是一项全行业的事业,从算力、平台到服务、应用等,需要不同企业扮演不同角色,共创生态大繁荣,共赢协作硕果。