资讯
2024/7/25 15:42

云启WETELE系列云课堂第五讲:解锁大模型的无限可能

0
0

近日,由腾讯云携手中国信通院、C114通信网打造的“云启WETELE运营商数智升级”系列在线课堂,第五讲“穿越智算奇点,解锁大模型的无限可能”正式开讲,主讲人为腾讯云专家秦若毅。值得一提的是,44页演讲材料的所有文本、插图,均由AI自动生成。

2023年初以来,大模型横空出世,成为全球科技业竞逐的焦点,至今热度不减。秦若毅在讲解中指出,大模型数十亿到数千亿的参数量是其最显著的特征之一,数量级远远超过了传统的小模型。这意味着巨大的数据需求量、巨大的计算资源消耗量,其中,Llama 3、Claude 3.5、GPT-4o等国际大模型代表了当前人工智能领域的最前沿技术,它们在理解、生成和交互方面的能力不断突破,为各行各业带来了新的机遇和挑战。国内来看,则有腾讯混元大模型、阿里通义千问、百度文心一言、月之暗面Kimi等大模型极速崛起。

谈及大模型的技术,秦若毅形象地比喻,如果说大模型是一位“学霸”,那么学霸的“书架”是海量的训练数据,包括数据的采集、清洗、标注、融合、增强,构建了一个全面、高质量、多样化的知识库。这些训练策略确保了大模型在处理各种复杂任务时的准确性、泛化能力和鲁棒性。学霸的“大脑”是基底大模型(Foundation Model),是一种预训练的大型神经网络,其性能与参数量成正相关。更大的模型规模意味着更多的参数和更强的学习能力,能够更准确地理解和生成复杂的数据结构。学霸的“心脏”是智算底座,包括高性能算力集群、高性能网络传输、高性能存储系统。学霸的“书桌”是训练平台,必须具备高效的资源调度管理系统,以减少节点资源碎片化,提高调度成功率,并支持虚拟GPU调度,以提高容器资源利用率。学霸的“作业本”是模型优化,通过模型精调、提示工程、检索增强等步骤,成为行业应用的加速器。

在完成技术的积累,打造出大模型后,能够在哪些领域得到应用?秦若毅介绍,可以分为通用大模型和行业大模型,以及C端大模型应用和B端大模型应用。腾讯混元大模型在C端就有丰富的应用,例如腾讯会议、腾讯文档、腾讯聊天机器人等。

面向企业的大模型应用,腾讯研究院在2024年初进行了深入调研,整理出了不同行业的渗透率情况。对于行业应用,大模型的价值包含增强现有业务流程所带来的降本增效,也包含推动行业革新带来的全新经济价值,主要划分为运营效率提升、客户体验提升、业务流程重塑、产品价值创新四大场景。

在具体应用方面,秦若毅强调,基于大模型的生成式AI应用落地路线分为3条。根据落地复杂程度由简单到复杂依次别为,标准软件路线、标准模型能力增强路线和定制化模型精调训练路线。标准软件路线落地最为简单,企业直接采购开箱即用的软件完成落地;标准模型能力增强路线落地复杂度中等,企业需要参与提示词工程等环节来增强模型能力,优化模型输出结果;定制化模型精调训练路线落地最复杂,企业需要完成二次模型训练工作。在3条路线中,复杂度越低的路线,企业在落地过程中技术采购(Buy)占比越大;复杂度越高的路线,企业在落地过程中技术自建(Build)比例越高。

为了帮助企业更好的根据自身情况和项目需求选择适合的落地路线,腾讯云从评估维度和分工协作两个方面对每条路线进行解析,并对应提供差异化的腾讯云生成式AI产品方案,包括腾讯云AI代码助手、腾讯企点营销云AI助手、腾讯乐享AI助手等。

“目前腾讯云已经推出金融行业大模型、医学行业大模型、汽车行业大模型、教育行业大模型、文旅行业大模型等多个行业大模型,提供超50个行业大模型解决方案,助力客户构建专属大模型及智能应用,帮助客户提质增效。”秦若毅表示。

课堂结束后,在C114主持下,秦若毅和来自中国电信的卫健行业专家常德杰就大模型的发展前景、在卫健行业的应用落地等话题进行了热烈探讨。大模型已经触手可及,各行各业必须高度重视。接下来,云启WETELE系列云课堂下一期话题“数字科技与运营商行业发展趋势”即将上线,敬请关注!

版权说明:C114刊载的内容,凡注明来源为“C114通信网”或“C114原创”皆属C114版权所有,未经允许禁止转载、摘编,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。编译类文章仅出于传递更多信息之目的,不代表证实其描述或赞同其观点;翻译质量问题请指正

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销