C114通信网  |  通信人家园

专题
2023/8/8 14:43

基于大模型实现因果推断的探讨

邮电设计技术  贾琳琳,邓佳鑫,庞俊彪,张宝昌

本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部

摘要:大模型是利用海量数据形成庞大参数量的机器学习模型,而因果推断是推断和理解事件、变量或行为之间的因果关系。从大模型与因果推断相互结合的可能性和难点、大模型预训练、因果模型的人类反馈学习过程和微调技术等方面进行探讨,论述了大模型具有发现潜在因果关系的机制和因果关系预测及解释的潜力。此外,归纳了部分大模型开源工具,可用于快速实现大模型训练、验证和部署。

关键词:大模型;因果推断;机器学习

doi:10.12045/j.issn.1007-3043.2023.07.004

概述

1.1 大模型

大模型指利用海量数据用自监督方法进行训练而生成拥有庞大参数量的机器学习模型,它们为下游任务提供了优良的分布式特征表示能力和模型泛化能力。例如,处理复杂问答的多轮对话能力、人类情感对齐能力、数学问题的求解能力等。从大模型的发展上看,在2022年11月底,OpenAI发布了ChatGPT,2023 年 3 月 14 日,GPT-4 也随之发布。这 2 个模型的问世让全球切身感受到了人工智能从数据中形成智能的潜力。与此同时,随着MetaAI开源了备受瞩目的LLaMA框架以及斯坦福大学提出了Stanford Alpaca模型,业界开始涌现出更多类型的大模型。在国内,百度、腾讯、华为、阿里等互联网头部企业竞相布局AI产业,并推出“文心一言”“混元AI大模型”“盘古Chat”“通义千问”等一系列通用化大模型。可见,我国AI大模型发展加速,行业的垂直应用也呈现出多样性、加速性和广泛性。

1.2 因果推断

因果推断是一种统计和推理方法,旨在理解和推断事件、变量或行为之间的因果关系。因果推断可以被总结为 3 个层次。从问题角度出发,因果推断的第 1 个层次是相关性,即探索变量之间的关系。常规机器学习在应用中主要学习的就是变量之间的相关性。第 2 个层次是执因溯果,即研究实施某种干扰因素后产生的效果或者收益是否符合预期。第3个层次是由果执因,也被称为反事实推断,即为了得到某种结果需要怎么做。现在大多数因果建模都是从这一层次来进行探索。此外,多数因和果耦合在了一起,这可能导致因果推断无法获得满意的结果。因此,从因果推断的视角来看,将导致推断失误的因素解耦是一个至关重要的问题。与此同时,解耦因果同样对解决训练数据和测试数据的 Out-Of-Distribution(OOD)问题起到帮助。它有助于更好地理解事件和变量之间的因果联系,从而支持更有效的决策制定和干预措施的设计。显然,因果推断在许多领域具有广泛的应用,包括公共政策评估、医学研究、经济学和社会科学等。

因果推断应用场景广泛,可以被用于医疗诊断和治疗决策、公共政策制定、金融风险评估、自然灾害预测和防灾减灾等各个领域。具体如:因果推断在服务器问题诊断上的应用,而大模型可以分析服务器的运行数据,包括日志、传感器数据等。识别服务器中的异常行为和潜在问题,这使得预测服务器故障成为可能,并可及时采取相应的预防措施。同时,通过因果推断分析来确定问题的根本原因,并提供修复指导。

1.3 大模型与因果推断结合的可能性

大模型的强大分布式表示能力为因果推断提供了“因”和“果”的表示能力。即可以利用大模型来理解各种因果推断问题中的语义和表示,如因果发现和回答因果等问题。传统的因果发现和效应推理通常依赖于领域专家提供的先验领域知识,建立一些先验领域知识对相关领域的专家数量和知识互补性具有很高的要求。然而,大模型的特征表示能力提供了先验领域知识的表示能力,支持自然语言和形式方法之间的转换。此外,大模型的泛化能力能够整合关于因果机制的常识和领域知识,从而因果关系在大模型的微调阶段、实践和采用方面开辟了可能性,有助于人们更好地理解变量之间的因果联系。

因果推断对大模型的发展起到了促进作用。虽然,大模型能够在某些因果关系的简单问题上给出正确的答案,但目前的研究还不确定大模型是否能通过自监督学习掌握简单因果关系,并具备了因果推断的能力。然而,复杂因果关系及其可解释性注入到大模型学习的方法是还没有深入研究的领域。因此,复杂因果关系及其可解释性注入是大模型与因果推断结合的关键问题之一。相应地,基于大模型的因果推断的结论可解释性是大模型与因果推断结合的关键问题之二。

点击查看全文(PDF)>

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141