银牌组最高分，谷歌DeepMind捅破AI数学推理上限：6道国际奥数题解出4道 - Cloud&AI

量子大观

通信人家园

C114通信网

光通信观察

DVBCN中广5G

2024/7/26 09:45

银牌组最高分，谷歌DeepMind捅破AI数学推理上限：6道国际奥数题解出4道

IT之家故渊

谷歌 DeepMind 团队昨日（7 月 25 日）发布博文，表示其研发的 AlphaProof 和 AlphaGeometry 2 模型可以解决数学中的高级推理问题，在解答国际数学奥林匹克竞赛难题方面达到银牌标准。

AI 模型简介

AlphaProof：基于强化学习的全新数学形式推理系统。

AlphaGeometry 2：几何解题系统的改进版。

DeepMind 团队结合两个 AI 模型，协作解决了今年国际数学奥林匹克（IMO）6 道题目中的 4 道，首次在竞赛中取得与银牌得主同等的成绩。

评分团队

DeepMind 团队两位专家，根据 IMO 的评分规则进行评分，这两位专家分别为：

蒂莫西高尔斯教授（Prof Sir Timothy Gowers）：著名数学家、IMO 金牌得主和菲尔兹奖得主。

约瑟夫-迈尔斯博士（Dr Joseph Myers）：两届 IMO 金牌得主、IMO 2024 年问题遴选委员会主席

AI 模型推理

AI 会将 IMO 的 6 道题目翻译成为模型可以理解的数学语言。

AlphaProof 通过确定答案并证明其正确性，解决了两个代数问题和一个数论问题，而其中解决的 1 个问题是比赛中最难的，在今年的 IMO 中只有 5 位选手解决了这一问题。

AlphaGeometry 2 证明了几何问题，没有解决 2 个组合问题。

AI 模型结果

按照 IMO 规则，6 道题目每道题可获得 7 分，总分最高为 42 分。

DeepMind 系统最终获得了 28 分，每个问题都得到了满分，相当于银牌组的最高分。

2024 年的金奖门槛从 29 分开始，在正式比赛中，609 名参赛者中有 58 人获得了金奖。

免责声明：本文仅代表作者个人观点，与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

给作者点赞

0 VS 0

写得不太好