当地时间周三,美国科技巨头谷歌宣布推出其认为规模最大、功能最强大的人工智能模型Gemini,这种技术能够处理视频、音频和文本等不同内容形式的信息。
谷歌表示,该公司备受期待的人工智能模型名为Gemini,对比之前的技术,能够进行更复杂的推理,理解更加细微的信息。它通过阅读、过滤和理解信息,可以从数十万份文件中提取要点,将有助于在从科学到金融的许多领域实现新的突破。
谷歌首席执行官桑达尔·皮查伊在一篇博文中写道:“这个新模型代表了我们作为一家科技公司所做的最大的科学和工程努力之一,它也是一个多模态基础模型,可以概括和理解不同类型的信息,包括文本、代码、音频、图像和视频。”
自OpenAI一年前推出ChatGPT以来,谷歌一直在努力开发能够与这家公司相抗衡的人工智能软件。谷歌声称,已经在其人工智能助手Bard上添加了部分Gemini模型的技术,并表示计划在明年年初将最先进的Gemini模型完全融入到Bard中。
谷歌高管们认为,Gemini Pro的表现优于GPT-3.5,但回避了与GPT-4相比如何的问题。而在今年3月,OpenAI推出了GPT-4。
这家科技公司表示,将发布三种版本的Gemini,分别为Gemini Ultra、Gemini Pro和Gemini Nano。每个版本具有不同的信息处理能力,功能最强大的Gemini Ultra版本是为在数据中心运行而设计的,最弱的Gemini Nano版本将在移动设备上高效运行。
从12月13日开始,开发者和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。Android开发者也可以使用Gemini Nano进行软件开发。
DeepMind负责产品的副总裁Eli Collins声称,Gemini是谷歌DeepMind人工智能部门帮助创造的最强大的人工智能模型,但与该公司之前的大模型相比,它为用户提供的服务“明显”更加便宜。
Collins补充说:“因此,Gemini不仅功能更强,效率也高得多。最新的模型仍然需要大量的计算能力来训练,谷歌正在快速推进这一过程。”
谷歌还发布了其最强大的人工智能芯片Cloud TPU v5p,它是在之前的版本基础上进行的改进。根据谷歌的说法,与TPU v4相比,TPU v5p的浮点运算性能提升了两倍,它训练大语言模型的速度比TPU v4快2.8倍。