开启无缝AI语音聊天，OpenAI下周开始向ChatGPT Plus用户推出Alpha版GPT-4o语音模式

IT之家故渊

OpenAI 首席执行官山姆阿尔特曼（Sam Altman）今天回复网友提问，表示将于下周面向 ChatGPT Plus 用户，开放 Alpha 版本 GPT-4o 的语音模式（Voice Mode），实现无缝聊天。

据今年 5 月报道，OpenAI 首席技术官穆里穆拉蒂（Muri Murati）在演讲中表示：

在 GPT-4o 中，我们训练了跨文本、视觉和音频的端到端全新统一模型，这意味着所有输入和输出都由同一个神经网络处理。

由于 GPT-4o 是我们第一个结合所有这些模式的模型，因此我们在探索该模型的功能及其局限性方面仍处于起步阶段。

OpenAI 公司原计划今年 6 月底，邀请一小部分 ChatGPT Plus 用户测试 GPT-4o 语音模式，但官方在 6 月宣布推迟，表示需要更多时间打磨该模型，提高该模型检测和拒绝某些内容的能力。

根据此前曝光的信息，GPT-3.5 模型的平均语音反馈延迟为 2.8 秒，而 GPT-4 模型的延迟为 5.4 秒，因此在语音交流方面不太优秀，而即将推出的 GPT-4o 可以极大地缩短延迟时间，近乎无缝对话。

免责声明：本文仅代表作者个人观点，与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

给作者点赞

0 VS 0

写得不太好