Cloud&AI
2026/5/9 08:54

人声接近真人!OpenAI更新三款超强语音AI

0
0

据媒体报道,OpenAI正式宣布对其实时API接口进行重大升级,一次性推出三款全新高阶语音智能模型,全面强化AI在实时听觉、口语交互、翻译与转录方面的能力,并大幅降低企业开发智能语音应用的技术门槛。

本次更新的核心产品包括:GPT-Realtime-2、实时翻译模型以及实时转写模型。其中,GPT-Realtime-2搭载了GPT-5级别的推理能力,人声仿真度进一步提升。

相比前代产品,它能够更精准地理解并处理复杂的人类指令,实现更自然、更智能的连续对话交互。

在翻译方面,GPT-Realtime-Translate支持超过70种语言的识别以及13种语言的语音输出,能够同步人声语速完成实时翻译,实现无卡顿的跨语言沟通。

配套上线的Whisper实时转录模型,可在人机互动过程中同步完成语音转文字,适用于会议记录、实时笔录等高频办公场景。

OpenAI表示,本次升级将AI音频交互从基础问答提升为综合性智能语音操作系统,集聆听、思考、翻译、转写与实时响应于一体,实用性大幅增强。

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销