在2025年中国移动合作伙伴大会上,中移互联网公司副总经理李斌动情地提到:“我国有近3000万听障人士,他们在日常沟通、教育就业、社会交往等方方面面都面临诸多困难。我们一直在思考,如何通过AI与通信技术的融合,为他们真正做点什么。”这段发言,揭开了中国移动在无障碍通信领域深耕多年的探索与成果。
其中,新通话展区演示了这一套以“通话”为入口,专为听障人士打造的无障碍通信解决方案。现场放出听障用户的真实发音:“牙疼得厉害,想看医生。”话音落下,手机屏幕同步显示出转写文字。工作人员介绍,其专属语音识别模型经过多次迭代,识别率已从15%提升至70%以上。
技术创新:从“一人一分析”到“个性化智能体”
听障人士发音模糊且差异大,通用模型识别准确率低,导致传统通信方式将他们隔绝在语音交流的大门之外。面对这一群体“开口难、沟通难、融入难”的现实困境,中国移动新通话团队自研的GOP算法成为破局关键,通过“一人一模型”的个性化训练,精准转译听障人士语音。该算法深度分析每位听障用户的发音特点,构建个性化语音表征,针对性地获取用户的弱点,定制化地设计练习任务,提高数据质量,实现“小样本精准训练”。这意味着,仅需以往三分之一的数据量,即可为听障用户训练出高度适配的专属语音识别模型,识别准确率大幅提升。该“个性化智能体”实现了“健听人士语音→实时文字→听障人士反馈→大模型转译”的闭环沟通。
模型应用:从“不敢开口”到“顺畅交流”
在实际应用中,该方案已集成至中国移动“5G新通话”平台,实现毫秒级语音转文字,让听障用户也能接打电话、进行双向沟通。配套的“中移无障碍”小程序,集成个人专属模型,在社交、就医、面试等场景中提供精准转写支持,打破面对面沟通壁垒。
此外,团队还引入“AI多模态发音教练”,通过声学分析与视觉反馈,帮助用户进行发音训练与游戏化陪练,从“敢说”迈向“会说”,真正实现沟通能力的长期提升。
社会价值:科技赋能,让沟通无障碍
目前,该方案已经帮助多位听障志愿者在紧急求助、职场面试中通过系统完成关键通话。技术的温度,正悄然改变着他们的生活轨迹。正如李斌总所言:“科技的价值,在于‘向善’。”中国移动以“通话”这一最基础的通信方式为起点,融合5G与AI,不仅为解决听障人士的沟通难题提供了可行路径,更展现出其在“AI普惠”道路上的决心与担当。
未来,中国移动将持续优化模型性能、拓展服务场景,并与聋人协会等机构深度合作,推动技术走向更广泛的人群。在AI与通信交织的新时代,每一次清晰的表达,都是改变的开始;每一份被听见的心声,都在构筑一个更加平等、温暖的社会。