资讯
`
2024/5/26 21:02
中国电信发布创新语音识别大模型 支持30种方言混说
0
0

在近日举办的第七届数字中国建设峰会上,中国电信人工智能研究院宣布了一项技术突破,发布了业内首个能同时识别30种方言的语音识别大模型——星辰超多方言语音识别大模型。这一创新技术打破了传统单一模型仅能识别特定方言的限制,为语言文化的传承注入了新的活力。

中国是一个语言多样性极其丰富的国家,“百里不同俗,十里不同音”的现象十分普遍。方言作为地域文化的重要组成部分,其保护和传承显得尤为重要。然而,由于方言种类繁多,语法语音特征各异,传统的方言研究方式依赖大量的人力进行主观感知和标注,工作量大且标注难以系统化。在此背景下,AI技术的介入无疑为方言的保护和研究带来变革。

星辰超多方言语音识别大模型的发布,正是基于AI技术的高效与系统性对方言进行整理归纳的重大成果。该模型不仅能同时识别包括粤语、上海话、四川话、温州话等在内的30多种方言,更在丰富性和质量上居于行业前列。这得益于中国电信人工智能研究院构建的超过30种、总计超过30万小时的高质量方言数据库。

在技术研发方面,中国电信的研发团队首创了“蒸馏+膨胀”联合训练算法,有效解决了在超大规模多场景数据集和大规模参数条件下预训练可能出现的坍缩问题。

目前,星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服进行试点应用。通过接入星辰大模型,智能客服能够迅速理解30种方言,日均处理电话量达到约200万通,极大地提高了服务效率和用户体验。此外,该模型还在多个城市的12345市民服务平台得到应用,为市民提供更加便捷的服务。

星辰超多方言语音识别大模型的发布和应用,不仅展示了AI技术在语言文化传承方面的巨大潜力,也为中国电信在人工智能领域的研究和应用增添了新的亮点。

  免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销