C114通信网  |  通信人家园

人工智能
2022/4/21 09:34

AI超拟真有声书《智能交通》上线,AIGC打开新想象空间

C114通信网  南山

C114讯 4月21日消息(南山)快节奏、碎片化的现代生活,发达的互联网技术,使得听有声书成为读书的一种流行形式。更令人意想不到的是,有声书还可以用AI技术创作。

4.23世界读书日前夕,喜马拉雅上线了AI超拟真有声书《智能交通》。这套有声书共86集,每集时长10-20分钟,首日上线21集,后续每天更新2集。据了解,用户在百度搜索“智能交通有声书”,可直接收听。

《智能交通》是百度董事长兼CEO李彦宏出版的一本著作,去年12月发行。百度语音合成团队基于《智能交通》一书20万字文本,使用李彦宏约1小时音频素材,通过AIGC(人工智能创作内容)技术生成了《智能交通》有声书。其音频合成效果还原度极高,普通用户听到的,几乎就是“原声”,难以分辨,也无需分辨。

“原声创作”展示了百度强悍的AI语音合成能力,也从一个侧面反映出AI技术正在加速渗透且改变人类社会。以《智能交通》有声书为例,一方面是AIGC(人工智能创作内容)的兴起,另一方面其本身蕴含的内容,是李彦宏对AI深度变革交通出行行业的解读:自动驾驶不是梦,交通拥堵不再怕,交通事故不断下降……

互联网上近年有一句话很流行:“你要悄悄努力,然后惊艳所有人。”AI,从最开始的挣扎,悄然间已遍布各行各业,很快将惊艳所有人。

Part1:AI超拟真有声书《智能交通》是如何创作的?

《智能交通》顾名思义,是一本讲述交通行业智能化现状与未来的专业书籍,涉及不同的表达语境、相当多的中英文专业词汇。据了解,百度语音合成团队只采用了李彦宏约1小时公开音频,可用数据约300句且口语化,场景单一且没有英文词汇。以常用语言为基础,创作专业版的有声书,这种极致的对比,可以直观凸显“地狱级”的难度。

您的浏览器不支持本音频元素,请更新浏览器。

▲《智能交通》有声书音频片段

挑战主要有四点:如何只利用300句数据,高度还原说话风格;如何只利用中文数据,合成出音色、风格一致的中、英文混合播报效果;如何只利用单一的访谈口语化数据,合成出专业和叙述等其它语境下内容,保证其流畅性和自然度;如何利用发音不标准的数据,合成出高音质、高还原度,发音准确稳定的效果。

团队一一提供了针对性解决方案:率先研发的端到端细粒度建模技术,从300个整句的学习,进化到300句乘以每句20个字的学习方式,更好的挖掘了字与字之间的相互关系,更加高效的利用了数据。基于该技术,个性化合成只9句即可实现普通效果,300句已达到专业水准。

独创的解耦式建模技术,可以对说话的内容、风格、音色进行区分,并独立建模;通过大数据的学习,将学习到的三个维度能力进行迁移。从而达到让一个不会说英文的人,也可以正确的读出英文。此外也可以将风格能力迁移到特定人身上,例如讲故事。

此外,前后端联合建模技术,依托百度在语言处理的优势,结合文本处理与发音合成两大模块,联合学习了大量不同文本语境下的发音方式,实现跨语境合成;独创的通用声码器合成技术,结合了传统参数声码器的可控以及神经网络声码器的高还原度优势,修复错误发音和提升音频质量,有效解决口语环境下存在的发音不标准的问题。

目前,只需9句话素材、5分钟等待,百度语音合成技术即可实现对用户声音的复刻,300句话即可生成媲美专业音库的音频内容。作为业内唯一能提供10句话以内大规模产品级个性化语音合成服务的公司,百度相关技术早已应用于各类产品中,如在百度地图吸引超过600位明星红人入驻语音广场,实现个性化定制语音包,每日播放次数达2亿。

通过《智能交通》的创作,可以看到AIGC技术的进化,已经能够解决一些看似无法解决的难题,从而在技术层面扫除障碍。创作者基于AI技术平台,可以将精力聚焦于内容本身,从而大大解放了生产力,为行业发展带来了光明前景。百度的各类“率先”、“独创”技术,则证明了其在AI语音合成领域的江湖地位。

Part2:《智能交通》讲述了什么?

如果说AI有声书反映了AI技术在新兴领域的创造力,那么智能交通就是AI技术深刻变革传统行业的代表。《智能交通》这本书中,李彦宏从关注自动驾驶解决安全问题开始,一点一点深入,也一点一点放大关注的尺度——关注人类司机危险驾驶的问题以及自动驾驶、智能交通、智慧城市等问题。

比如,将交通事故率降低90%;根据国际公路安全协会发布的数据,每年约有135万人死于交通事故,降低90%就可以减少百万人死亡。再如,助力国家“3060”双碳目标达成,交通是非常重要的一环。建设未来的智慧城市,智能交通也是重要组成部分。李彦宏认为,智能交通系统可以提高通行效率,节约能源,降低空气污染的水平,帮助碳达峰和碳中和,惠及每一个有出行需求的人。

如果说这是《智能交通》一书创作的初衷,那么其中探讨的内容,更是全景式展现了人工智能技术的价值。聪明的车、智慧的路,构筑完整的车路协同系统,李彦宏判断,智能交通将是影响未来10-40年的重大变革,10年之内,依托交通效率提升,城市拥堵问题将基本解决。

C114留意到,《智能交通》出版上市,受到了众多知名人士和知名媒体的好评。例如中国工程院院士、国家新一代人工智能战略咨询委员会主任潘云鹤作序表示,“智能交通是一个兼具深度和广度的智能大系统,书中相关创新研究和实践,一定能推动和引领国内外智能交通的新发展。”

用AI技术基于本书创作的有声书,值得一听。对行业人士来说,堪称“双倍智能”的体验。

Part3:颠覆AIGC,颠覆智能交通

百度在AI领域拥有宏伟的布局,仅从这套AI有声书,就可以窥见其在两个垂直领域的雄心:颠覆AIGC、颠覆智能交通。

从AIGC来看,当前市面流行的内容,无论是从制作方式还是内容本身都较为粗浅,仅仅是人工制作内容的补充,远远称不上主流。AI有声书《智能交通》由于内容的专业性,很难成为爆款产品,但其采用AI技术制作的精英级水准,显示出AIGC产业具有巨大潜力和可兑现能力,百度将扮演重要角色。

智能交通领域更加能够全方位考验一家人工智能公司的全栈式能力、深度学习水平、行业解决方案的价值与综合社会效益。百度作为一家人工智能公司,在智能交通领域起步早、投资大、态度坚决,早已处于领军者地位。

一方面,百度是全球领先的自动驾驶技术开发商,不仅推出自动驾驶开放平台Apollo,还推出了自动驾驶出行服务平台萝卜快跑;另一方面,百度深入参与到全国智能交通的建设中,支持多个国家级车联网先导区和各省市先导区的高质量发展,从自动驾驶,走向自动驾驶和车路协同的全面发展。

百度在智能交通领域的深度实践,正推动人工智能技术的产业化进行一次高级别的、高价值的、高技术含量的验证。而在AIGC领域的小试牛刀,也为行业注入了一股技术创新力,将搅动这一池春水,等待着内容创作者的热情回应。

给作者点赞
0 VS 0
写得不太好

版权说明:凡注明来源为“C114通信网”的文章皆属C114版权所有,除与C114签署内容授权协议的单位外,其他单位未经允许禁止转载、摘编,违者必究。如需使用,请联系021-54451141。其中编译类仅出于传递更多信息之目的,系C114对海外相关站点最新信息的翻译稿,仅供参考,不代表证实其描述或赞同其观点,投资者据此操作,风险自担;翻译质量问题请指正

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2022 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141