C114通信网: 门户(微博 微信) 论坛(微博) 人才(微博) 百科 | C114客户端 | English | IDC联盟 与风网

人工智能 - 正文 运营商投稿当日通信资讯

智能IoT设备应用语音技术,需解决三大挑战

www.c114.com.cn ( 2019/7/29 08:54 )

C114讯 7月29消息(南山)在近期举办的2019全球人工智能与机器人峰会上,思必驰CTO周伟达介绍了智能耳机、智能音箱等IoT产品应用语音技术的挑战,并给出了相应的解决方法。

挑战一是低功耗。智能音箱一般插电,百毫瓦级别的功耗可以接受,但智能耳机的电池只有70到80毫瓦时,功耗必须做到1毫瓦左右,包括数字麦克风、ADC、功放等,留给语音采集、唤醒、声纹、本地识别的部分非常少,挑战很大。

挑战二是远场和高噪声,IoT智能家居不能用手握着麦克风采集语音,很多环境下人们需要跟设备进行自然地语音交互,这种远场的语音交互一是有较低的信噪比,二是会有周围噪声的干扰。

挑战三是全场景智能交互,IoT设备五花八门,涉及的场景超过100个,语音技术现在还不能绝对做到通用的语音识别,涉及到场景背后的语音模型带来的领域知识,很多需要定制,这是语音技术走向市场化、规模化的挑战。

周伟达指出,对于功耗,行业内的解决方法基本上“算法+硬件”,思必驰则是从算法的需求定义芯片,通过算法逐级计算性能,逐级把极少的场景下启用高功耗,大部分的场景下保持低功耗工作。

对于远场和高噪声,行业内普遍采用麦克风阵列,从环形四麦、环形六麦,双麦阵列、线性四麦,思必驰采用了分布式麦克风阵列,不受间距约束,并针对常见的快递小哥用耳机通话的风噪场景,进行针对性降噪处理。

对于全场景的语音交互,很多家庭已有多台智能IoT设备,唤醒交互已经成为“反人类设计”,需要解决多设备交互、多设备联动,并有很强的语义选择能力、多模态直视唤醒能力。思必驰采用平台化思路,接入开发者,打通智能家居各种互联协议,目前已打通20多个协议。

作者:南山   来源:C114通信网

  免责声明:本文仅代表作者个人观点,与C114中国通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞

轻松参与

0VS0

表达立场

写的不太好

本文关键字:

Copyright©1999-2019 c114 All Rights Reserved
上海荧通网络信息技术有限公司版权所有
南方广告业务部: 021-54451141,54451142 E-mail:c114@c114.net
北方广告业务部: 010-63533177,63533977 E-mail:shixinqi@c114.com.cn
编辑部联系: 021-54451141,54451142 E-mail:editor@c114.com.cn
服务热线: 021-54451141,54451142
沪ICP备12002291号