C114通信网  |  通信人家园

人工智能
2020/10/22 16:02

从单品爆款到智能家居:数据标注的“升维”打法

C114通信网  南山

C114讯 10月22日消息(南山)在ICT行业众多“风口”中,智能家居无疑是特别的一个。整个产业链,从运营商、设备商、终端制造商到家电家居厂商都认同智能家居是万亿级的大市场,互联网公司也纷纷入局,意图“降维打击”。但十多年来,先驱大多已经熬成了先烈,市场还没有真正起来,产业规模离万亿级差了一个数量级。

突破口是智能音箱,被互联网公司做成了单品爆款,比较典型的有小爱同学、小度音箱等。据笔者了解,为了形容小爱同学的“智能”,小米公司近期还特地拍摄了一段有趣的短视频。雷军:“我是谁?” 小爱同学:“他是我的爸爸,我很爱他……”

让智能家居“听懂”人们说的话,学会“察言观色”,这是更高层次的人工智能。可以判断,不仅是智能音箱,AI数据赋能让各类终端变得更加聪明,打开了智能家居爆发式发展的想象空间。

在日前举办的中国(杭州)国际智能产品博览会暨全球人工智能大会上,云测数据公司总经理贾宇航发表演讲提到,人工智能一共有三要素,算力、算法、数据。前两者是基础设施和能力,后者是让AI学习的知识素材。只有高质量的标注数据,才能高效训练算法,赋能各种类型的终端。云测数据宣布的“最高交付数据99.99%精准度”,正是AI数据服务受到产业重视,成为人工智能应用重要一环的标杆性成就。

小作坊到大生产

在人工智能三要素中,算力与算法已经取得令人醒目的进步,且仍处在高速发展中。从算法看,已批量诞生独角兽公司,最典型的是人工智能“四小龙”商汤、旷视、云从、依图。从算力看,今年发改委明确“新基建”范围,定义了算力基础设施,包括数据中心,智能计算中心等,算力发展迎来了政策层面的大利好。

在数据方面,业界也认识到其价值的重要性,“没有好的数据,人工智能没有未来”已成行业共识。随着人工智能技术落地场景,不同场景提出了更高质量、更多元的数据需求。从数据服务的趋势看,原有的小作坊式数据生产,逐渐向大规模专业第三方供应商迁移。

第三方定制化数据标注服务商,最具代表性的企业当属云测数据。其中,在《互联网周刊》联合eNet研究院共同发布的《2020年数据标注公司排行》中,云测数据位列第一。有媒体总结,目前中国在 AI 领域有五家公司被称为“人工智能五强”,算法层有商汤、旷视,AI数据领域有云测数据,硬件方面有涂鸦智能、地平线。这些公司专注于深耕AI细分领域并拥有让行业认可的成果。其中,云测数据在今年首场国家级重大国际经贸活动服贸会上,首次发布了一项数据标注领域的重要成果:云测数据项目最高交付精准度达到了99.99%,刷新了数据标注领域可达到的最高服务标准,显示出一向“低调”的数据服务领域,也和算力、算法一样正在取得显著进步。中国人工智能在底层基础支撑、中间技术创新、顶层应用之间正在形成完整的生态链。

据了解,云测数据一方面自建了数据场景实验室与数据标注基地来对相应AI数据进行生产。另一方面,在AI数据生产中,设计了从创建任务、分配任务、标注流转、到质检/抽检环节和最后的验收等更完善的管理流程,每个环节有相应专业人员来把控数据标注的质量和时间节点,从而提高了数据生产的质量和效率。

在笔者看来,云测数据“四个九”以及背后的数据生产方式,意味着数据标注产业“小作坊”式生产将越来越难以为继。随着人工智能场景化渗透带来的高质量数据需求大幅提升,数据标注产业呈现马太效应的趋势,将逐渐向头部公司聚集。

云测数据的“升维”打法

相比互联网公司运用互联网思维进军智能家居家居市场,号称降维打击,云测数据在AI数据标注方面,采取了“升维”的打法。提升数据精准度是其中一方面;另一方面,在数据场景化标注方面,云测数据也做了大量工作。

其行业首创的数据场景实验室,通过还原真实使用场景,深入研究人工智能长尾场景特点,完成在对应传感器下的场景数据采集工作。这种专注和用心,弥补了很多原始数据的不足。基于数据场景实验室,云测数据数据采集的维度,能够全方位支持企业在文本、语音、图像、视频等各类AI数据的需求。

以智能家居为例,由于智能家居多以房屋、住宅、社区为载体,应用场景相对更具集中性和确定性,因此更重产品更重体验。人工智能主要解决的是机器在看、听、理解方面的问题,语音识别与自然语言处理能力已经成为兵家必争之地。

云测数据标注数据的维度,在语音方面,支持ASR语音转写、声纹识别标注、说话人识别、语音切割、情绪判定标注等;在自然语言处理方面,支持OCR转写、NLU语句泛化、文本信息抽取、实体标注、词性标注、槽位填充等,支持全方位的标注类型。同时,具有自主知识产权的数据标注平台拥有灵活、高效、智能的特点,数据标注过程更加高效高质,最终帮助智能家居产品落地。

“从深度学习、机器学习的发展趋势和应用方向可以明显看到,不管是钻得更深或是在应用层面铺得更广,我们都会需要更多数据。我觉得这个趋势至少还能保持十几年。”据甲子光年之前报道,AI企业对高质量数据需求呈现“饥渴”状态。这有助于云测数据等头部玩家能够迅速抓住行业转型的时机,在市场落地过程中,形成AI数据服务新的游戏规则。

给作者点赞
0 VS 0
写得不太好

版权说明:凡注明来源为“C114通信网”的文章皆属C114版权所有,除与C114签署内容授权协议的单位外,其他单位未经允许禁止转载、摘编,违者必究。如需使用,请联系021-54451141。其中编译类仅出于传递更多信息之目的,系C114对海外相关站点最新信息的翻译稿,仅供参考,不代表证实其描述或赞同其观点,投资者据此操作,风险自担;翻译质量问题请指正

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141