C114通信网  |  通信人家园

专题
2019/5/10 11:52

平台搭建应用基础,AI驱动技术革命

机器成精  AI观察者

5月9日,2019全球人工智能产品应用博览会在苏州开幕。会上,百度AI技术平台体系(AIG)和基础技术体系(TG)总负责人王海峰分享了题为《新一代人工智能技术及应用》的主题演讲。

人工智能平台是基础

人工智能是我们这个时代最热门的词汇之一,被认为是新一轮科技革命和产业革命的重要驱动力量。世界各国也高度重视,每个国家都有自己的一些人工智能相应的规划、倡议、战略等等。

王海峰表示,人工智能应用在方方面面,而这一切的基础是人工智能的平台。这个平台从最基础的算法、算力和数据到和人的感知相关的语音、视觉以及增强现实、虚拟现实等等,以及认知层,是跟人的语言和知识相关。在所有这些技术的基础上,形成人工智能的平台。

人工智能的应用

在谈及人工智能目前的应用与面临的难题时,王海峰从感知层和认知层两方面进行了详细的介绍。

感知层——顾名思义就是视听方面的应用

语音识别与合成。语音识别与合成技术作为目前最热门的技术之一,随着技术的不断进步以及数据等等计算能力的增强,这项技术已在多个场景下得到应用。

现在人工智能的发展不仅仅是一个算法,一个软件,一个块,真正来做产品的时候往往是跟特定的硬件相结合。比如智能音箱,除了做基本的语音识别以外还要做麦克风阵列,一个智能音箱,它往往不是一个麦克风,而是多个麦克风,这个时候有麦克风的定向方面的技术,会使我们远程识别做的更好。同时这些设备需要低功耗,需要在计算量相对很小的情况下怎么样去做这些语言的技术。

图像识别技术。现在不管是刷脸进一些门禁还是刷脸支付,人脸识别技术已经有很多用途。还有一种就是人体,这是在百度科技园里面的一个无人商店,它就不是特定一幅图,而是要全程的去做一个跟踪,比如顾客进来它会知道这个人走到哪儿,拿了什么,然后出门的时候不用专门再去结帐,自动就会结帐,这里面涉及到人体的识别和追踪。

图像生成技术。如今AI主播大热,结合了声音合成技术和图像生成技术,将人、物、声音等进行处理,可以生成一个虚拟的主播,甚至连视频都可以进行完整的合成。

当然,图像有很多相关的任务。比如说图像的检测、细粒度的识别以及图像的处理等等。还有一些特定的任务,识别的时候它有很多特定的格式。一个表格,一个图文并茂的图,或者是一些票据,这些不仅是把里面的文字、数字识别出来,同时要做好了格式化、结构化。

认知层——即语言和知识的技术

知识图谱。深度学习技术的发展,对人工智能产生了很大的推动作用。这些很需要知识,而知识的统计、挖掘、凝练以及存储、使用、推理等等就显得尤为重要。

所谓知识图谱就是用自然语言处理的技术去分析,也需要对它进行各种网页结构的分析,最后可以从里面挖掘出很多知识,同时基于属性聚类进行指示体系的扩展。知识图谱通过这种大数据挖掘,现在已经达到千亿级的规模。

实际应用方面,比如现在人们出行会越来越多依赖地图,地图里面有很多点,比如说酒店是一个点,旁边会展中心是一个点。每个点上又有很多属性,比如说这个酒店它是一个五星级酒店,是一个什么什么样的酒店,比如它里面有什么设施,这时候每个点上又有很多属性,这个时候在地图应用里面就会非常有用。

如今针对任何一个行业,也会构建这个行业的知识图谱。比如有这样一段原始的文本,说患者发热怎么怎么样,我们通过自然语言的分析可以把它结构化,提炼这里面涉及到的症状、体征、检查等等特征,然后把这些文本结构化,从而就可以构建一个知识图谱,支撑相应的应用。

词法分析。一个典型的应用场景是用户查询,比如说胡歌演的古装剧有哪些这样一个句子,首先我们对它进行句法分析,把它分一棵树,然后再进行语义理解。后,一句比较长的话经过分析得知,其实它的核心点就是要找胡歌的古装剧。

语言生成。现在有一些文章是人来写的,也有一些文章是机器自动来写的。比如说体育比赛,在知道基本信息以后,可以生成图文并茂并且很流畅的一篇文章。如今机器写的文章跟人的水平已经很接近了,人已经很难分辨这个文章到底是人写的还是机器写的。

语音搜索:感知层+认知层

运用人工智能将感知、认知进行融合,会形成更加智能的应用,比如在进行语音搜索时,它不只是对用户的语音进行识别,也不只是语义理解,还有上下文。第一个说杭州,第二个说苏州呢?它就知道要问苏州的什么,所以是结合了语音识别、合成、语言理解以及上下文的理解来做这样一个多模态的搜索。

所谓多模态就是涉及到听觉、视觉、语言知识等等,结合起来做一个多模态的深度语义理解。比如说一段视频,我们可以对视频进行分析,找到里面关键的人,关键幀的信息,可以做多模态的实体的解析,也可以做视觉的分析,做里面文字的分析,从而这样一段文字可以构建这样一个图谱,这个图谱进而生成最右侧这样一个结构化的理解,比如可以看到它的剧名什么,演员、角色等等。

百度PaddlePaddle

会议最后,王海峰也分享了百度的人工智能开源开放平台,这样一个平台有算法开源、数据的开源,包括通用的定制的AI能力开放等等,从而支撑第三方的服务,支撑行业的应用。

据介绍,百度开发的PaddlePaddle是自然语言处理、视觉等等,推荐各种任务的模型库,底下有支撑,各种训练预测以及动态图、静态图等等,同时有各种构建,会提供服务平台,可以更方便的使用基础定制化,也可以做一站式开发和学习的平台。

人工智能是新一轮科技革命和产业革命的重要驱动力量,如今已应用于各行各业。诚然,每个人不可能都从最开始学习,人工智能平台会成为一切的基础。如今,开放式的人工智能平台也应运而生,为企业提供了打造产品和发展业务的平台,助力打造更加智能化的社会。

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141