如今,我们走在大街上忽然需要某些信息如查询地址、酒店等,首先想到的就是手机搜索和拨打运营商专门信息查询电话。未来,在移动互联网中,我们能不能用上运营商自身的搜索引擎呢?
运营商亟须
整合各地信息资源库
搜索引擎是随着互联网发展而发展起来的,是解决用户海量信息获取的基本工具,其处于互联网各类应用的前列。传统搜索引擎不参与服务,只提供线索,并且依靠广告获取盈利。随着以百度音乐搜索、Google购物等各类垂直频道的出现,搜索引擎已经不满足只提供线索,越来越向垂直领域和服务领域渗透。随着IT技术的发展,随时随地满足人们的信息化需求正在成为现实。在这种形式下,运营商管道化趋势日益明显。但是“智能管道”概念的提出,给运营商参与信息服务指明了战略方向,如何利用运营商的优势,结合运营商基础能力开展面向高速宽带移动通信网信息服务是运营商参与移动互联网竞争中亟待解决的课题。
信息从产生起就具备各种属性,而对这些属性理解、开发和利用成为各类企业成功的基础。例如,Google利用了互联网信息的链接关联性;Facebook、腾讯面向信息的社会性;苹果面向信息的集成展示及应用。基于运营商网络产生的信息,包括信息需求的产生都带有天然属性,这些属性从客观上反映了信息发布和需求的本质。但与其他互联网或移动互联网企业相比,运营商一直没有利用自身网络特性相关的信息开展有针对性的信息服务。此外,运营商的产品、服务也积累了大量的可用信息,而这些信息以不同形式存储于各类业务、支撑系统之中,用户所享受各类信息服务之间的关联性很难建立并被利用;对于单纯的个体用户,其信息需求难以满足,即当用户登录运营商门户时,只能享受所登录门户提供的服务。最大的例子是用户的属地属性,目前用户基本无法完成跨属地的信息服务。
电信运营商具备覆盖全国的信息采集及服务架构,在各个地方都形成了一个比较完善的本地信息资源库。在每个本地网单元,信息服务体系建设完善,从信息的搜集、规范化、服务开通、计费等环节都已经完善。运营商的服务渗透到社会服务的各个层面。随着3G网络建设、物联网应用的开展,运营商在基于网络的支撑信息采集能力进一步加强。在为用户提供无线接入网络服务的同时,支撑信息服务必要的元素,如定位能力、终端信息的识别能力逐步完善,进一步基于这些增强信息的产品应用开放架构逐步成型。虽然各类信息资源库建设目标数据模型存在差异,但是集合全国的优势,就超越了其他信息服务商资源整合的能力。欠缺的是如何统一利用这些资源库,形成一个面向产品的良性循环机制。
分布式搜索引擎
更适合运营商
基于以上分析,运营商在本地信息生活服务领域,对于电子商务类等有计费需求的信息服务适合进行搜索引擎建设,以有特色的搜索引擎信息服务切入到移动互联网信息服务领域。但其中有几个关键环节需要确定:第一,运营商所主导的搜索引擎架构设计和应用战略方向。第二,建设搜索引擎的核心技术环节。应该预见到不同的技术服务架构和服务方向,将带来不同的搜索引擎架构和具体支撑技术的差异性。适合运营商的搜索引擎系统架构宏观上可分为两种:集中式搜索引擎建设和分布式搜索引擎建设架构。集中式搜索引擎即维护一个核心的搜索引擎系统,统一设计一套数据模型,按照这套数据模型上传或抓取服务数据,然后按照统一设定的搜索计算规则进行信息搜索服务。这种思路的好处是有利于形成一致的搜索体验,缺点是产品的适应能力弱,面向不同主题的信息服务,需要独立拆分出不同领域的垂直引擎或垂直搜索服务接口。运营商如果采用这个搜索引擎架构,在业务能力的拓展上,围绕这个核心引擎的不同业务系统需要遵从统一标准在支撑系统、计费系统上进行相应的修改,而且需要从业务系统层面进行业务的二次排序和封装,搜索引擎的返回结果适合本地业务系统并满足本地业务支撑系统的需求。分布式搜索引擎架构的核心思想是在中心节点维护一个不同领域或是地域的搜索引擎服务能力库,通过核心点对于业务的判断调用不同的引擎能力对外提供服务。分布式搜索引擎中心节点自身没有搜索能力,但是维护一个可以提供搜索的引擎列表,当接收到搜索请求后,把问题分发到列表中的各个引擎中,再综合各个单独引擎的返回结果为用户提供服务。这种思路相对适合目前运营商信息服务及运营体系,能最大限度地发挥运营商本地信息服务的优势,同时也符合互联网开放平台架构的演进思路。集中式平台需要在规划建设上面面俱到,而以应用为核心的开放式平台只需提供一个底层的应用环境,在用户使用上提供准确的分派即可满足用户不同层面的信息需求。这种设计思想的优点是核心引擎自己不提供服务,但能快速地获得能为用户提供服务的搜索引擎,并且集合各个不同引擎的搜索结果,可以为用户提供一个相对全面的搜索结果集合。缺点是不同引擎返回结果的整合,包括信息排重、过滤等需要根据数据资源的状况和给用户的展示形式进行详细设计;并且各地不同的业务逻辑封装需要在统一的规范下进行。目前有代表性的分布式搜索引擎类型有以下几种:分布式元搜索引擎、理解指派型分布式搜索引擎以及P2P搜索引擎等。
不论采用哪种搜索引擎设计思路,摆在运营商面前的第一个技术难题是自然语言理解技术。自然语言的识别及处理是人工智能(AI)研究的课题。自然语言处理和人工智能的其他领域(如定理证明、问题解答、模式识别、机器博弈和机器人科学等)的根本问题都是信息表达和利用问题,如何去获取各种不同的信息,并以一种计算机可以使用和处理的方法表达与计算信息。运营商需要在设计和开发环节掌握面向自身服务与产品的自然语言理解技术,如面向短/小文本自然语言理解技术,针对结构化信息的自然语言理解的应用开发技术等。
面向移动互联网的机遇和实施企业战略转型的要求,推动了运营商选择不同的搜索引擎构架策略,否则分散式的产品开发既带来资源的浪费,又难以和苹果、Google等移动互联网公司竞争,进而逐步被边缘化。另外,运营商在面向智能管道的移动互联网产品开发中所掌握的底层技术能力又要有所侧重,自然语言理解技术、数据处理及应用开发技术等在其中是不可或缺的。