C114通信网  |  通信人家园

资讯
2018/10/19 09:27

中国移动自主开发大赛10强 | 智能图像转换神器“悟空”诞生记

移动Labs  重庆移动 曹旭

我们的团队

悟空团队由重庆公司12582基地的5名有激情有梦想的程序员小伙伴组成

产品经理、架构师曹旭:哈尔滨工业大学计算机专业硕士,负责算法研究、整体架构设计等

算法工程师周波:重庆大学计算机专业硕士,负责样本数据处理、模型训练

后端开发工程师袁文树:中国人民大学计算机专业学士,负责后端代码编写

前端开发工程师邱凯:重庆邮电大学计算机智能科学与技术学士,负责前端代码编写

测试工程师王锋:重庆邮电大学信号与信息处理专业硕士,负责UI设计、产品功能测试

一、创意与机遇的碰撞

为贯彻落实党的十九大精神和国家“大众创业、万众创新”工作要求,持续推动公司转型,实现全员创新常态化,中国移动集团公司、集团工会决定举办“中国移动2018 年(第四届)自主开发大赛”,本届大赛围绕公司“大连接”战略,以“人工智能”为主题,面向内部员工自主开发产品。

恰逢此时,一个小伙伴想把长辈老照片修复,却又找不到一款对口应用的感慨也在闲聊中产生,于是小伙伴们一拍即合,迅速组建了团队,创意与机遇的巧合碰撞,于是抱着值得一试的态度,第一代悟空便由此诞生了。

二、悟空诞生记

最开始的悟空,被定义为一个修复老照片的利器,专门针对性的修复陈旧老照片的各种问题。随着悟空的迭代,试用悟空后,对悟空提出功能需求的小伙伴也越来越多,UI小伙伴希望悟空是一个快速转化色彩风格的利器,能为具有重复性的UI图设计工作节省大量设计时间;运营小伙伴希望悟空是一个生成自定义风格图片的利器,能快速生成运营活动宣传图,提升活动效率和活动转化率。

最终,悟空被定义为一个面向普通大众人群、专业图像处理人员(如UI设计师,互联网产品运营人员等)的图像智能转换产品,提供老照片修复、图片去抖动、风格速换等功能,可满足大众人群的各种图像处理需求,并提升专业图像处理人员UI设计效率。

悟空的主体功能开发至今历时10个月,1月完成产品设计,2月完成WEB版开发,3月完成第一个模型训练,7月完成小程序开发,8月演进了模型,10月与和家亲达成了合作意向,为和家相册提供照片处理能力,预计2018年底将形成完整功能的开放能力,提供给各个产品使用。

三、智能图像转换产品

悟空专业

利用人工智能深度学习技术,采用了斯坦福大学的论文《基于感知损失函数的实时风格转换和超分辨率重建》《Perceptual Losses for Real-Time Style Transferand Super-Resolution》中提供的算法。针对不同模型的训练采用了不同的数据集,包括gopro、div2k、coco等开源数据集。基于Tensorflow平台,采用Python语言实现图像处理算法;基于JAVA语言,采用SpringMVC+Jsp实现后台及WEB界面开发。

悟空便捷

要进行图像转换,您只需:上传照片,选择场景,等待收货,即可。悟空全程智能计算,无需任何额外人工操作。

1、功能简介

悟空目前提供三大图像转换场景,分别是:

老照片修复:提供图像残缺修补、上色翻新、无失真放大功能,解决老照片部分缺失、泛黄褪色、不可放大等问题。

图片去抖动:在20s内实现对植物、人物等各种场景的模糊图片清晰化处理。

风格速换:面向大众人群和专业人群,提供一键换色,一键换风服务。

一键换色从用户上传的自定义图片中提取色彩特征,叠加到原始图片中,从而生成带有原始图片元素和自定义图片色彩特征的新图片,真正实现色彩随心变。

一键换风功能提供了多种预定义的风格模型,用户上传原始图片,选择风格模型,即可实现将模型里的风格特征叠加到原始图片上,生成新的个性风格图片。

2、使用场景

1)普通大众群体使用场景

中国60岁以上的老年人口数量达2.41亿,这个群体年轻时的黑白照片,洗印在老旧的相纸上,如今普遍褪色泛黄、部分缺失,需解决残缺、泛黄,无法放大的问题。

8、90年代的傻瓜相机无防抖功能,拍摄照片普遍模糊,需将抖动模糊的照片变清晰。

2)专业人群的使用场景

UI设计图风格快速转换

在春节、元宵、清明等传统节假日时,各类互联网产品均开展节假日线上营销,APP首页banner图、广告宣传图、活动引导图、活动详情页面等均需要带有节假日要素,针对电商类互联网产品、商品图也会打上节日风格标签,往往需要在短时间设计大量风格一致的设计图,设计师可将简单设计的原始图(包含内容要素,针对电商平台销售的商品可以直接用手机拍摄一张清晰地照片)上传本平台,选择对应的节假日风格,几分钟便可快速生成最终效果图。

待设计图+设计风格图

通过平台自动生成的设计图

特定场景的图片样式设计

针对夜景、动漫、抽象等风格的设计往往比传统节假日UI的设计更加困难,UI设计师需要在原始图片的基础上进行更复杂的色彩的处理,需要的设计时间更久、对设计师的水平要求更高。本平台可以基于曾经设计过的夜景、动漫、抽象等风格的图片(对于夜景等真实场景,可直接拍摄一张高清的效果较好的照片)进行模型训练,生成对应特定场景的模型,UI设计师可通过平台上传一张待设计图片、经过简单的选择对应场景,即可快速生成UI设计图。

待设计图+设计风格图

通过平台自动生成的设计图

3)其他场景

平台可逐渐沉淀各种各样的场景模型,丰富可转换的场景能力,最终作为能力提供API接口对外开放,如某款APP调用该接口能力可实现根据用户偏好自动转换页面风格、自动换肤等,用户体验更好。

四、悟空的未来 值得期待

为了便于推广,我们放弃了推出新APP的想法,转而专注于提供开放的SDK、restAPI等能力,为中移动各APP、WEB类产品提供图像转换服务,拓展产品的功能,助力各产品在竞争中脱颖而出。

如果你是一个产品团队,你可以使用悟空的开放能力,如果你是对图片处理有需求的人员,你可以使用悟空提供的WEB版或是小程序。

半决赛现场

悟空是当下人工智能时代,对极致高效理念的一次践行贯彻,我们希望悟空能成长为一个智能图像处理的专家,为中移动在图像处理领域AI能力的提升做出卓越的贡献。

给作者点赞
0 VS 0
写得不太好

  免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141