Prisma欲从P图转做社区,深度学习图像应用成互联网资本布局方向-最极客说起今年最火的滤镜应用,当属Prisma。它以其将普通照片变成大师级作品的神奇功效,迅速俘获了世界各地的用户。同时,这项应用也充分体现了深度学习图像应用于实际的效果及所带来的巨大收益。
最近,Prisma在寻找新的突破口,在其应用内借鉴Facebook元素,加入基于位置的照片流功能。这款曾经只做P图的简单应用,如今的野心更大了:它想自己做个社区。
当然,这种野心并非Prisma独有,目前许多图像类应用都有扩张的意图,甚至瞄准了视频市场。而这背后所反映出的,是深度学习图像应用的广阔前景,以及互联网资本借由这一技术对市场的强势布局。


一、Prisma欲做社区,图像应用扩张领域为提高使用率
几天前,Prisma推出了名为“Feed”的新功能,Prisma鼓励用户注册帐号,在P图后可上传到Feed平台上。Prisma在这个新功能中加入了基于地理位置的照片流功能,地图视图功能可以让用户查看全球范围内的照片分享。当有更多的用户点赞,内容覆盖就会更为广泛。
实际上,Feed就相当于一个社区功能,Prisma希望通过这一功能提高用户使用率,从而存留用户。Prisma 联合创始人 Aram Airapetyan 在接受《今日美国》的采访时表示:“这个新功能会让我们的用户更常回来使用这个 app。增加用户使用率,无疑有助于提升收入。”
这种改变意味着Prisma在社交平台上迈出了步伐,代表了其方向的调整。不过,这种玩法类似于Prisma的同行Instagram、VSCO、nice早期的布局。
去年5月,Instagram宣布推出音乐官方社区@music,Instagram 首席执行官Kevin Systrom表示:“音乐社区一直是 Instagram 的重要一部分。过去 4 年中,我们已成为大大小小艺人的家园。在这里,来自音乐行业的人们分享故事,展示他们的创造力,并与粉丝建立直接的联系。”
Instagram建立社区的优势在于,它们已经积累了许多知名艺人资源。比如贾斯汀·比伯、泰勒·斯威、麦当娜等人都有Instagram 帐号,在@music开发之后,这些大咖无疑是吸引用户的最佳利器。而一些新艺人本着增加粉丝数量的目的,也纷纷入驻Instagram。
摄影工具VSCO能使照片在不损失细节的情况下得到接近胶片的效果,迅速积累了一批忠实用户。2013年推出了名为 VSCO Grid 的分享平台,2014年2月,其3.0版本又引入了“Follow 好友”和“陌生人照片发现”两款新的社交功能。Nice则是国内的一款图像处理应用,定位本来就是图片社交,主打“潮人”形象,类似于INS。
如此多的图像处理应用纷纷转向社区功能,足以说明提高用户使用率和用户存留率的重要性。许多早期入局的图像处理应用已经吸引到相当数量的用户,与之相比,现在入局的Prisma在尚无人际关系、又无名人入驻的背景下,就可能显得稍逊一筹。


二、将计算机“调教”成艺术家,深度学习推动图像处理应用市场发展
纵观目前的互联网市场,图像处理应用可谓层出不穷。其中,深度学习算法和人工智能技术在图像方面的应用功不可没。
对于拍照这件事,人们的要求越来越高,清晰度和色泽已经是最基础的保障了,用户希望拍出更有个性甚至蕴含艺术元素的照片,这也是图像处理应用火爆的重要条件。其实早在Prisma火热的前一年,Matthias Bethge、Leon Gatys、Alexander Ecker这三位来自德国图宾根大学Bethge 实验室的研究员就萌生了将计算机“调教”成艺术家的想法。
他们通过训练cnn(卷积神经网络),使计算机识别并学习梵高的绘画风格,最终成功地将普通照片变为梵高的名画《星空》。
他们用到的原理即为Deep Learning(深度学习),Deep的意思是“层数”,在图像处理过程中,他们用计算机模拟了人脑中神经元的传递过程。如此一来,神经网络的每一层都能对图像进行解构,提取图片特征,最终形成的“艺术风格”实际上是对各层提取结果的叠加。
当他们将这一结论整理成《A Neural Algorithm of Artistic Style(艺术风格的神经算法)》和《Texture Synthesis Using Convolutional Neural Networks(利用神经卷积网络进行纹理合成)》两篇论文发表之后,引起了极大的关注和热烈的讨论。
在此之后,他们建立了一家名为“Deep Art”的公司实践他们的理论,但并未取得理想的效果,真正将这项技术普及到消费级市场并引起关注的是Prisma创始人、俄罗斯计算机工程师Alexei Moiseyenkov。
对于俄罗斯来说,Prisma 的出现为其在互联网领域带来了荣耀,今年6月一经发布,就取得了15 天内下载量 750 万的成绩,火遍40 余个国家。《莫斯科时报》这样评价道:“ Prisma 第一次将这项技术成功商业化。他们充分考虑了智能手机覆盖率的飞速增长,并且细致研究了用户行为。Prisma 接入的是以亿数量级的市场。谁抓住了用户需求,谁就能成为亿万富翁。”
在这样成绩的背后,深度学习图像应用起到了重要的支撑及推动作用。它成功地将计算机“调教”成了艺术家,吸引了全世界的瞩目,取得了惊人的成绩,推动了图像处理市场的进一步发展。一时间众多类似应用兴起,如此盛况,也引来了互联网资本的虎视眈眈。


三、互联网资本强势布局,深度学习图像应用前景引人瞩目
在图像处理的基础上,视频成为下一个入口。与之前通过滤镜变现的猜测不同,Prisma拜访Facebook之后,透露出转做视频的意向。但是,这块蛋糕并不好分。
在Prisma宣布了视频计划的9天后,作为Prisma天使投资方的俄罗斯电邮服务商Mail.Ru 公司也瞄准了这一市场,该公司副总裁Anna Artamonova在Facebook 上发布了直接竞品视频处理技术软件Artisto的消息。
Artisto中同时包含了人工智能技术和神经网络技术,能够在视频中添加动态艺术特效。尽管视频需控制在10秒之内,但与单纯的图像相比,艺术风格由静变动确实更能吸引用户。Artamonova透露,研发这一技术只用了8天。
此外,最初“调教”计算机的三位德国工程师也有意进入视频市场。Deep Art官网在前段时间出现了一段demo,制作付费短视频,一段720P的视频售价为249欧元,视频长度不超过5分钟。
尽管这块市场已经隐隐形成争夺之势,但深度学习技术在视频方面仍处初级阶段。首先,视频的数据信息量比图片大得多,这对计算机的能力提出了更高的要求。其次,帧图像在时间轴上的一致性如何保持,是图像转为视频处理的难点。最后,如何追踪视频中移动物体的动态变化,尚未研究出解决方案。
除了在新领域的扩张,互联网资本对原有的图像处理市场的争夺也十分激烈。在Prisma推出Android版次日,俄罗斯最大的社交网站VKontakte推出了名为“Vinci”的图像处理应用。Vinci从外观到功能都与Prisma有着极高的相似度,在此基础上不仅缩短了图片加工时间,还同时开放了iOS与Android两大市场,更涉足了Prisma未能进入的Windows Phone 领域,成为了Windows Phone中首个运用神经网络的软件。
由此可见图像处理应用竞争之激烈。比起Deep Art这类定位于中高级市场的产品,大众消费端的免费应用才是真正的战场。看似是产品之间的技术较量,实质上是互联网资本借由深度学习技术在市场中进行强势布局。
除了滤镜类应用之外,深度学习在图像处理方面还有更为广阔的发展空间。在高精度的图像识别基础上,深度学习可以很好地执行复杂性更高的任务。微博检测图片敏感词汇以及百度的图片搜索功能可以看作是计算机在理性认知层面应用的事例,而深度学习的图像处理则能够理解图像的内容与风格之间的联系,相当于在理性的基础上增加了感性的因素。
目前,Google、Facebook、Microsoft几家互联网巨头都在深度学习图像应用方面有所布局。
Microsoft有How Old(看图猜年龄)板块、小冰外貌打分以及Pix拍照人脸曝光功能。
Google 有能够自动识别图像的绘画计算机Deep Dream,它可以创造出迷幻的夸张派效果。之前Deep Dream曾模仿文艺复兴时期的德国画家Hans Holbein的绘画风格画出了一众硅谷大佬,每张画的价格大概在几千美金左右。
Facebook则更进一步,将此技术整合到产品之中,并于8月底将最新的研究成果代码开源。相比于前两家公司,Facebook的野心似乎更大一些。有别于以往的计算机监督式学习,Facebook采用的是无监督式学习,比如让计算机自主生成包含汽车等物品的图像样本,并让看到它们的人相信。
深度学习技术在图像应用领域的发展,从某种程度上体现了人工智能的意义。算计感知能力的发展程度,决定了人工智能是否能够建立完整的知识体系,从而实现对人类能力的替代、加强以及相关延伸。图像处理市场已经进入了群雄逐鹿的阶段,而深度学习技术的不断发展以及互联网资本大鳄的介入,会使这一市场进入更加激烈的角逐阶段。