计算机视觉迈进新征程“玩家”找出哪些新玩法?

时间:2019-09-05 来源:www.thebigbobs.com

188体育中心

近日,来自商汤科技,香港中文大学以及香港大学的研究团队提出了一种称为MaskGAN的新型框架,可实现多样化和交互式的面部操作。其主要观点是语义掩模作为灵活的面部操作的适当中间表示,使其具有保真度。MaskGAN有两个主要组成部分:

1.密集映射

2.编辑行为模拟训练

具体而言,密集映射网络学习自由形式的用户修改掩码和目标图像之间的样式映射,从而实现不同的生成结果。

以色列魏茨曼科学研究院:图像分离

本月,以色列魏茨曼科学研究所的研究人员开发出了一项名为Double-DIP的新技术,该技术能让系统在没有大量训练数据的情况下,通过深度学习来对图像进行编辑,分离人们在图片中想要的和不想要的部分。该研究基于一项名为DIP(Deep Image Prior)的混合图像恢复技术,因此研究人员将他们开发的新分离图像方法称为Double-DIP。DIP技术的研究成果已于美国时间2018年7月18日提交在arxiv上,名为《图像恢复的混合稀疏先验学习:深度学习与稀疏编码的结合(Learning Hybrid Sparsity Prior for Image Restoration:where Deep Learning Meets Sparse Coding)》。

吕贝克大学:医学图像生成新方法

当前,GAN应用于医学研究还面临一项重大挑战。深度学习算法需要对高分辨率图像进行训练,才能产生最佳预测,然而合成这样的高分辨率图像,尤其是3D图像,需要大量的计算能力。来自吕贝克大学医学信息学研究所的研究人员提出了一种新方法,可以大大降低硬件的配置要求。研究人员把图像生成的过程分解为几个阶段:首先利用GAN生成低分辨率图像,然后在正确的分辨率下每次生成一小部分的细节图像。通过实验,研究人员发现这种方法不仅生成了逼真的高分辨率2D和3D图像,而且无论图像大小,支出费用都保持不变。

小结:

在深度学习技术出现之前,很多应用都遇到了瓶颈,进步很慢,每年只有大概的精确性提升。但随着深度学习的进步,计算机视觉的发展经历了一个巨大的飞跃,技术的不断升级也催生出了一系列跨行业的应用。随着主流的科技巨头入场,计算机视觉领域已经热闹非凡,但如果想要开创出一些新的应用获奖应用能力再进行提升,恐怕还有不短的路需要走。

End

《视觉系统设计》免费索阅

达到当天最大量