AI靠什么超越人类修图师?万子龙文字理解“美图云秀”AI修图解决方案
机器的核心报告
机器之心编辑部
近日,米托推出全新的人工智能修图解决方案,——米托云修,将从技术角度进行深度解读。目前用户也可以通过米托AI开放平台体验。
商业摄影工作流程中很重要的一个环节就是“后期修图”,工作量大,周期长。同时,培养一个文笔神一般的修图师,往往需要很高的人力物力成本。即使是熟练的修图师,也需要1-3个月的时间去熟悉和适应不同影楼的修图风格和技术。此外,不同的专业水平、审美差异、工作条件等因素也会造成修图质量的波动。
针对上述痛点,基于米托自12年前成立以来在人物影像领域积累的技术优势,米托技术中心——米托影像实验室(MTlab)推出了米托云修复人工智能修图解决方案。在修图过程中,AI技术可以实现多场景自适应识别和参数调整,呈现完美的光影效果,同时还可以快速定位人像,修复人像缺陷,实现人像的个性化修图。
图1。美图云秀人像细化比较
接下来,本文将重点分析美图云修复人工智能修图解决方案的技术细节。
智能中性灰技术
修图中常提到中性灰色修图,也称为“加深和变亮”操作,通过笔刷改变局部深度。在PS中,需要手动建立一个观察层来突出面部缺陷,如斑点、毛孔、痘印等。然后在观察层中一个接一个地选择缺陷区域,以去除原始面的相应缺陷区域。之后将不均匀的肤色均匀擦拭,使皮肤纹理最大化,但很多情况下还是需要帮助的,对每张人像的皮肤区域重复这个过程既费时又费力。传统PS中性灰修图过程如图2所示。
图2。PS中性灰色修图层(左:原图,中:观察组,右:图层)
美图云修复的智能中性灰度人像细化功能,结合自关注模块和多尺度特征聚合训练神经网络,提取极端特征细节。智能中性灰度细化方案使没有专业修图技术的人能够快速细化人像,在速度上远远超过手工修图方法,保持了高级手工修图自然细腻效果的优势。它在各种复杂场景下具有很强的鲁棒性,大大提高了人像后处理的工作效率。如图3所示,是一种无需人工操作的智能中性灰色修图效果。与目前各种app上的修图效果相比,如图4所示,具有更好的去除瑕疵的效果,并且保持了皮肤纹理,没有假磨皮的感觉。
图3。美图云秀AI中性灰整理效果比较
图4。朋友的祛斑祛痘和磨皮效果(左:祛斑祛痘,右:磨皮)
AI中性灰度细化功能采用创新的深度学习结构。如图5所示,在网络编码器和解码器之间的连接上增加了双重自关注特征过滤模块和多尺度特征聚合模块,使得网络能够学习到丰富的多尺度上下文特征信息,并对重要信息进行加权,从而能够保留高分辨率下图像的细节,更好地修复问题皮肤。
图5。智能中性灰整理网络结构
双重自注意力特征筛选模块
双重自我注意特征过滤模块[1]是学习特征图的空间映射和通道映射,分为基于位置的自我注意模块和基于通道的自我注意模块。最后,两个模块的输出被集成以获得更好的特征表达,如图6所示。
图6。双重自我关注模块结构
基于位置的自我注意模块用于学习特征图中任意两个像素的空间相关性。对于特殊的皮肤特征,它将由所有位置的特征加权,并且权重将随着网络训练而更新。皮肤特征相似的任意两个位置可以互相贡献权重,因此模块可以通过学习筛选出皮肤细节的位置特征。如图6左侧蓝色区域所示,输入一个特征图f r (h w c),首先沿通道维度对特征图进行全局展平。