“AI抠图,细至发丝,童叟无欺,假一赔十……”
随着AI技术的发展,抠图业也步入了新的竞争格局中,老牌巨头、新兴APP、开源项目、论文实现齐上阵,要把头发丝都抠出来。
不过,吆喝一时爽,抠图火葬场,到底谁家的抠图最智能?谁家的AI最聪明?这是对计算机视觉技术的考验,也是对选择恐惧症用户的考验……
在介绍我们的测评对象之前,需要先说一下目前智能抠图界的两大潮流风向:
一是全自动抠图,扔一张图进去,就自动抠好了,而且很有自信,不给你留手动调整的机会;
二是半自动抠图,通过简单的标点划线,选择图片上需要抠出来的部分,反选图片上需要抹去的部分,提示AI抠哪里。
当然,还有一些应用是两者结合的,AI自动抠出它认为是主角的物体,然后你可以手动标注需要抠出来的部分和需要抹去的部分,帮助AI纠错。
至于PS套索那种纯人工抠图嘛,不在本次测评范围之内。
现在,请我们的六名选手登场:
马卡龙玩图
抠图界小网红,曾用名Versa,早期以风格迁移著称,也就是把你的照片改成名画的风格,这家公司的主要技术方向是类脑人工智能,可以实现全自动抠图。
么么照
来自京东Y事业部,和上面的马卡龙玩图类似,也是全自动抠图,可以抠下来换背景。
美图秀秀
老牌修图软件,可以实现半自动抠图。
但是量子位在美图秀秀的移动端、web端和Mac端都没有找到抠图功能,只有windows电脑客户端才有抠图功能,都9012年了……
稿定抠图
Web端抠图神器,不用下任何客户端和APP,适合低频次需求。
不过,稿定抠图仅支持.webp和.webp格式图片,大小不超过9MB,半自动抠图,需要标注保留和抹去的部分。
PPT
没错!Office家族,都是附带抠图功能的,只要选中图片,删除背景就行,全自动/半自动混合抠图模式,办公小助手,美化PPT插图压根不需要专门打开PS抠图。
当然,和Office家族功能类似的金山家族和苹果Keynote其实也可以抠图。
PhotoShop CC 2019
修图巨头Adobe旗下C位的软件,设计师们吃饭的家伙,具有海量复杂、专业的功能,最新的版本可以通过“选择主体”功能实现一键抠图。
本次测评设置了四大考点,分别是:
抠图精细度:到底能不能抠头发丝?
前景背景区分:颜色一样,还能分出来么?
多人合照:大合照,能抠出几个人?
主角非人类:如果照片主角不是人,是我家主子会怎样?
四大考点分别对应四道题目,每道题目是六个抠图应用抠同一张图,比对用时、操作和效果。
为了表示自己抠图细致,不少应用都宣称自己是“发丝级”抠图,效果究竟如何?
我们找到了这张Taylor Swift的照片,金色的卷发刚好造成边缘处有很多很多头发丝,让抠图AI们抠个够。
AI们的表现如下:
这是难分伯仲的一道题,边缘处理都比较粗糙,仅有马卡龙玩图略微露出了一点头发丝的痕迹。
马卡龙玩图
马卡龙大约运转了10秒就抠好了,的的确确保留了一部分模糊的头发丝,虽然也有一部分被抹掉了;整体边缘是最圆滑的,换背景的话几乎可以直接拿来用,不用做进一步的修整涂抹;
可以说,马卡龙效果最好,是本轮冠军。
稿定抠图
大约用了不到半分钟标注要保留的区域,基本没保留什么头发丝,反而为了头发丝把边缘处理成了锯齿状。
PPT
自动选定人物,瞬间就抠好了。当然,头发丝基本没保留,边缘效果也不是很好。
PS
保留了一部分绿色背景,感觉AI在判断边缘的时候陷入了焦虑。
么么照
么么照自动处理得很快,只用了两三秒,但是图片被压缩过了,头发丝也就不那么明显了,看不出抠了头发丝的痕迹。另外Taylor的左边有一些残渣,仿佛AI很努力地要抠头发丝,但是最终还是失败了。
美图秀秀
美图秀秀的边缘处理仿佛是在搞笑,就像用手从海报上撕下来的一样参差不齐,想要保留头发丝,结果干脆保留了一部分背景,让人难以理解,不推荐。
为了完成这个挑战,我们找到了在康熙朝任职的“中国圣诞老人”鳌拜大人,鳌拜的暗色衣服和下方黑暗的背景几乎融为一体,头顶的顶戴花翎和背景的张灯结彩也刚好都是红色。
不知道是不是这道题太难了,三位选手连完整的人都没有抠下来。
马卡龙
人物形象完美,就是红顶子拿捏不准,整体尚可。
PPT
边缘略有参差,整体效果尚可。
稿定抠图
边缘十分感人,为鳌拜的衣服增加了自己的设计,仿佛鳌拜穿了奇装异服。
么么照
么么照无法区分右下方黑色的衣服和黑色的背景,不及格。
美图秀秀
美图秀秀是不是以为圣诞老爷爷是抽象画?眼里只认红顶子和白胡子?
连肩膀的形状都没有抠出来,只能说,不及格。
PS
这不是我认识的那个Adobe,竟然只把最像圣诞老人的头部抠下来了,不及格。
重点是,连完整的“Merry Christmas”都没抠出来。
我们把背景变成黑的看一下,一句话竟然漏掉了三个字母,真是匪夷所思。
当图片上有不止一个人,有人站C位,有人站角落的时候,抠图应用能做到把它们都找出来么?
为此,量子位找到了这张谷歌大脑成立时的合影,Geoffrey Hinton、Jeff Dean、Samy Bengio、Vincent Vanhoucke等大佬纷纷上镜,全图总共17个人,还有中间那张大海报、旁边的桌子和显示器做为干扰,是可以让抠图AI们好好琢磨一阵了。
马卡龙玩图
17个人每个人基本都被分开了,可以进行单独编辑。阴影和牛仔裤交错的下半部分也做了区分,可以说令人惊喜。美中不足的是,电脑显示屏没有抹掉。
PPT
虽然处理时间长达6分钟,做了40个手动标注,不过大块的非人物部分都去掉了,除了超高难度的下半部分,整体画面还算干净。作为一个办公软件里的小功能,能做到这样已经相当优秀了。
稿定抠图
一些多余的部分没有去掉,只能说是一个平庸、没有野心的抠图软件。
美图秀秀
电脑桌和下半部分基本没动,成功的避开了所有考点。让人不得不吐槽的是上面那个紫色的小点:
仔细看,是天花板上毛绒骰子“2”那一侧,看起来萌萌哒,难不成美图秀秀认为这是个可爱的小脸?
PS
左下部分跟没抠一样,上面抠了的部分,也是幽灵制造机啊。
△ 你后面有人
△ 你们后面也有人
吓得我点了左上角的叉叉。
么么照
这哪里是抠图,下半部分仿佛霉菌菌落一样的密集的点点,难不成这张照片在上海经历了梅雨季节?只能说不合格。
许多抠图应用都针对人做了专门的训练,它们可以自动的找出图片上所有的人。
可是,如果想给孙子抠个佩奇怎么办?
因此,我们找了个佩奇:
O(∩_∩)O哈哈~
这得问一下抠图AI:啥是佩奇?
AI:一千个AI心里有一千个佩奇。
美图秀秀
虽然边缘比较粗糙,不过形状基本合格。
PPT
框定范围后全自动抠图,没有手动干预就能抠出一个完整的佩奇,但是,为什么佩奇的眼神如此空洞?
好在,手动点选之后可以解决这个问题,也不费事。
PhotoShop
PS有一个好处,它自动的识别了所有类型的主角,不管是不是人,都公平对待。但是,佩奇的耳朵呢?怎么丢了一只?
稿定抠图
抠是抠出来了,就是无法精准的识别什么是佩奇的一部分。
换句话说,它搞不清楚“什么是佩奇”。
么么照
不及格选手,只抠了佩奇的眼睛鼻子和一只手臂,难不成是觉得上半部分的佩奇比较像人脸?
马卡龙玩图
不及格选手,想抠人也就罢了,抠的不是手而是衣服这就有点匪夷所思了。
一个好的修图软件必定秀外慧中,不仅抠图质量要过关,在细节设计上也得配得上“猪猪软件”的称号。
比如操作简便性:
除了专业赛道的P图一哥PhotoShop外,其他软件基本无需学习就能上手。
不过美图秀秀操作略麻烦,不仅移动端无入口可抠,还没有提供Mac版的客户端,想要有上美图秀秀的抠图功能,需要先找一台Windows系统的电脑。
从时间方面来看,马卡龙、么么照和PhotoShop这种全自动玩家总体优先于半自动玩家不少,半自动选手用时长短与图片难度和你要求的精细度有很大关系。
效果可粗可精,时间可长可短。
不过,PS等这种半自动的应用也是专业玩家/强迫症患者放空自己的一种方式,俗话说毕竟没有最好,只有更好嘛。
综合抠图质量、操作难度和用户体验,量子位做出一张智能抠图推荐榜:
马卡龙玩图
推荐指数:????????
抠人专用,全自动、准确,但除人之外不能抠
PPT
推荐指数:????????
办公场景必用、简单标记就行,性价比之王
稿定抠图
推荐指数:??????
轻量级网页应用,只要肯精修,效果还是可以
Photoshop
推荐指数:??????
“选择主体”新功能并非尽善尽美,如果有耐心可以慢慢手动抠呀
么么照
推荐指数:??
抠人专用,全自动见效快,效果如何看天意吧
美图秀秀
推荐指数:?
O__O …小老弟,你为什么如此想不开?
问题来了,这些应用是怎么完成抠图的鸭?
抠图,也就是把一张照片里的主角或者一类物体自动抠下来的操作,在学术领域有专门的英文名Image Matting。
想不到吧,这种连80岁老太都会玩的修图操作,其实也可以被形式化为一个数学问题,即下面这个“求解抠图方程式”:
I=αF (1-α)B,α∈[0,1]
其中,I是图像RGB色彩,F为前景色,B为背景色,α为预测前景蒙版。这样来看,抠图这件事就被形式化为两种颜色的线性组合,因此目前大多数方法将其近似为一个色彩问题,可以用多种算法来实现抠图效果。
视觉显著性检测(Visual saliency detection)就是常用方法的一种:
举个,当你一眼望到那张霉霉的照片,是不是最先注意到的是照片里有个人→金发红唇→应该是美女,随后才注意到了绿色的背景和其中模糊的绿叶?
△ AI觉得你是这么理解的
好巧,AI和你想的一样。
在视觉显著性检测中,AI会尝试模拟人的视觉特点,猜测你可能对图中哪些物体感兴趣(也就是显著区域),并把这部分自动提取出来。
抠图这件小事不就完成了!
图像分割(Image Segmentation)也能实现将主角抠出来的效果,它有几个子分类,包含语义分割和实例分割等细化的技术,分割精度也在逐年升高。
和视觉显著性检测不同,分割大法不是AI找你感兴趣的,而是在图像中找到自己会认的。
在语义分割任务中,照片里的每个像素都被打上了一个标签,比如在这张道路场景图中,绿色色块代表行道树,蓝色色块表示车辆,紫色色块代表道路。
但是,语义分割只能识别这个像素属于树,却没有办法判断一个像素块的位置到底是属于哪棵树。想要要AI识别出个体,就得派实例分割上场了。
和语义分割不同,实例分割不需要标记每个像素,它只要找到物体的边缘轮廓就好了,标记上不同的颜色,个体分离技能get。
所以不难理解,在抠谷歌大脑团队的那张合影时,有的应用可以抠出单个人并对其单独编辑了。