Fork me on GitHub

deepfakes超进化!反复变脸行云流水,完全没有PS痕迹

  鱼羊 栗子 发自 凹非寺 
  量子位 报道 公众号 QbitAI

  Deepfakes 要冲出天际了。

  这里有一段神奇的视频 (被我裁成了动图) ,请擦亮眼睛观看。

  因为讲话的人类,中途从比尔·哈德,变成了施瓦辛格:

  行云流水。说不清什么时候,已经换好了。所以,如果有小伙伴没看清,可以参考以下:

  这是比尔·哈德。

  这是施瓦辛格。

  后来,施瓦辛格一转头,又变回了比尔·哈德,毫无拼接痕迹:


比尔哈德口型瞩目

  由于真伪难辨,此处郑重说明,比尔·哈德才是这集柯南秀 (原本请来的) 嘉宾。

  上面的换脸成果展,是从高清视频 (1080p) 里截来的,视频出自一个名叫ctrl shift face的团队。

  鬼斧神工,引起了推特用户的大规模震惊,赞数已经超过10 万


震惊脸取样

  除此之外,也有冷静的观众,想起了碧萝奶奶:


如果哪天能实时拯救直播,细思恐极

  我竟不知道,他们俩这么像!?

  现在,考验脸盲患者的时刻到了。

  你看得出是哪一刻变了脸么?

  这场访谈,最初的嘉宾依然是比尔·哈德

  就在把脸转向主持人的一瞬,变成了汤姆·克鲁斯,并且是年少的样子:


上为汤姆·克鲁斯,下为比尔·哈德

  这只 AI 的一个重大优点,就是给侧颜换脸也流畅自如。许多换脸界的前辈是做不到的。

  插播一个可爱的细节,比尔·哈德转脸的时候,原本说的话就是:

And then Tom Cruise walks in.

  看到这浑然天成的魔法,推特评论区爆炸了:

吓屎我了,他和汤姆·克鲁斯好像啊!(稍有意译)

  另外一位脸盲选手,也表示蒙蔽:

  不过,这段访谈还没完。

  比尔·哈德用阿汤哥的脸放飞了几秒,就不知不觉变回了自己:

  注释一下,手放在嘴上的时候,已经变回来了。

  这表示,有所遮挡的人脸,对 AI 来说也没什么压力。

  而再一低眉的工夫,嘉宾又变成了赛斯·罗根,主持人已经坏掉了:

  就是这个胖胖,还和周杰伦一起演过《青蜂侠》:

  如果你感觉,在采访的中途变身,吓跑主持人不大合适。

  那么,给电影换主角也不错啊。

  告诉你个秘密,终结者是史泰龙演的:

  就算一明一暗,光线剧烈变化,换脸也丝毫没有受阻。

  施瓦辛格用经典尬笑,回应“换角传闻”:


原来的配方

  那么问题来了,是什么样的算法,造就了几乎天衣无缝的换脸神技?

  DeepFaceLab

  团队说,他们的成果,主要归功于DeepFaceLab这个开源项目:

  https://github.com/iperov/DeepFaceLab

  DeepFaceLab 是 Deepfakes 换脸术的一个软件工具包,安装简单,使用方便,更新及时。在 GitHub 上已有 5000 多星。

  代码公开是一方面。另一方面,从项目描述看,不需要太多算力就能跑 (详见下文) 。总体说来门槛很低。

  软件包里有多种模型,各有特点:

  H64 (2GB+ 显存) ,64 像素模式。这是经典模型,DeepFakes 最初扬名就是靠它。DeepFaceLab 对它做了些改进,让这个模型在低显存情况下也能用低配置参数运行。

  H128 (3GB+ 显存) ,128 像素模型,比 H64 像素更高,细节更丰富。能应对大部分远景和中景镜头,适合亚洲脸型。

  DF (5GB+ 显存) ,H128 的全脸模型。它换出来的脸通常比 H128 更像,但兼容性更差,边缘问题突出。

  LIAEF128 (5GB+ 显存) ,结合了 DF,IAE 的改进型 128 全脸模型。这个模型存在闭眼识别问题。

  SAE (最低配置 2GB+,推荐配置 11GB+) ,风格化的编码器,基于风格损失的新型超级模型。可以有效重建被遮挡的脸。可玩性高,参数可调,调优空间大。

  DeepFaceLab 唯一的安装要求就是对应版本的显卡驱动,甚至不需要 CUDA 和 CuDNN。

  软件的中文官网提供了下载通道 (有无需魔法的百度网盘版本) ,以及详细的安装教程。

  同时还自带许多人脸图片数据。

  官网说,DeepFaceLab 虽然没有可视化界面,但步骤非常清晰,操作并不复杂。

  换脸主要分为五个阶段:

  视频转图片、提取脸部、训练模型、人脸替换、合成视频。

  每个步骤只需点击 BAT 文件即可执行。

  想要入门 AI 换脸的小伙伴,也可以在 DeepFaceLab 中文官网找到丰富的教程:

  https://www.deepfakescn.com/

  虽然,DeepFaceLab 描述的硬件要求不高,但 ctrl shift face 能做到今天的效果,背后很可能有贵贵的 GPU 在燃烧 (尽管没披露技术细节,不知道有没有改进算法) 。

  这样的话,团队大概十分需要经费。

  你看,ctrl shift face 官网提供了三档氪金服务,供大家打钱,打钱,打钱:

  一级会员shallow fakes,每月仅需 1 美元,就可以给他们捐款了 (误) ,捐款之后还能提前看到团队产出的最新视频。

  二级会员deep fakes每月 5 美元。比起一级会员,二级会员能观看更多视频内容 (大概率是里番),以及幕后花絮。

  而每月花 10 美元成为三级会员deeper fakes,就能下载各种换脸数据集了。

  咦,三级会员?

  一只彩蛋

  说到这里,ctrl shift face 团队其实是股清流。比起女神,他们似乎更喜欢把男艺人,换到小电影里。你看这只一脸幸福的阿汤哥 :

  Ctrl Shift Face 官网:

  https://www.patreon.com/ctrl_shift_face

  DeepFaceLab 开源代码:

  https://github.com/iperov/DeepFaceLab

  p.s. 如果之前的脸盲测试题太简单,阁下可以观赏一条完整视频,数数一共变了多少次:

来自:
量子位(ID:QbitAI)

作者:Johnson
原创文章,版权所有,转载请保留原文链接。