AI 换脸 ZAO 一晚,成本烧掉几百万

人工智能
2019
09/02
21:31
量子位
分享
评论

来源:量子位

唯一能阻止 ZAO 刷屏的,可能是服务器。

今天上午 10 点半左右,正在使用 ZAO 的用户发现,想要生成一段新的 AI 换脸视频,已经不是等待几秒、排队第几位的问题,而是——

" 服务器繁忙 "

提示页卡上写着:当前制造任务已满,无法制造,预计 10:XX 恢复能力。这里的 XX 大概是一段 10 分钟左右的延时,不过只要 5、6 分钟就能继续处理。

10 点 45 分左右,这个提示变为更简单粗暴的一句话:

" 当服务器制作量过大,请稍后再试 "

仔细看这句话,你以为是漏了一个字?不不不,只需要动用初中阅读理解方法,就能推断出这是运营方的一个暗示:

缺 " 前 "。

要知道,每个 ZAO 用户换脸的背后,是熊熊燃烧的服务器成本。据 ZAO 官方透露的消息,一个晚上 ZAO 的服务器就能烧掉 200 多万。(烧一天怎么也得 500 万以上了吧)

这也足见 ZAO 的火爆。

为什么 ZAO 火了

AI 换脸,不是新鲜事。

2017 年底,国外一位 ID 为 "deepfakes" 的网友,利用业余时间创造了一个 AI 换脸算法。后来这个算法也被广泛称为 deepfakes。

这个机器学习算法,首先在小圈子炸开。在国外的 Reddit 论坛上,有一个 deepfakes 社区,一个月内聚集了 1.5 订阅者,并产生了大量的 AI 换脸视频。

随后,这个社区逐渐变成了生产假冒爱情动作片的 " 黑窝点 " ——不少人用 AI 技术将色情作品中的主角换成明星的脸。有文化,真可怕。小电影,可造假。

也正是因为这样,这个社区引发了大量的争议,最后被彻底关掉。

但这个 AI 换脸这个技术,却一直进化至今。比如今年初,B 站 UP 主 " 换脸哥 ",使用者个技术将 94 版《射雕》里朱茵扮演的黄蓉,换成杨幂的脸。

效果是真的好。(详见:朱茵变杨幂,流量一个亿)

还有徐锦江对战灭霸、洪世贤换脸艾莉等等。(详见:B 站名场面全被 AI 换脸调戏了一遍)

但,为什么 ZAO 大火特火了?

原因很简单。因为 ZAO 最简单。

最初的 deepfakes 只是一套算法,是基于 Keras 等多个开源库完成的。后来有位高手添加了一些工具,封装成引用 FakeApp。这是一个桌面应用,可以运行 deepfakes 算法,无需安装 Python、TensorFlow 等,仅需要 " 支持 CUDA 的高性能 GPU"。

这听起来简单,但对于普通用户来说,下载、安装、训练都是费时费力的大工程。所以通常都是一些爱好者制作发布,大家欣赏换脸后的成片。

而这次 ZAO 把门槛一下拉低到近乎没有。

用户想要体验 AI 换脸,不再需要电脑、高性能 GPU、数据集、编程和 AI 知识,只需要一部手机,一张自拍,就可以把多种影视场景中主角的脸,换成自己的脸。

这是一种前所未有的体验,而且效果虽然不能说特别好,但通常情况下,都是相当不错的,至少可以让用户有动力发到朋友圈去显摆一下。

烧自己的钱,让用户爽,从这一点来说,ZAO 当然有火的理由。当然 ZAO 应该也不缺钱,毕竟背后是著名的公司:陌陌。

被质疑的隐私问题

当然越火,质疑声就越大。

AI 换脸如此,ZAO 也是如此。现在 ZAO 面对的一些质疑,就是当初 deepfakes 出现的时候,曾经面对的质疑。

质疑一是 " 版权 " 之争;二是伦理道德之争。

显而易见,deepfakes 是双刃剑。这个简单的应用可能会被居心叵测的用户利用,从而制作各种色情、暴力甚至关乎政治的虚假视频,一旦发生,后果可能非常严重。

这并非耸人听闻。而且不只是视频,AI 还能 " 造假 " 声音。斯坦福和普林斯顿大学等最新研究:给定任意文本,就能随意改变一段视频里人物说的话。并且,改动关键词后人物口型还能对得奇准无比,丝毫看不出篡改的痕迹,就像下面这样:

苹果今日收盘价 191 块 4,改成 182 块 2 你也看不出来。

让新垣结衣向你表白,让石原里美大声喊出你的名字,甚至随便根据某个人的视频伪造个人陈述 …… 现在都不在话下。

手握这项技术,在视频中让你怎么说你就怎么说,让你说什么你就得说什么,谁也看不出来这是假的。对,脸和声音都是你的,而且有视频,但一切都是假的。

另外,ZAO 也让很多用户有强烈的隐私担心。

毕竟这是一个需要上传人脸数据的应用,而人脸作为生物识别信息,很多时候已经成为我们的重要资产的密码。

比方韭菜教育专家李笑来就在微博上说:"ZAO 可能很危险的 … 别看你今天玩得开心,过段时间就有可能你的支付宝被盗刷脸了?不过这事儿很难怪 ZAO,谁让你认知浅薄了呢?"

还有 ZAO 用户、隐私协议里的一些话,也被很多人拿出来质疑。

比如上面这句,就被集火抨击。

当然还有人替 ZAO 着急,毕竟之前大火过的各种换脸应用。基本上都难逃一阵风的宿命,亲爱的用户们新鲜劲很快就过去了,保质期可能都不到一个礼拜。

换脸背后的技术

ZAO 没有公布背后的技术细节,但 AI 换脸本质上都是大同小异。

前几天,有个国外的团队制作出毫无破绽的换脸视频,同时也披露了背后的技术细节。那就是开源项目:DeepFaceLab。

DeepFaceLab 是 Deepfakes 换脸术的一个软件工具包,安装简单,使用方便,更新及时。在 GitHub 上已有 5000 多星。

代码公开是一方面。另一方面,从项目描述看,不需要太多算力就能跑 ( 详见下文 ) 。总体说来门槛很低。

软件包里有多种模型,各有特点:

H64 ( 2GB+ 显存 ) ,64 像素模式。这是经典模型,DeepFakes 最初扬名就是靠它。DeepFaceLab 对它做了些改进,让这个模型在低显存情况下也能用低配置参数运行。

H128 ( 3GB+ 显存 ) ,128 像素模型,比 H64 像素更高,细节更丰富。能应对大部分远景和中景镜头,适合亚洲脸型。

DF ( 5GB+ 显存 ) ,H128 的全脸模型。它换出来的脸通常比 H128 更像,但兼容性更差,边缘问题突出。

LIAEF128 ( 5GB+ 显存 ) ,结合了 DF,IAE 的改进型 128 全脸模型。这个模型存在闭眼识别问题。

SAE ( 最低配置 2GB+,推荐配置 11GB+ ) ,风格化的编码器,基于风格损失的新型超级模型。可以有效重建被遮挡的脸。可玩性高,参数可调,调优空间大。

DeepFaceLab 唯一的安装要求就是对应版本的显卡驱动,甚至不需要 CUDA 和 CuDNN。

软件的中文官网提供了下载通道 ( 有无需魔法的百度网盘版本 ) ,以及详细的安装教程。

同时还自带许多人脸图片数据。

官网说,DeepFaceLab 虽然没有可视化界面,但步骤非常清晰,操作并不复杂。

换脸主要分为五个阶段:

视频转图片、提取脸部、训练模型、人脸替换、合成视频。

每个步骤只需点击 BAT 文件即可执行。

想要入门 AI 换脸的小伙伴,也可以在 DeepFaceLab 中文官网找到丰富的教程:

https://www.deepfakescn.com/

虽然,DeepFaceLab 描述的硬件要求不高,但 ctrl shift face 能做到今天的效果,背后很可能有贵贵的 GPU 在燃烧 ( 尽管没披露技术细节,不知道有没有改进算法 ) 。

自学换脸配置指南

最后,贴一个量子位之前就发过的指南。如何才能自己动手搞 AI 换脸。

目前网上已经有 fakeapp、faceswap、deepfacelab 等一大批现成换脸软件,只要有够强的硬件,你也能自制一段换脸视频。

这些软件都一个基本要求,就是必须支持英伟达的 CUDA。

通俗地说,如果你最近几年为了玩吃鸡这类游戏配置了一台 PC,而且安装的是英伟达的独立显卡,那么运行 Deepfakes 应该是没问题的。

根据国外网友的实测效果,要运行 fakeapp 且电脑不崩溃,至少需要以下配置:

至少有 2GB 显存的英伟达 GPU

英特尔 i3 或者 AMD 9 处理器

8GB 内存

20GB 剩余硬盘空间

以上只是最低的配置,制作一个换脸视频可能需要几天才行,是不是感到电费在燃烧?如果为了省事中途截断,效果会惨不忍睹。

去年科技媒体 The Verge 的记者还真试了一把,她的电脑给人换脸大概需要一天的时间,如果只训练几个小时,结果根本没法看:

从电脑屏幕上来看,训练过程是这样的:

如果你不想每天早晨打开电脑都看到上面的画面,那么我们推荐以下配置,它能讲训练时间缩短到只有几个小时:

至少 4GB 显存的英伟达 GPU(GTX 9 系或者更高,多数网友推荐 GTX 1060 6GB 显存,售价 1699 元)

英特尔 i5 或 AMD Ryzen 处理器(以 i5-8400 为例,售价 1599 元)

12GB 内存(购买 2 条 8GB 内存,总价 700 元)

100GB 剩余硬盘空间(考虑到其他占用空间,购买 250GB 固态硬盘,价格大约 300 元)

以上只是主要部件的价格,再加上主板、电源、机箱,总的主机(不包括显示器)价格区间在 5000~6000 元之间。

需要注意的是,在这里,硬盘空间比硬盘读写速度更重要。

因为训练 Deepfake 过程中大约每分钟会产生 1GB 的图像文件,通常 SSD 的空间较小,如果被训练数据占满,将会导致 SSD 性能下降。而机械硬盘的性能几乎不受剩余空间影响,非常适合用在训练 Deepfake 中。

当然,除了软硬件条件,你还得准备相应的视频素材。

最后友情提示,你自己准备好软硬件,也需要面临最开始提到的,钱的问题。根据 Deepfake 软件要求的硬件配置和训练时间,换一次脸就需要烧掉至少一度电以上。

THE END
广告、内容合作请点击这里 寻求合作
ai
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

据小米MIUI官方,小米AI实验室AutoML团队就自动化神经架构搜索(NAS)方面取得的成果,在近日首度接受了媒体公开采访。
人工智能
7月25日消息,阿里巴巴旗下半导体公司平头哥正式发布玄铁910(XuanTie910),称玄铁910目前业界性能最强的一款RISC-V处理器。
业界
AI+5G+IoT的组合,虽然打开了语音芯片的新想象力。但是在这个逻辑里,未来能占据广泛市场的芯片模式,绝不是今天智能音箱芯片的模样。语音芯片本身,变化才刚刚开始。
人工智能
困难重重的AI“辩味”。
人工智能
今天凌晨,一年一度的苹果WWDC 19全球开发者大会在美国圣何塞举办,苹果更新了自家系统平台macOS、iOS、watchOS、tvOS以及今年刚刚加入的iPadOS。
业界

相关推荐

1
3