人人都能用的“ AI 作画”,要成为英伟达的杀手锏?

人工智能
2022
10/17
16:59
雷科技
分享
评论

文 | 雷科技 Ieitech

如果说 2021 年是 " 元宇宙 " 的元年,那么 2022 年或许就是 "AI 作画 " 的元年。

稍微对互联网热点有所关注的人都不难发现,最近,"AI 作画 " 产出的作品似乎已经成了一股互联网风潮。这些看起来完成度颇高、画风又有几分名家韵味的画作往往能给人留下深刻印象,而当人们得知这些画作完全由 AI 绘制,不存在任何 " 门槛 ",更是又多了一份惊异与好奇心。

在此之前,我们想要收获一张符合自己审美需求的图片,要不就在茫茫大海般的同人网站中进行撒网筛选,要不就得花点小钱找中小画师定制一张。如今,我们可以在平台上输入各种与风格、主题、氛围有关的关键词,然后 AI 就会根据算法生成符合要求的画作,艺术似乎在突然之间成为了一件触手可及的事情。

AI 名画,《空间歌剧院(Théâtre D'opéra Spatial)》

当然,上文所说的 " 门槛 " 之所以打上引号也是有原因的。因为 "AI 作画 " 的出现,虽然在一定程度上降低了用户在美术造诣上的门槛,但是却在其他方面为用户增加了新的门槛,不论是花大价钱去用别人已经训练好的 AI 模型作画,还是利用显卡的本地算力来进行 AI 作画,都不是一件简单的事情。

果不其然,显卡厂商们早早洞察到这个趋势。近日,外媒 VideoCardz 消息,英伟达已经在最新的 522.25 驱动中取消了 RTX 30 系列显卡的算力限制,似乎是想用算力全开带来的 AI 创作体验挽回客户。唯一的问题是,在矿潮褪去、游戏旺季未至之时,"AI 作画 " 真的能够成为刺激显卡需求的关键吗?

突然爆火的 AI 作画

事实上,"AI 作画 " 是一个存在了接近半个世纪的概念。根据 WikiPedia 介绍,早在上世纪 70 年代,英国画家哈罗德 · 科恩便已经开始了 AI 作画的尝试,当时他用自己研发的电脑程序 "AARON" 去控制一个机械臂进行绘画创作,而这个算法也只能产生色彩艳丽的抽象派风格画作。

( 图源:WikiPedia,哈罗德和他的画作 )

在随后的五十年时间里,AI 作画其实一直都是这个趋势——即可以生成色彩艳丽的抽象派风格画作,但却不能生成写实或者具象的绘画作品。直到 2021 年初,OpenAI 发布了广受关注的 DALL-E 系统,AI 才开始获得了按照文字输入提示来进行创作的能力,而 AI 作画的发展更是进入了突飞猛进的阶段。

在随后的一年时间里,随着 Disco Diffusion、DALL-E 2、Imagen、Midjourney 和 Stable Diffusion 等作画工具先后出现,AI 作画的风格开始变得越来越多变,生成的图片不再局限于抽象,而是能够产出具体的人物 / 事件,画出的作品也越来越符合逻辑。

然而,要说 "AI 作画 " 这个概念真正火起来,那还得是 2022 年的下半年。因为在这段时间里,出现了两个专攻二次元作画的网站,其中一个是 8 月底上线的 AI 作画网站 mimic,该网站主攻日系二次元画风头像,要求用户上传 15 至 100 张图像让 AI 进行学习,然后输出相同画风的 AI 画作。

所谓 mimic,就是模仿者、拟态物的意思,这个命名非常好地展现出该网站的核心卖点及争议要点。模仿原作者画风生成的 AI 画作,虽然很接近用户喜好的作画风格,但明显会给原作者带来困扰,随后画师们掀起的一系列 " 拒绝画作被 mimic 使用 " 的浪潮,更是让这个网站的经营者做出了紧急下线的决定。

(图源:mimic)

尽管 mimic 凉了,但是利用二次元 AI 作画来盈利的网站显然不会只有这么一个。10 月上旬,一家名为 NovelAI 的网站悄然上线了 AI 作画功能,该网站采用了开元的 Stable Diffusion 作为基础,搭配上采集自 P 站热门作品的 NovelAI Diffusion 模型,可以让用户轻松创作出完成度颇高的二次元画作。

和过往的 AI 作画不同,NovelAI 的入门方式简单(注册会员)、创作方式多样(文本生成、原画改写、简笔画生成)、出图素质较高(有充分训练的多个模型打底),最重要的是,符合二次元爱好者的取向,这也使得 "AI 作画 " 这个概念在本月迅速爆火。至于 NovelAI 非法爬虫 P 站稿件训练模型,或是网友利用草稿生成画作反诉作者这些争议事件,则都是后话了。

与日俱增的显卡需求

那么有人就会问了,既然这些 "AI 作画 " 都是跑在服务器上的,那又怎么会对显卡市场的供需关系带来影响呢?

答案非常简单,那是因为目前市面上存在着两种 AI 绘画的方法。其一是在线法,用户只要花钱就能在 NovelAI 上面无限生成画作,这样的优点是没有显卡算力的限制;其二是本地法,通过在本地加载 AI 算法和模型来生成画作,这种做法的优点是生成作品没有限制,而且不用花钱,但是所有运算过程都得靠自己的电脑来跑。

(图源:知乎)

为了测试本地 AI 作画对性能的要求,小雷昨晚特地用一晚上时间完成了本地版 NovelAI 的部署。经过实测,在加载泄露压缩版模型(4GB)的情况下,移动版 RTX 3060 显卡最多只能生成 360*512 尺寸的图片,而且生成一张图片的时间长达 5-10 分钟,体验非常拖沓。

值得关注的是,本地版 NovelAI 已经是目前占用资源最少的一种架设方式了,StableDiffusionWebUI 的占用更高,而且这加载的还是压缩版模型,因为内存限制的缘故,移动版 RTX 3060 显卡无法成功加载目前泄露出来的完整版模型(7GB),在作画质量上会有些许差距。

(图源:twitter,采用 IMG2IMG 算法做出来的图,理论显卡运存不低于 16GB)

总的来看,拥有 6G 运存的独立显卡算是目前运行本地版 AI 作画的一个基础配置,而且越新的显卡体验就越好。目前 RTX 计算卡是运行效果最理想的显卡,其次则是 30 系显卡,20 系、10 系及以下老显卡的支持都不太好,至于 AMD 显卡则是完全没有进行过优化。

对于可以妥协的用户来说,个人建议通过采用低分辨率生成画作,然后 Upscale 至高分辨率的方式来生成画作。这种做法可以有效降低显卡占用,让只有基础配置的用户也能借此进行画风 / 人物学习,但是这样生成的图片在整体画面细节上肯定会有所缺失。

至于追求画作质量的用户,那自然就要更换显卡了。正好,9 月 23 日,英伟达在 GTC 大会上发布了新品显卡 RTX40 系列,其中 RTX 4090 采用台积电 "4N" 制程工艺和高达 24GB GDDR6X 显存,相比上一代 RTX3090Ti 性能提升可达 2~4 倍,可谓是完美的 AI 作画工具。

不得不说,这波浪潮的到来,和 RTX 40 系显卡的发布时间可谓完美契合,再加上老黄近日及时解锁的 RTX 30 系算力限制,难怪 NGA 论坛的用户都在讨论:"怎么感觉矿潮之后,AI 作画要成为新的显卡需求啊?难道这波作画模型泄露的受益者,真的是刚刚发布新显卡的老黄?"

对于这个观点,个人觉得应该分开来看。对创作者而言,在虚拟货币的风波过去后,显卡在 AI 算力方面的提升才真正被释放了出来。AI 作图工具在二次元的产业应用上肯定是非常强的一个存在,画师可以用其辅助作画、轻小说家可以用其绘制人设,至于独立的游戏制作人更是可以大幅降低成本。

但是对普通人而言,AI 作图工具本质上只是风靡一时的新玩具罢了。尽管不用亲手绘制,但是想从 AI 绘制出来的大量作品中找出高质量作品也是一件非常需要耐心的活。在这一波热潮过后,大部分人还是会回到收集画师作品的轨道上,想要借此拉动大量显卡需求确实有些不太现实。

在显卡需求下滑的当下,强如英伟达也需尽快寻找显卡之外的新业务,为下一阶段业绩增长提供更多想象空间。有趣的是,从 Nvidia Canvas 的推出来看,英伟达确实有考虑过发展 "AI 作画 " 这方面的业务。AI 作画或许不能成为刺激显卡业务增长的动力,但是其能否成为英伟达未来所倚重的优势业务,还有待进一步观察。

THE END
广告、内容合作请点击这里 寻求合作
ai
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

9月26日消息,Facebook母公司Meta的首席AI科学家雅恩·勒昆(Yann LeCun)认为,目前大多数AI方法永远不会带来真正的智能,他对当今深度学习领域许多最成功的研究方法持怀疑态度。
业界
沉浸式全息影像、虚拟数字人员工、数字藏品、虚拟营业厅、城市数字孪生、超写实数字人......
业界
6 月 22 日消息,高通技术公司今日宣布推出高通 AI 软件栈产品组合,以提升高通在 AI 和智能网联边缘领域的领先优势。
业界
据财联社消息,音乐软件Spotify发布声明称,将收购AI语音平台Sonantic。声明指出“我们已确定在我们的平台上进行文字转语音功能的数个潜在的机会。
业界
最近,追一科技发布了RoFormerV2模型,凭借追一独创的旋转位置编码技术(RoPE),全面超越了BERT、RoBERTa、Albert、Electra等当前的主流预训练模型。
业界

相关推荐

1
3