技术本身是无罪的。
昨天,我的同事祝思齐老师发布了一篇关于AI工具应用的文章。今天,作为一名使用StableDiffusion(以下简称SD)工具的AI绘画老玩家,我想简单聊聊SD在过去1年内,如何被“业余”地使用。
我想粗略地将这1年的SD大众向发展分为3个阶段。从去年10月到今年春节前为“初探期”,这段时间的SD作用有限,对生产毫无帮助,但颇具潜力,许多二次元爱好者把它当作纯粹的“玩具”;今年春节后到5月为“爆发期”,几乎是在短短一周内,SD相关技术席卷互联网,许多游戏公司开办“AI兴趣小组”,鼓励大家研究SD;今年6月开始为“徘徊期”,SD技术的发展似乎停滞不前,业余大众对SD兴趣骤降,一些从事游戏美术的朋友告诉我,大厂对SD应用的研究日渐专业化,“技术壁垒”正在产生,但因为保密协议限制,不便透露太多。
先来聊聊“初探期”。去年10月初,一位策划朋友告诉我:“我最近发现了一个叫‘Novel AI’的网址,只需要设置关键词和参数,就可以生成二次元妹子,我可以用它来给Tiera添加参考图。”Tiera是他正在设计的高难度关卡的最终Boss,形象为白发蓝瞳的魔女。
我点开他发来的网址,看上去像是一个专为二次元轻小说生成AI创意插图的工具,界面是全英文,专业名词扎堆,我理解起来有些费力。生成图片需要排队,还总是卡住。过了几天,网站开始收费,一些人把网站所使用的SD工具架构到本地。
我和朋友也架构了SD,但生成的图片并不理想,线条粗糙、画质模糊且色块混乱。因为架构到本地后,生成图片时需要电脑的显卡进行计算,而我的显卡功效一般。那时的SD效果极其不稳定,我可能需要生成100多张图片,才能从中选出一张勉强符合要求的。而朋友在尝试了一段时间用SD添加参考图后,再也没打开过它——效率实在是太低了,而且风格受限,完全没有Pinterest(一个图片分享网站)好用。
因为SD起源平台的受众是宅圈群体,在“一键式生成老婆”这个噱头之下,SD影响力越来越大。虽然生成的图片质量差,但是看教程或者“整活”视频的人很多。我同朋友打趣说:“搞个账号开始做自媒体,用AI生产内容,保准赚得盆满钵满。”
玩AI绘画的人越来越多,一些从事相关领域工作的技术人员也加入进来,SD被不断迭代,一直有人在开发相关插件。
由于Lora(小模型)研究的深入,SD所显现出的潜力越来越大:它不仅可以生成二次元美少女,还可以生成三次元形象;不仅能生成人,还能生成猫、狗甚至“克苏鲁”古神。今年1月,在全球最大的Lora模型站Civitai,已经有许多通过真人照片生成的Lora,但以欧美形象为主。到了月底,东亚形象的Lora出现在模型站,有人利用它生成真人Coser照片,并进行诈骗宣传,此举引起国内警方的注意。在某次警方通告后,SD开始“破圈”。
到了“爆发期”,SD有一些革命性的新技术涌现,其中令我印象最深刻的,是AI动画领域的多帧渲染法。
在多帧渲染法出现之前,AI动画的制作方法比较笨重:先把视频拆成一帧帧的图片,按序号顺序放在同一个文件夹里,再将文件夹地址填到本地的SD中,设置好Checkpoint(大模型)和参数,也可以一同设置角色的Lora,使画面中的角色形象更稳定。同时需要开启Control net插件来识别角色肢体动作,保持动作的流畅性。这种方法下产出的AI动画崩坏感严重,例如角色跳舞时背过身去,SD会在某几帧把角色的后脑勺转换成正脸。
而多帧渲染法需要使用一个叫作“Multi-frame Video rendering”的插件。通俗点说,这一插件在耗费旧方法3倍显卡算力的基础上,减少了AI动画中间帧崩坏的现象,大幅提高了AI动画的稳定性。此方法出现后,B站的AI动画视频数量陡增。
但我也发现,这一时期的大多数AI动画都有着比较明显的色情意味,并且在多帧渲染法出现后愈发明显。换个极端点的说法,许多人接触SD,目的就是为了生产此类图片或者动画——有受众就有市场,有观众就有创作者。在视频网站,这类AI动画可以被标注为原创,且在创作者激励的范畴内,还能参与瓜分现金的创作活动。因为有利可图,创作者越来越多。
以我了解的一名AI动画创作者为例,他每天下班后用现成的资源做一个MMD视频,然后用SD进行风格转化,再投稿到视频网站。转化过程中,他会玩手游或者看书,并不耽误自己的时间。半年时间里,他通过AI动画获得的“额外收入”约为1万元。
今年6月之后,AI绘画逐渐进入“徘徊期”。大众开始对AI出现审美疲劳,新技术迟迟不出现,创作者也感到乏味。归根结底,业余爱好者和观众们并不像专业从业者,有改善工作流的需求,大多只是想“图一乐”。因此,对于他们来说,SD更像是一种高门槛的玩具——感兴趣时很“上头”,玩腻了就丢在一边。我了解的那位AI动画创作者,在意识到继续做AI动画产生的收益不能覆盖电费和显卡寿命损耗的折价后,也暂停了视频更新。
不过,就像其他AI创作工具一样,SD在这些发展阶段中也面临着许多矛盾和争议。比如传统创作者与AI使用者之间的矛盾——我们经常能看到一些知名插画师的风格被AI简单粗暴地“炼成”,并用来创作图片在约稿网站上售卖,也能看到AI绘画的反对者网暴AI工具使用者,并采取举报等方式限制他们的活动。
又如利用AI工具生成真人形象的侵权和欺诈问题,因此诉诸法律的案例也不少。只不过,由于AI尚属新鲜事物,相关法律显得较为模糊,与大众印象里对AI工具的“审判”并不一定完全贴合。从现有情况来看,似乎还没有出现一个特别有代表性的案例能够供普通人参考。
在祝老师的文章中,受访者提到,未来AI创作可能会出现两极分化的现象,低门槛越来越低,高门槛越来越高。目前,这种情况似乎已经有了趋势:一些AI工具已经支持多语言(包括中文)输入,普通用户最直接的一道障碍已经逐渐被跨过;大型厂商则在尝试将AI融入工作流,寻找到了一些方向,也取得了一定的进展。
也许,正如这位受访者所说,“围绕AI还是有很多争议,但面对新事物和技术的发展,一些人心中会有被落下的恐惧,另一些人则把这种变化视为机遇”——技术是技术,会呈现出什么状态,仍然取决于人们怎样使用它。