贝尔链

别闹了,人工智能GC 杀不死艺术家

区块 2022-11-23 12:13181www.atolyef.com未知

撰文:Neil Shen

出处:品玩

图片出处:由无界版图 人工智能 工具生成。

人工智能GC 生成内容能取代插画师、设计师的工作吗?或者更疯狂一点,人工智能 能批量生产艺术作品,乃至从根本上颠覆艺术市场吗?

关于 人工智能GC 的火爆蹿红大家已经和科技界探讨的足够多,今天大家把目光转向从业者——人工智能 能否取代他们的工作?

下面是他们的回答。

画家自己下笔之前都不了解会发生什么,人工智能 怎么样能了解?又怎么样计算出来?

人工智能 不可以绘制的东西

当我询问能否了解地辨认 人工智能 和人类绘画作品的时候,建筑系大四的吴佳佑给出了很明快的一定答案。吴佳佑正在申请英国伦敦皇家艺术学院的研究生,而他提交的申请作品之一即是一个由 人工智能 辅助创作的交互式网站,访问的人可以在图像搭建而成的互动页面中探索由他设计的故事,而组成网站的所有图像都由 Disco diffusion 和 MidJourney 这两个 2022 年大火的 人工智能GC AI生成工具制作。

图源:吴佳佑提供,基于 人工智能GC 模型生成后微调

「人工智能 生成图像在整体光影、结构与色彩上的表目前我看来无可挑剔,但不少细节经不起推敲。」对拥有绘画功底,又常常用 人工智能 工具的吴佳佑来讲,现在 人工智能 生成图片迥异于人类的风格是显而易见的。

「细节上常常出现色块堆积,过度不自然和线条粗细变化不均匀如此的问题。」吴佳佑拿着我给的几张在twitter上颇受好评的 人工智能 生成图像逐字句的点评起来,虽然只有大四,但他的口吻非常自信。

图源:吴佳佑提供,基于 人工智能GC 模型生成后微调

对一个美术门外汉来讲,如此的细节可能并无关紧要,但对专业人士来讲,差别是显著的。「我给同学说了技巧后,大伙不管有没美术功底,基本上都能看出来。人工智能 生成的图像看不出绘制的前后顺序,由于它背后无人类绘画的基本逻辑支撑。」吴佳佑说。

问题的根源可能来自算法本身。现在的主流 人工智能GC 工具都使用了 diffusion model 扩散模型,它的练习基于有文字描述的图片数据,通过对图片反复降噪,人工智能 学习怎么样生成符合文字描述的图片。因为文字描述总是是整个图片的内容,因此 人工智能 深度学习的结果会对整体图片结构和光影的把握比较好,而相对的在细节上就会失准,由于这类细节总是缺少文字描述,又相当复杂多变。

这可能是在日式漫画界近期热炒的 人工智能 三大画图难点的来历。所谓三大难点,指的是现在的 人工智能 模型不可以完成的三种主题创作:萨菲罗斯游泳、樋口円香吃拉面和哭泣的萝莉吃蛋糕。人工智能 模型在输入有关指令后总是会生成叫人啼笑皆非的图片。

图源:Neil Shen 用 MidJourney 生成

其实 人工智能 不可以完成的创作远不止这三种,譬如假如你让 人工智能 生成游泳的三文鱼,那它大概率给你的图片将会是三文鱼片而不是活蹦乱跳的鱼。

图源:Neil Shen 用 MidJourney 生成

人工智能GC 这类人类看来很匪夷所思的错误同样要归因于算法,一旦给出的指令过于偏狭,譬如日式漫画中较少表现的水中游泳动作,或者其画面内容存在较为复杂多变的物理交互逻辑,譬如「吃拉面」图像意味着同时处置人物、手指、面条和筷子这几个在 人工智能 看来都是线条的内容时,人工智能 大概率会存在翻车的现象,由于练习算法所用的样本集可能较少涵盖有关内容,而扩散模型对复杂细节线条交互变化的理解还相当初级。

但细节总是是决定画家艺术风格和水平的决定性原因之一。插画师元元是少见的迄今仍然坚持纯手绘作图的职业画师,研究生毕业于清华美院的元元讲述了科班美术生的结构、线条色彩和细节是怎么样被练习的——因循着与 人工智能 生成完全不一样的逻辑。

图源:维基百科 《万壑松风图》 宋朝 李唐绘

「老师会叫你以操场为主题画十幅同样的画,刚开始你会想要把每一条跑道线,根据透视、光影结构完整的画出来,但到某一个时刻,你会想要去若隐若现地处置某些跑道线,有的留白,有的加重,有的干脆去掉。」元元说,「有时候画家追寻的是这种主观感受,作品生动不是说要画的和真实世界完全相同。」

绘画的过程不只考验画家个人的方法,画家作为个人,他的感受,心理乃至成长经历、教育背景等都发挥了影响,这类数据量之庞大都是 人工智能 所没办法计算的。更何况,对元元来讲,真的的创作过程在于打破某些规则和逻辑,「国画中有时候松弛的闲闲一笔就是远山,层云。此处留白,彼处着墨,有时候画家自己下笔之前都不了解会发生什么,人工智能 怎么样能了解?又怎么样计算出来?」

剥离所谓「低效率工作」意味着什么?

人工智能 可以模仿的东西

就像对AI伦理的讨论一样,科技界对 人工智能GC 内容对艺术性的冲击的讨论也常常是模棱两可的。技术至上主义者几乎回避了有关艺术性的讨论,对他们来讲不断而持续的精进深度学习算法才是要紧的事情。伴随数据集和算法的优化,艺术性好像同样能被 01 的字符所表达。

图源:谷歌 Imagen video 论文 显示 人工智能GC 已经可以制作梵高风格的图像 https://imagen.research.谷歌/video/paper.pdf

某种意义上他们成功了,甚至连Google最新推出的基于扩散算法的 imagen video 模型在生成视频方面都可以模仿艺术家风格,而用 人工智能 辅助创作在很多游戏美术师的工作中已经是通行惯例。在多家大厂有过游戏制作经验的阿丁在谈到 人工智能GC 时频繁提到一个词——「喂图」,意思是在游戏人物形象设计的刚开始——特别针对一闪而过的 NPC 人物,美术设计会给 人工智能GC 工具输入不少参考图学习,进而迅速生成符合游戏需要的结果。

「虽然还要经过后期的调整,但 人工智能 目前确实已经取代人力开始承担这部分的工作量了。」阿丁说,他们现在用较多的工具是较为侧重二次元风格练习的 novel 人工智能 ,它基于现在最热门的 stable diffusion 模型,数据集由 500 多万张带有文本标记的图片组成。

然而通过「喂图」练习的 人工智能GC 模型充满了争议。10 月 7 日,twitter用户@BG_5you 基于刚去世的韩国著名漫画家金政基作品用 Stable Diffusion 练习出了金政基风格的绘画模型,此举引来的网友的如潮恶评,而紧接着 10 月底,工程师 Ogbogu Kalu 由于把迪士尼签约画师 Hollie Mengert 的作品未经赞同后抓取练习出可以批量生成 Mengert 画风的模型再度冲上热搜。

图源:@BG_5you 用模型生成的「金政基」风格作品

假如说前者网友一边倒的批评尚主要基于对死者的尊重,后者则将 人工智能GC 迅速进步对现行插画市场的冲击鲜明地址了出来。要了解因为 Hollie Mengert 签约了迪士尼,甚至她本人都不可以随便发布我们的作品,而从毕业开始算起,她的画风形成至少花费了十多年的时间,相比之下 Ogbogu Kalu 练习新模型的时间只有几个小时,且本钱几乎为零。

图源:左图为 Hollie Mengert 原创,右图为 Ogbogu Kalu 练习的模型生成 https://waxy.org/2022/11/invasive-diffusion-how-one-unwilling-illustrator-found-herself-turned-into-an-人工智能-model/

假如风格模仿是这样的易如反掌,那样画家十数年的绘画练习有哪些意义?他们的商业价值又该被怎么样衡量?如此的叩问出目前很多插画师的心中。坦率地说,机器学习并不可以准确模仿所有风格,但 人工智能GC 现在的进化程度已经强到开始对很多范围产生冲击。阿丁就直言,既然 人工智能GC 已经可以介入游戏原画和人物设计,目前网上时尚的美术外包中不少基础工作非常快就将被 人工智能 替代。

画师们对此不是没警惕,很多人在给自己作品标注「未经许可不能用」的版权声明以外,还会加上「禁止 人工智能 学习」声明,有的人则干脆从公开平台撤掉我们的作品以防被抓取成为 人工智能 学习的数据。在二次元绘画发育最成熟的日本,「人工智能 学習禁止」已经成为了一个时尚词。

然而,对硅谷来讲 人工智能 风格迁移导致的争议并非他们考虑的最重要问题,技术中立,更时髦的词叫做 人工智能 的民主化 democratization of 人工智能 是他们的信仰,人工智能GC 技术潜在的巨大商业前景才是真的要紧的。依据彭博社的报道,投资了 stability 人工智能 的 Lightspeed 合作伙伴 Gaurav Gupta 直言不讳地表示,人工智能GC 技术根本性地赋予了大家更多的权力,同时让「低效率 inefficiency」工作从内容创作中剥离。

「只须 人工智能GC 生成内容满足水平需要,我不在意全方位用它。」

人工智能 将替代哪个?

Gaurav Gupta 的表态几乎是在明示 人工智能GC 生成技术对现有绘画市场的颠覆性冲击。假如大家把绘画市场容易分为商业绘画和艺术绘画两部分的话,前者显然会更直同意到影响。

对于这个问题,在某游戏工作室担任原画师的刘纪扬表现的非常轻松,「很多人说它做出来的东西冰冷,我没那样矫情,我就感觉它弄得挺好的,构图颜色都好。更深的内容 人工智能 现在还做不了,但我感觉它给大家设计师和美术师的前期工作提供了很多思路参考。」刘纪扬说到。

图源:受访者刘纪扬提供

在刘纪扬看来,尽管 人工智能GC 内容在游戏策划的刚开始阶段可以辅佐策划更好的表达想要的游戏成效,但它尚不可以介入游戏原画师更高阶和精确的工作。「大家的设计,越到后期需要越精确、细致,人工智能 只能粗疏的在需要很模糊的时候一次性生成很多选择,但当方向明确的时候,人工智能 还没办法胜任规模化的游戏设计场景。」

图源:受访者刘纪扬提供

相比之下阿丁的怎么看有所不同:「人工智能GC 生成的高精度的图片不仅能够应用于前期策划,在游戏的人物设计和场景设计中都将拥有广泛的前景,与之相伴的就是很多腰部以下插画师会失去工作,现在阻挡大规模用的其实是潜在的法律风险,而不是生成内容的水平本身。」

不仅仅是游戏的前期策划,泛化的商业绘画范围,从影视美术、网站建设乃至图书制作,现有些 人工智能GC 技术在描绘大场景、特定绘画风格和精细度成效上均有优势,更不必说其本钱低、速度快,且不会被题材、风格乃至数目局限的特征。尽管存在类似「游泳三文鱼」如此的问题,但毋庸讳言商业绘画这个过去只可以靠人力的创意市场迎来了最强劲角逐者,首当其冲受冲击的将是对精度和创意需要不那样高的细分范围。

「说实话,只须 人工智能GC 生成内容满足水平需要,我是不在意全方位用它,由于真的会节省很多本钱。」某一线时髦杂志的实行主编在被问及对 人工智能GC 内容怎么看时说到。对时髦杂志来讲,拍摄大片时产生的置景、灯光、场地本钱是一笔不菲的开支,而大片的制作过程总是还遭到时间、空间与职员原因的限制。人工智能GC 生成技术从根本上解决这类困难,同时还能很大拓展视觉语言的丰富程度——「如果 人工智能 足够强大,我自己就能制作一本杂志了不是吗?」事实上,今年美国版《cosplaymopolitan》已经用 MidJourney 制作了一期封面。

图源:cosplaymopolitan 官方网站 https://www.cosplaymopolitan.com/lifestyle/a40314356/dall-e-2-artificial-intelligence-cover/

中国人说「兴之所至」,可 人工智能 根本没办法「起兴」,又能「至」去什么地方?

人工智能 有创造性吗?

假如说对商业绘画范围 人工智能GC 的潜在颠覆性毋庸置疑,那样在艺术绘画范围这个问题就充满了争议。

「假如你水平好的话是永远不可能被替代的。」这是很多人强调的论点。尽管 人工智能 可以惟妙惟肖的模仿风格,但它不理解图像背后所代表的意思,换言之,人工智能 不拥有真的的创造力。

这不是说 人工智能GC 完全没任何创造力,Deepmind 的开创者,当代AI领头羊 Demis Hassabis 曾在 Lex Fridman 的访谈中表示,人工智能 的创造力可以让它通过看数百万张猫的照片来「创造」一只一般的猫,但人类现在还不可以把高层次的抽象定义用算法准确地表示。

从这个意义上说,探讨 人工智能GC 的艺术性甚至看上去有的滑稽。被问及 人工智能 的艺术性时,艺术留学机构开创者 Evan 飞速就给出否定回答,他所在的艺术留学机构每年向全世界顶尖艺术学府输送大量学生,人工智能GC 范围是他们关注的重点之一。「大家学生提交的申请作品主体是不主张过度用有 人工智能GC 创作内容的。」Evan 说到。在他看来,艺术品的价值源于背后的感染力,这种感染力只能来自人,相比之下,人工智能 作品太过「冷静」、「匠气」。「我可以感觉到它每一个部分的精巧,但它的灵魂是不统一的,它不够动人。」 

图源:维基百科 苏轼《寒食帖》被誉为天下第三行书 无论线条、留白或造型变化均极富风格韵味。

艺术创作的立意和技法都服务于人本身的思绪脉络,「只须是稍微成熟点的艺术家,他的创作都是精准的。」 对 Evan 来讲,真的突破和创造性的伟大艺术作品,从来不会拘泥于既有数据的窠臼,无人的主观能动,人工智能 作品精巧而平庸。

在自己专栏中很多用生成图片配图的自由撰稿人小温对此有个精妙比喻:有一类作品创作出来不需要写注解,由于作品本身足够牛;另一类则需要要写注解,不然大伙不了解看的是什么;但最糟糕的作品就是有没注解都无所谓,由于作品本身不够好,而文字注解也不够要紧。人工智能 生成作品正是此类。

「人工智能 依赖算法以结果生成结果,但人的创造过程最革命性的东西,尝试和试错,打破规则和重塑规则在这个过程中被根本忽视掉了,中国人说‘兴之所至’,可 人工智能 根本没办法‘起兴’,又能‘至’去什么地方?」小温补充道。

总的来讲,人工智能GC 在艺术范围的实践现在来看更像是一件精准实行的工具,它可以产出精确的结果,首要条件是人本身已经有了创意的框架。正如文章一开头提到的吴佳佑,非常难想象假如没 人工智能GC 工具的帮忙,他的交互网站所需要的几千张图片该怎么样获得。而在海外,经验丰富的 人工智能 生成喜好者已经开始运营 人工智能 制作电影——除去主创本人的配音,从语言脚本、镜头画面到音效都将运用 人工智能GC 模型来完成。

图源:吴佳佑提供,基于 人工智能GC 模型生成后微调

人工智能GC 的确实很大减少了大家的创作门槛,没经过技法练习的人目前仅凭我们的想法就能便捷创造是我们的作品,在将来这将重塑大家认知艺术的维度,它的革命性就仿佛照相机之于油画,在央美艺术史博士小杨看来,这同样有一个渐进的过程。「新工具的出现总会带来对艺术本质理解的新考虑,这在历史上已经发生了不只一次,相比于艺术技术的改革,艺术理论一直相对滞后的。」

话虽这样,小杨之前并没亲自尝试过 人工智能GC 工具,对于互联网上充斥着的 人工智能GC 生成图片内容,她从专业角度以「不和谐」三个字概括。在推荐下小杨首次用 MidJourney,选择 Gothic letters 和她名字拼音的缩写作为关键字,因为服务器不稳定,MidJourney 一口气返回了三组共 12 张图片,小杨看了之后说,这种水平还不如我从随意什么中世纪手抄本里剪切来的便捷和好看呢。

图源:MidJourney 生成图片

这段话仿佛可以当做对现在 人工智能GC 与艺术关系的注脚。

伴随算法的进步,人工智能GC 进化速度只能加速而不会减慢,它不只将对绘画有关范围产生重大影响,在交互设计、实验艺术乃至将来的元宇宙社交场景中,人工智能GC 可预见的都将饰演要紧角色。

在介绍完我们的交互式网站后吴佳佑告诉我,刚和英国皇家艺术学院的老师聊完他的作品,录取的可能性非常大,而他的专业 information experience design 细分方向之一就叫 moving image design 动态图像设计,这听上去就像是专门为 人工智能GC 筹备的一条赛道。

而这到底是 人工智能GC 技术的胜利,还是人的胜利呢?

上一篇:耐克“卖”虚拟鞋,认真了 下一篇:没有了

贝尔链-Baer Chain (BRC)最新价格,行情走势图,币值分析 Copyright © 2002-2021 贝尔链 (http://www.yebogroup.cn/) 网站地图 TAG标签 备案号