人工智能专家对过去几年的进步感到兴奋。 你可以告诉! 他们一直在告诉记者诸如“ 一切都在开花 ”、“ 数十亿人的生命将受到影响 ”和“当我与一个人交谈时我就认识一个人——不管他们是否有一个由 肉 头 。”
不过,我们不必相信他们的话。 最近,人工智能驱动的工具已经直接为公众所知,在我们的社交信息流中充斥着奇异而令人震惊且通常非常有趣的机器生成内容。 OpenAI 的 GPT-3 采用简单的文本提示——写一篇关于人工智能的新闻文章或想象 学士 ——并产生了令人信服的结果。
Deepfakes 从一个迫在眉睫的威胁中毕业,一个有进取心的青少年可以为 TikTok 组合起来,聊天机器人 偶尔 会让他们的创造者陷入危机。
更广泛,并且可能最能唤起创造性人工智能 的 是新的图像创建工具,包括 DALL-E、Imagen、Craiyon 和 Midjourney,它们都做同样事情的版本。 你要求他们渲染一些东西。 然后,用从网络和其他地方收集的大量图像训练模型,他们尝试——“苏联雕像风格的巴特辛普森”; “切尔西街道上的金杜德巨型动物”; “地狱的意大利面晚餐”; “地毯清洁公司的标志,蓝色和红色,圆形”; “生命的意义。”
通过一百万个帖子和模因,这些工具已成为 AI 的新面孔。
机器生成的媒体泛滥已经改变了 话语 ,可能会变得更好,尽管情况不会更糟。 与 VC 内部关于避免未来超级智能奴役人类奴役的油嘴滑舌的辩论相比,关于图像生成技术的讨论由用户和艺术家推动, 重点关注劳动力 、知识产权、人工智能偏见以及 艺术借用和复制的伦理 . 早期的争议已经切入正题:在科罗拉多州的美术比赛中进入生成艺术( 并获胜 !)的人是混蛋吗? 从游戏、电影和电视领域的概念艺术家到自由标志设计师,在他们的行业中已经感到被低估或被剥削的艺术家和设计师对自动化感到担忧是可以理解的。 一些艺术社区和市场已经 禁止 人工智能生成的图像。
我花时间使用这些工具的当前版本,它们非常有趣。 他们也会让你失去平衡。 能够生成看起来像照片、绘画、素描或 3-D 模型的图像并不能使某人成为艺术家或擅长绘画,但它确实使他们能够在物质方面创造 艺术家 近似 一些 的 立即以低廉的价格生产。 知道你可以在特定时刻表现出你在想的任何东西,这也意味着一种奇怪的、定制的数字通信模式,即使是私人对话和转瞬即逝的想法也可以被解释和说明。 当您可以要求机器展示事物时,为什么只向人们描述事物?
尽管如此,大多数关于人工智能媒体的讨论都让人觉得是投机性的。 谷歌的 Imagen 和 Parti 仍在测试中,而像 Craiyon 这样的应用程序很有趣,但技术演示却降级了。 OpenAI 正在开始将 DALL-E 2 转变为主流服务的过程,最近 邀请 了 100 万用户,而强大的开源模型 Stable Diffusion 的发布意味着 更多的工具 即将到来。
然后是 Midjourney,这是一款已向大众开放数月的商业产品,用户一直在通过它来面对和回答一些关于人工智能媒体生成的更实际的问题。 具体来说:如果有机会提出问题,人们实际上想要从中得到什么?
Midjourney 在某些方面与同行不同。 它不属于或附属于大型科技公司或更广泛的人工智能项目。 它没有筹集风险投资,只有十名员工。 用户可以每月支付 10 美元到每年 600 美元不等,以生成更多图像、访问新功能或获得许可权,成千上万的人已经拥有。
它基本上也只是一个聊天室——事实上,在它公开发布后的几个月内,它是 Discord 中最大的一个,拥有近 200 万会员。 (就规模而言,这是 Fortnite 和 Minecraft 。)用户通过提示机器人来召唤图像,该机器人试图在一系列公共房间(#newbies,#show-and-tell)中满足他们的请求,#daily-theme 等),或者,对于付费订阅者,在私人直接消息中。 根据创始人大卫霍尔兹的说法,这个机器人将请求传递给 Midjourney 的软件——“人工智能”——该软件依赖于从一家未公开的主要云提供商租用的服务器。 Holz 说,请求实际上被扔进了“10,000 个显卡”的“巨大漩涡”中,之后用户逐渐看到它们成形,变得清晰,但随着 Midjourney 改进其工作而改变形式。
这暗示了艺术和设计领域之外的外部性。 “几乎所有的钱都花在了购买这些机器上,”Holz 说。 新用户在被切断并被要求付费之前会获得少量的免费图像生成; 每个请求都会启动一项庞大的计算任务,这意味着要消耗大量电力。
高昂的计算成本——主要是能源成本——是其他服务对增加新用户持谨慎态度的原因。 Midjourney 选择将这笔费用转嫁给用户。 “如果目标是广泛使用,那么云需要大一千倍,”Holz 说。
暂时不考虑人工智能笑话、图像引发的能源和气候危机的前景,Midjourney 的 Discord 是一个有趣的潜伏场所。 用户工程师用破碎的然后流利的Midjourney-ese进行提示,从简单到难以理解; 互相聊聊人工智能艺术; 并征求意见或批评。 在加密货币崩溃之前,我看到用户制作了低预算的 NFT 收藏品,并带有“宫崎骏风格的钢铁侠,交易卡”之类的提示。 尤其是在早期,有人口统计信息。 有很多关于 Walter White 的半生不熟的笑话提示,以不协调的艺术风格呈现的视频游戏角色,而且,尽管 Midjourney 的 1,000 多个禁用词列表和活跃的版主团队,大量有点到非常角质的尝试召唤看起来像粉丝相邻名人的幻想女性。 现在,一次有几十万人登录,这是巨大而令人迷惑的。
Midjourney Discord 的公共部分最类似于工业规模的自动化 DeviantArt,观察者 认为 它从中学到了一些常见的数字艺术敏感性。 (DeviantArt 充斥 着 Midjourney 艺术,它的一些用户并不满意。)Holz 说,由于没有更具体的说明,Midjourney 已经确定了一些默认样式,他将其描述为“富有想象力、超现实、崇高和异想天开”。 (相比之下,可以说 DALL-E 2 偏爱照片写实。)更具体地说,他说,“它喜欢使用蓝绿色和橙色。” 虽然 Midjourney 可以被提示以数十位在世和死去的艺术家的风格创作图像,其中一些人公开反对这一前景,但 Holz 表示,它并没有刻意针对其中任何人进行训练,有些人很高兴发现自己在模型中。 “如果有的话,我们倾向于让艺术家 要求 更好地复制它们。”
但是,很多时候,您会遇到有人逐渐苦心地完善特定提示,真正 在 做某事,并且因为您在 Discord 中,您可以问他们在做什么。 用户 Pluckywood,真名 Brian Pluckebaum,从事汽车半导体营销工作,同时设计棋盘游戏。 “从棋盘游戏的设计到发布棋盘游戏的最大差距之一就是艺术,”他说。 “以前,你只能通过出版商工作,因为个人无法雇佣所有这些艺术家。” 为了生成他正在开发的新游戏所需的“600 到 1,000 个”独特的艺术作品——“盒子艺术、角色艺术、规则书艺术、站立艺术、卡片艺术、卡片背面、棋盘艺术、传说书艺术”——他向 Midjourney 发送这样的提示:
角色设计,迷人而美丽的女性吸血鬼,她的手是爪子,她在舔一只爪子,哥特式,电影,史诗般的场景,体积照明,极其细致,错综复杂的细节,Jim Lee 的绘画,低角度拍摄 –testp
Midjourney 以一种既匿名又有点可识别的风格将她送回,足以让她长时间看一眼,但在大多数生成图像工具中仍然很常见,双手令人困惑。 “我不会用白文本空白游戏来接近出版商,”Pluckebaum 说。 如果他们有兴趣,他们可以聘请艺术家来完成工作或收拾东西; 如果不是,那么,现在他可以自行出版了。
Midjourney 的另一位用户 Gila von Meissner 是来自“德国北部的贫民窟”的平面设计师和儿童读物作者兼插画家。 她的经纪人目前正在购买一本将生成的图像与她自己的艺术和角色相结合的书。 像 Pluckebaum 一样,她提出了与出版商的权力平衡。 “图画书付出了花生,”她说。 “大多数插画师都在财务上苦苦挣扎。” 为什么不让工作更轻松、更快捷? “这是我的角色、我对 AI 背景的编辑、我的声音和我的故事。” 她说,一个需要几个月的过程现在需要一个星期。 “这是否会降低它的原创性?”
用户 MoeHong 是加利福尼亚州的一名平面设计师和印刷师,他一直在使用 Midjourney 为政府网站、小册子和文学作品制作他所谓的通用插图(“背景、工作中的人、学校里的孩子等”): “我得到了使用定制艺术品的一些好处——而不是我们有佣金预算! ——没有付费艺术家的部分。” 他说他已经大部分更换了股票艺术,但他对这种情况并不完全满意。 “我有很多朋友是商业插画师,我一直非常小心地不向他们展示我的作品,”他说。 他坚信,像这样的工具最终可能会让从事他行业的人失业。 “但我已经 50 多岁了,”他说,“我希望到那时我会离开。”
这种预测的变化在委员会的不同方面很常见。 例如,澳大利亚一家广告公司的一位高管告诉我,他的公司正在“将人工智能艺术作为一种解决方案来提供更广泛的创意选择,而无需在营销活动中投入大量预算,尤其是对我们的全球客户而言。” 这位高管说,最初,人工智能图像让客户处于“后脚”,但他们已经好转了。 客户越来越难以将 Midjourney 图像与人工创作的艺术区分开来——然后就是价格。 “能够一次又一次地创造无限、逼真的图像已成为一个关键卖点,尤其是在传统制作会产生巨大成本的情况下,”这位高管说。
Bruno Da Silva 是 R/GA 的艺术家和设计总监,R/GA 是一家在全球拥有数千名员工的营销和设计机构。 他最初对 Midjourney 感兴趣是因为他自己的业余项目,并很快在工作中找到了用途:“我收到邀请后的第一件事就是在 R/GA 周围展示 [Midjourney 艺术],我的老板说,‘这他妈的是什么那?'”
它很快加入了他的工作流程。 “对我来说,当我要推销一个想法时,重要的是要推销整个东西——视觉、字体、颜色。 客户需要看看我脑子里在想什么。 如果这意味着聘请摄影师或插画师在几天或一周内制作出真正特别的东西,那将是不可能的,”他说。 他向我展示了他在推销期间与大公司客户分享的概念艺术 - 一家床垫公司、一家金融公司、一家规模太大而无法描述而无法识别的科技公司的分支机构——这些概念艺术部分受到了 Midjourney 的启发或创作。
达席尔瓦说,图像生成器在项目的早期阶段特别有效地改变松散的想法,当时许多设计师在谷歌图片、Shutterstock、Getty Images 或 Pinterest 或彼此的作品中寻找参考和灵感。
这些肤浅的共享引用导致了“一切看起来都一样”的情况,达席尔瓦说。 “在设计史上,人们曾经非常努力地创造出新颖独特的东西,而我们正在失去这一点。” 这可能是对艺术生成器的双重批评,它们接受过一些相同的资源和设计工作的培训,但达席尔瓦不这么看。 “我们已经像计算机一样工作了——非常快。 这是相同的过程,相同的简短,相同的截止日期,”他说。 “现在我们正在使用另一台计算机离开那个地方。
“我认为我们的行业将在未来三年内发生很大变化,”他说。
自 6 月以来,我一直在使用 Midjourney 并为其付费。 根据 Holz 的说法,我符合最常见的用户特征:为自己、家人或朋友做实验、测试极限和制作东西的人。 我在几个小时内耗尽了我的自由世代,将图像发送到群聊和工作 Slack 和电子邮件线程中。
我生成的绝大多数图像都是笑话——大多数是给朋友的,还有一些是我和机器人之间的。 有一段时间,通过向超级计算机询问一个被粘在胶床上的人的可怕渲染图来打断关于购买哪种捕鼠器的聊天,或者用“麦克曼森金字塔”的渲染响应共享的 Zillow 链接,这很有趣吉萨。” 当一位一直在试验 DALL-E 2 的朋友将该工具描述为一个处理侵入性想法的地方时,我点点头,在我的 Midjourney 窗口中滚动回到一个非常令人信服的观点“乔·拜登在海滩上晒黑,由 R.屑。”
我仍然以这种方式使用 Midjourney,但新颖性已经消失,这在很大程度上是因为效果图变得 更好 —— 奇怪和美丽 ”,不如说“有能力和合理”。 这一点也变得陈旧,我已经绘制了我艺术想象力的狭窄界限。 许多已经风靡一时的人工智能艺术都是从产生恰到好处的结果的提示中产生的:接近到足以令人吃惊但仍然以某种方式偏离,通过一个误解的词,一个使图像变得令人毛骨悚然的奇怪人工制品,或者一个完全乱线概念插值。 令人惊讶的错误是人工智能图像对真正创造力的最佳近似,或者至少是最令人愉悦的。 TikTok 上个月发布的原始图像生成器 包含了这一点 。
当人工智能艺术有点失败时,就像它在这个早期阶段一贯的那样,这很有趣。 当它简单地成功时,正如它将在未来的几个月和几年中越来越令人信服一样,它只是,嗯,自动化。 人们可以通过手机以低廉的价格通过有争议的过程以低廉的价格命令存在的东西越来越多:琐事、餐饮、汽车、劳动力。 新的人工智能公司问, 为什么不是艺术?