Zakladatel Midjourney David Holz o dopadu umělé inteligence na umění, představivost a kreativní ekonomiku

Střední cesta je jedním z hlavních hnacích motorů vznikající technologie využívající umělou inteligenci (AI) k vytváření vizuálních snímků z textových výzev. Startup se sídlem v San Francisku nedávno představil novinky jako motor za uměleckým dílem, které získalo cenu v soutěži státního veletrhu v Coloradu, a to pravděpodobně nebude poslední komplikovaný problém, kterému bude AI umění v nadcházejících letech čelit.

Midjourney se odlišuje od ostatních v prostoru zdůrazněním malířské estetiky v obrazech, které vytváří. Platforma se nesnaží vytvářet fotorealistické obrázky, které lze zaměnit za fotografie, a generální ředitel David Holz říká, že je osobně velmi nesvůj s podivnou kvalitou deepfakes a dalších prací, které příliš věrně simulují realitu. Místo toho Holz říká, že Midjourney je navržen tak, aby odemkl kreativitu obyčejných lidí tím, že jim poskytne nástroje k vytváření krásných obrázků pouhým popisem.

Ale navzdory humanistickému, spotřebitelsky orientovanému zaměření společnosti se nevyhnutelně objevují otázky o důsledcích pro komerční umění a profesionální umělce. Vyzpovídal jsem Holze pro a širší článek o potenciálních narušeních, která umělá inteligence pravděpodobně způsobí ve výrobě snímků pro zábavu, videohry a publikování. Zde je delší úryvek z našeho rozhovoru, kde Holz poskytuje větší hloubku a kontext, když řeší tyto problémy a vysvětluje svou vizi společnosti, průmyslu a technologie. Rozhovor byl z důvodu délky a srozumitelnosti upraven.

Rob Salkowitz, přispěvatel Forbes: Jaká je vaše role a titul?

David Holz, Midjourney. Jsem zakladatel a CEO. Obvykle dávám přednost tomu, když se mi říká zakladatel, protože CEO zní velmi obchodně a my nejsme příliš obchodničtí. Jsme laboratoř aplikovaného výzkumu, která vyrábí produkty.

Co je mise Midjourney?

Rádi říkáme, že se snažíme rozšířit představivost lidského druhu. Cílem je přimět lidi, aby byli nápaditější, ne vyrábět nápadité stroje, což je podle mě důležitý rozdíl.

Můžete stručně přiblížit dosavadní historii společnosti?

Na imaginativní části naší společnosti jsme začali pracovat zhruba před rokem a půl. Došlo k několika průlomům v difúzních modelech, lidé chápali klip, openAI a tak. Téměř každý, kdo je do toho zapojen, je San Francisco a všichni jsme si uvědomili, že to bude vážné, že se to liší od mnoha jiných věcí.

V čem Midjourney vidí přínos této technologie převodu textu na obrázek pro obchod a společnost?

Rozhodně mi jde víc o společnost než o byznys. Jsme spotřebitelský produkt, ale možná 30 % až 50 % našich uživatelů jsou v současnosti profesionálové. Většina není. Umělci na platformě nám říkají, že jim to umožňuje být na začátku kreativnější a objevovat a přicházet se spoustou nápadů v krátkém čase.

Právě nyní naši profesionální uživatelé využívají platformu pro vytváření konceptů. Nejtěžší část [komerčního uměleckého projektu] je často na začátku, kdy stakeholder neví, co chce, a musí vidět nějaké nápady, na které reagovat. Midjourney může pomoci lidem konvergovat k myšlence, kterou chtějí, mnohem rychleji, protože opakování těchto konceptů je velmi pracné.

Další výhodou pro umělce je to, že lidem dává důvěru v oblastech, ve kterých si nejsou jisti. Většina umělců, ne-li všichni, má pocit, že je nějaká část umění, kterou nemohou dělat dobře. Mohou to být barvy, kompozice, pozadí. Náš produkt používá slavný návrhář postav a lidé se ho ptají, proč bys používal AI, když už jsi tak dobrý. A on řekl: "No, jsem dobrý jen v té postavě." To mi pomáhá se zbytkem, se světem, pozadím, barevnými schématy.“

Kolik lidí přibližně používá produkt?

Používají to miliony. Náš Discord je přes dva miliony. Je to zatím největší aktivní Discord server.

Umožňuje licence Midjourney komerční využití snímků generovaných platformou?

Ano. Ale pokud pracujete pro společnost větší než milion dolarů s ročním příjmem, žádáme vás, abyste si zakoupili firemní licenci.

Jak byl datový soubor vytvořen?

Je to jen velký škrábanec z internetu. Používáme otevřené datové sady, které jsou publikovány a trénujeme je. A řekl bych, že to dělá 100% lidí. Nebyli jsme vybíraví. Věda se skutečně rychle vyvíjí, pokud jde o to, kolik dat skutečně potřebujete, oproti kvalitě modelu. Bude to trvat pár let, než na věci skutečně přijdete, a v té době už můžete mít modely, které trénujete téměř s ničím. Nikdo vlastně neví, co mohou dělat.

Vyžádali jste si souhlas od žijících umělců nebo děl, která stále podléhají autorským právům?

Ne. Ve skutečnosti neexistuje způsob, jak získat sto milionů obrázků a vědět, odkud pocházejí. Bylo by skvělé, kdyby obrázky měly vložená metadata o vlastníkovi autorských práv nebo tak něco. Ale to není věc; není registr. Neexistuje žádný způsob, jak najít obrázek na internetu a poté jej automaticky vysledovat k vlastníkovi a pak mít jakýkoli způsob, jak jej ověřit.

Mohou se umělci odhlásit ze zařazení do vašeho modelu tréninku dat?

Díváme se na to. Úkolem je nyní zjistit, jaká jsou pravidla a jak zjistit, zda je daná osoba skutečně umělcem konkrétního díla, nebo na něm jen uvést své jméno. Nesetkali jsme se s nikým, kdo by chtěl své jméno vyjmout z datové sady.

Mohou se umělci odhlásit z toho, že budou ve výzvách uvedeni?

Teď ne. Díváme se na to. Opět bychom museli najít způsob, jak tyto požadavky ověřit, což se může zkomplikovat.

Co říkáte komerčním umělcům, kterým to zničí živobytí? Proč by si umělecký ředitel v určitém okamžiku najímal ilustrátora, aby produkoval díla, jako je koncept umění, produkční design, pozadí – takové věci – když mohou pouze zadat výzvy a získat užitečný výstup mnohem rychleji a za mnohem nižší náklady?

Je to ještě hodně práce. Není to jen jako „udělej mi pozadí“. Může to být desetkrát méně práce, ale je to mnohem více práce, než jakou udělá manažer.

Myslím, že to může jít dvěma způsoby. Jedním ze způsobů je pokusit se poskytovat stejnou úroveň obsahu, který lidé konzumují, za nižší cenu, že? A druhým způsobem, jak toho dosáhnout, je vytvořit mnohem lepší obsah za ceny, které jsme již ochotni utratit. Zjistil jsem, že většina lidí, pokud již utrácejí peníze a máte na výběr mezi výrazně lepším obsahem nebo levnějším obsahem, ve skutečnosti volí mnohem lepší obsah. Trh již stanovil cenu, kterou jsou lidé ochotni zaplatit.

Myslím, že někteří lidé se pokusí umělce vystřihnout. Zkusí vyrobit něco podobného za nižší cenu a myslím, že na trhu neuspějí. Myslím, že trh půjde směrem k vyšší kvalitě, kreativitě a mnohem sofistikovanějšímu, rozmanitějšímu a hlubšímu obsahu. A lidé, kteří jsou skutečně schopni používat, jako umělci a používají k tomu nástroje, jsou ti, kteří vyhrají.

Tyto technologie ve skutečnosti vytvářejí mnohem hlubší porozumění a gramotnost ve vizuálním médiu. Možná skutečně budete mít poptávku, předčíte schopnost produkovat na této úrovni a pak možná skutečně zvýšíte platy umělců. Může to být divné, ale to se stane. Tempo nárůstu poptávky po kvalitě i rozmanitosti povede k realizaci úžasných a nečekaných projektů.

Generace studentů vystudovala umělecké školy, mnozí z nich těžce zadlužení, spoléhající na relativně dobře placená místa v zábavní produkci, produkci videoher, komerčním umění a tak dále. Jaký vliv má vznik platforem AI pro převod textu na obrázek na jejich budoucnost?

Myslím, že někteří lidé se pokusí snížit náklady a někteří lidé se pokusí rozšířit své ambice. Myslím, že lidé, kteří rozšiřují své ambice, budou stále platit stejné platy, a lidé, kteří se snaží snížit náklady, podle mě selžou.

Ai se obvykle používá ve velkém pro věci, jako jsou call centra nebo odbavení zavazadel na letištích a pro takové práce, o které lidé ve skutečnosti nestojí. A hodnotová nabídka spočívá v tom, že uvolňuje lidi k tomu, aby dělali přínosnější a zajímavější druhy zaměstnání. Ale umělecká práce je obohacující a zajímavá. Lidé pracují celý život a rozvíjejí své dovednosti, aby získali tento druh zaměstnání. Proč byste nasměrovali tuto technologii na tuto úroveň ekonomiky jako na druh obchodního zaměření a priority pro věci, které děláte?

Osobně nejsem. Moje věci nejsou vyrobeny pro profesionální umělce. Pokud to rádi používají, je to skvělé. Moje věci jsou stvořeny pro lidi, kteří jsou například v Hongkongu jedna žena, která za mnou přišla a říká: „Jedna věc v Hongkongu, kterou z vás vaši rodiče nikdy nechtějí, je umělec, a já“ teď jsem bankéř. Žiju dobrý bankéřský život. Ale s Midjourney nyní začínám skutečně okusovat tuto zkušenost být člověkem, kterým jsem ve skutečnosti chtěl být.“ Nebo chlápek na zastávce náklaďáků, který si pro zábavu vyrábí vlastní baseballové kartičky s divokými obrázky. Je to stvořeno pro tyto lidi, protože jako většina lidí tyto věci nikdy neudělají.

Je důležité zdůraznit, že nejde o umění. Tady jde o představivost. Představivost se někdy používá pro umění, ale často tomu tak není. Většina obrázků vytvořených na Midjourney není používána profesionálně. Nejsou ani sdíleny. Jsou jen používány pro tyto jiné účely, pro tyto lidské potřeby.

Výstupem vašeho produktu jsou však snímky, které mají v profesionálním kontextu kromě všech těchto dalších vlastností i komerční hodnotu. A to tuto ekonomiku velmi narušuje.

Myslím, že je to jako bychom vyráběli loď a někdo s tou lodí může závodit, ale to neznamená, že loď je o závodění. Pokud používáte loď k závodění, pak možná jako, ano, jistě. V tu chvíli je. Ale na lidské stránce opravdu záleží a já si myslím, že nejsme... Chceme, aby obrázky vypadaly pěkně. Nemyslíme si, že se snažíme vytvářet umění jako součást naší věci. Chceme, aby byl svět nápaditější. Raději vyrábíme krásné věci než věci ošklivé.

Domníváte se, že nějaký vládní orgán má jurisdikci nebo pravomoc regulovat tuto technologii? A pokud ano, myslíte, že by měli?

Nevím. Zajímavá je regulace. Musíte vyvážit svobodu něco dělat se svobodou být chráněn. Technologie sama o sobě není problém. Je to jako s vodou. Voda může být nebezpečná, můžete se v ní utopit. Ale je to také zásadní. Nechceme zakazovat vodu jen proto, abychom se vyhnuli nebezpečným částem.

No, chceme mít jistotu, že naše voda je čistá.

Ano, to je pravda.

Zdroj: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- kreativní-ekonomika/