Pohled na nové Al Generative Art

Al generativní umění je druh umění, ve většině případů vizuálního, které je založeno na spolupráci mezi člověkem a autonomním systémem. „Autonomní systém“ je definován jako Umělá inteligence software, algoritmus nebo model schopný provádět složité operace bez nutnosti zásahu programátora.

Z bizarních juxtapozic obrazů vytvořených Dall-E Mini k NFT Na trhu se obrazy generované algoritmy AI stále více dostávají do mainstreamové představivosti. Ve skutečnosti dva důležité projekty na toto téma, které si zaslouží být analyzovány, jsou: Střední cesta a DALL-E2.

Novinka se samozřejmě dostala i na Twitter. Komentuje to mimo jiné Charles Hoskinson, který napsal:

Al Generative Art: rané experimenty a funkce

Po pochopení toho, co je generativní umění, je důležité zdůraznit jeden z jeho základních principů: náhodnost. Což je základní vlastnost generativního umění.

Ve skutečnosti, v závislosti na typu softwaru, je autonomní systém schopen zpracovat výsledky, které jsou pokaždé jiné a jedinečné při každém provedení příkazu generování, nebo může vrátit proměnný počet výsledků v reakci na vstup uživatele.

První experimenty v generativním umění se datují do 1960. let XNUMX. století s experimenty o Harold Cohen a jeho AARON program. Cohen nejprve použil samostatný software ke generování abstraktních uměleckých děl inspirovaných pop-artovými sítotisky. Cohenova díla jsou nyní vystavena v Tate Gallery v Londýně.

Dalším atributem generativního umění, který je však stále méně výsadou, je opakování vzorů nebo abstraktních prvků poskytnutých programátorem a implementovaných v softwarovém kódu.

Navíc vývoj stále složitějších neuronových sítí fungujících na asociaci textu a obrazu umožnil vývoj generativních modelů schopných vytvářet stále realističtější a přesnější obrázky. Nejznámějším příkladem této kategorie generativního umění je Deska.

Dall-E je multimodální neuronová síť založená na GPT-3 model hlubokého učení z OpenAI, stejná společnost, která se nedávno rozvinula ChatGPT, chatbot spuštěný v listopadu 2022 a optimalizovaný pomocí "pod dohledem" a posilovací techniky učení.

Vrátíme-li se k Dall-E, vidíme, že tento systém je schopen generovat obrázky z textového popisu, tzv. "výzva," na základě datové sady párů text-obrázek.

První verze Dall-E, která byla veřejnosti představena v lednu 2021 a zůstala výsadou malého počtu profesionálů v oboru, představovala skutečnou revoluci z hlediska tohoto typu generativního modelu, předčila inovace GPT- 3 sám.

Důležitá je také skutečnost, že přesnost výsledků zpracovaných Dall-E se ukázala jako perfektní prostor pro další řešení OpenAI: CLIP (Předškolení s kontrastním jazykem a obrazem).

Neuronová síť pro klasifikaci a hodnocení obrázků trénovaná na základě asociací textu a obrázku, jako jsou titulky nalezené na internetu. Díky zásahu CLIP, který snižuje počet výsledků navržených uživateli na výzvu na 32, bylo zjištěno, že Dall-E ve většině případů vrací uspokojivé obrázky.

Midjourney: design, lidská infrastruktura a umělá inteligence

Jak se očekávalo, Střední cesta je důležitým projektem, který je součástí vznikajícího konceptu Al Generative Art. Konkrétně Midjourney je nezávislá výzkumná laboratoř, která zkoumá nové způsoby myšlení a rozšiřuje imaginativní schopnosti lidského druhu.

Použití je jednoduché: nejprve je třeba vytvořit účet na Svár, platforma, která hostí různé komunity, přičemž Midjourney je jednou z nich. V rámci aplikace jsou různé chatovací místnosti, ve kterých se lze aktivně nebo neúčastnit diskuzí.

Je důležité zdůraznit, že pro první pokus o použití umělé inteligence musíte jít do "nováčci" kanály, kde 25 bezplatných renderů jsou k dispozici.

Jeden render odpovídá generování čtyř různých variant generovaných ze stejného textového vstupu.

25 vykreslení tedy odkazuje na 25 úloh zpracování prováděných robotem Midjourney. V důsledku toho generování obrázku vyžaduje interakci s robotem Midjourney prostřednictvím textové zprávy zvané „výzva“, ve které budou klíčová slova popisující obrázek, který má uživatel na mysli.

Můžete přidat tolik podrobností, kolik chcete, důležité je oddělit klíčová slova čárkou. Po dokončení vykreslování počítač vrátí čtyři různé obrázky na základě popisů, ze kterých si můžete vybrat.

Navíc, jakmile program dokončí vykreslování, můžete sdělit své preference na základě obrázků, a pokud si přejete, nechat si znovu vygenerovat další čtyři verze.

DALL-E 2: nový systém umělé inteligence pro umělecká díla

Kromě Midjourney je DALL-E 2 také novým systémem umělé inteligence, který dokáže vytvářet realistické obrázky a umělecká díla z popisu přirozeného jazyka. A nejen to, DALL-E 2 může také kombinovat koncepty, atributy a styly.

Síla nového systému umělé inteligence spočívá také v možnosti rozšiřovat obrázky nad rámec toho, co je na původním plátně a vytvářet nové rozsáhlé kompozice. Kromě toho může provádět realistické změny existujících obrázků z titulků v přirozeném jazyce a může přidávat a odstraňovat prvky s přihlédnutím ke stínům, odrazům a texturám.

Mezi schopnosti DALL-E 2 patří také pořízení snímku a vytvoření několika jeho variací inspirovaných originálem. DALL-E 2 se naučil vztah mezi obrázky a textem používaným k jejich popisu.

Využívá proces tzv "difúze," který začíná vzorem náhodných teček a postupně tento vzor mění směrem k obrázku, když rozpozná specifické aspekty tohoto obrázku.

Poté, co OpenAI představila DALL-E v lednu 2021, nyní nejnovější systém, DALL-E 2, generuje realističtější a přesnější obrázky se čtyřnásobným rozlišením.

DALL-E 2 začal jako výzkumný projekt a nyní je k dispozici jako a beta verze. Mezi bezpečnostní zmírnění, která systém vyvinul a neustále vylepšuje, patří: omezení schopnosti systému generovat násilné, nenávistné obrázky nebo obrázky pro dospělé a postupné zavádění založené na učení.

Zdroj: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/