Medialní reprezentace, jejichž estetická forma klade důraz na logiku opacitní hypermediace, oproti logice transparentní bezprostřednosti, se často zaměřují na privilegium estetického v kontrastu k „pouze“ neestetickému, funkčnímu nebo pragmatickému vnímání. Tyto principy se objevují v širokém spektru konvenčně odlišných mediálních forem, včetně (digitálních i nedigitálních) literárních textů, komiksů, animace, fotografie, filmů, seriálů a her. Ve zbytku této kapitoly se zaměříme na specifický druh postdigitální estetiky, jaký nabízí generátory obrazů založené na difúzi AI, jako jsou DALL·E, Midjourney nebo Stable Diffusion. Tyto nástroje mohou být navedeny k vytváření AI-generovaných obrazů nejen s více či méně specifickým reprezentativním obsahem, který bývá často označován jako „téma“ těchto obrazů, ale také s více či méně specifickou estetickou formou, často popisovanou termínem „styl“.
Meyer přitom přesvědčivě argumentuje, že „logika promptu“ radikálně rozšiřuje a de-hierarchizuje pojetí stylu, neboť v kontextu generátorů obrazů, jako jsou DALL·E, Midjourney nebo Stable Diffusion, termín „styl“ může odkazovat nejen na klasický historický pojem epochálního stylu nebo individuálního stylu kanonizovaného umělce, ale také na estetické kvality některých produktů populární kultury nebo vizuální vzhled spojený s konkrétními žánry a mediálními formáty. V produkční logice AI modelu jsou tyto pojmy vlastně ničím jiným než typickými vizuálními vzory.
Pokud se zaměříme na rozlišení mezi reprezentativním obsahem a estetickou formou, neměli bychom je nutně zcela ztotožnit s rozdílem mezi „subjektem“ a „stylem“ AI-generovaného obrazu, neboť oba termíny „téma“ a „styl“ jsou argumentativně více specifické a tím pádem snadno přehnané než termíny „reprezentativní obsah“ a „estetická forma“. V každém případě lze AI-generované obrazy chápat jako výsledek procesů remediation, což označuje přenos estetických charakteristik z jedné mediální formy do druhé. Bolter například popisuje tvorbu AI-generovaných obrazů v DALL·E 2 jako „algoritmickou remixaci nebo remediation“. Wildeova užitečná diferenciace mezi „realismem orientovaným na bezprostřednost spojený s fotografií“ a „realismem orientovaným na hypermediaci nebo stylistickým realismem“ činí produktivní užití Bolterovy a Grusinovy teorie „dvojí logiky remediation“.
Vzhledem k tomu, že téma AI-generovaných obrazů je stále rychle se vyvíjejícím, a proto je obtížné učinit obecná tvrzení, která by byla jak konkrétní, tak i relevantní v dlouhodobém horizontu, i přesto platí obecný princip, že „prompty fungují jako vyhledávací dotazy, které nasměrují model do konkrétní oblasti latentního prostoru možných obrazů“. To znamená, že AI-generované obrazy lze chápat jako „obrazy o obrazech, filtrovány jazykem“, což také znamená, že „každý AI-generovaný obraz je infografikou o základním datasetu“, neboť obrazy odrážejí vrstvy kulturního a sociálního kódování obsažené v datech použitých k jejich vytvoření.
AI-generované obrazy tak mohou odhalovat nejen kulturní, ale i historické vrstvy, v nichž se odrážejí mediální představivosti, které jsou kulturně podmíněné a ukazují nám, jak jsou specifické estetické formy reprezentovány v našem kulturním imagináři. Tento proces není omezen pouze na jedno médium nebo žánr, ale zasahuje do širšího kontextu popkultury a mainstreamové estetiky, přičemž se stále více soustředí na postdigitální estetiku, která spojuje jak digitální, tak nedigitální formy vyjadřování.
DALL·E a podobné generátory obrazů nám poskytují nástroj pro zkoumání toho, jakým způsobem jsou určité estetické formy generovány a jak jsou vnímány na základě kulturního a mediálního kontextu. Mimo to je důležité vzít v úvahu i výzvy spojené s tvorbou obrazů, které mohou mít dalekosáhlý dopad na to, jak vnímáme hranice mezi autentickým uměním a masovou produkcí, mezi lidským a strojovým tvořením, mezi skutečným a fiktivním světem.
Zároveň nelze přehlédnout, že prompty nejsou jen nástrojem k vyvolání konkrétního obrazu, ale i nástrojem, který odhaluje širší spektrum možností a interpretací. Jak v kontextu AI-generovaných obrazů, tak i v širším kulturním rámci se tyto obrazy stávají nejen reprezentacemi toho, co bylo uměle vytvořeno, ale i artefakty, které neustále reflektují a přetvářejí naše kolektivní vnímání světa a technologií.
Jaký je vztah mezi kreativním procesem a technickými protokoly v umění generovaném umělou inteligencí?
Model práce Le Bruna pro generování umění lze shrnout jako fázi trénování, v níž se pocity přetvářejí do jazykových konceptů, pro něž se vyvíjejí vizuální ekvivalenty (na základě řízeného trénování a induktivních předsudků), následovanou fází inferencí, kdy model dokáže generovat nové umění na základě funkcí, které během trénování extrahoval (viz Alpaydin 2016; Kelleher 2019). Příkladem, jak francouzská umělecká akademie použila tento model po jeho trénování, byla každoroční umělecká cena Prix Caylus (založená v roce 1759), která testovala schopnost studentů zobrazit konkrétní emoce. Pravidla soutěže stanovovala, že studenti měli kreslit nebo modelovat z živého modelu (osoby před nimi), která vyjadřovala určitou emoci – například v roce 1759 „údiv“ smíchaný s „radostí“ nebo v roce 1760 „utrpení“. Jak vysvětluje Montagu, téma mělo být převzato z „mytologie nebo historie, jako například Dido, která umírá na pohřebním hranici, nebo Venuše truchlící nad Adonisem“, takže student by měl pochopit motivaci pro výraz a relevantní pasáž by měla být čtena účastníkům“ (Montagu 1994, 95). Tímto způsobem pracovaly dva druhy textových podnětů: emocionální podnět (explicitní úkol soutěže) a historicko/mytologický text jako jakýsi zabudovaný doplňkový podnět, který studentům pomáhal navigovat jejich kreativní možnosti. Pro studenty soutěže silná textová guidance působila jako algoritmický filtr, skrze který měl být živý model před jejich očima studován a zobrazen.
Umělecké praktiky na akademii se tím pádem výrazně přibližují tomu, co Wendy Chun popsala jako „programované vize“, kde „počítače vždy generují text a obrázky, místo aby pouze reprezentovaly nebo reprodukovaly to, co již existuje jinde“ (Chun 2013, 17; původní důraz). Tato analogie s historickým přístupem poskytuje zásadní vhled do estetických základů umění generovaného umělou inteligencí, jak se praktikuje na populárních platformách jako OpenAI, Stable Diffusion nebo Midjourney.
Hlavní otázka, která se zde nabízí, je vztah mezi kreativním prozkoumáváním a následováním pevných protokolů. V PAIA (populárním umění generovaném AI) se kreativní prozkoumávání objevuje v jiném smyslu než v profesním nebo festivalovém AI umění. Jakmile je model obrázku vyškolen a plně vyvinut – ať už v akademii Le Brunem, nebo v PAIA prostřednictvím společností jako OpenAI nebo Stability AI – a protokoly korelací textu a obrázku jsou nastaveny, stává se hlavním cílem praktikujících ovládnutí těchto protokolů, zatímco málo pozornosti je věnováno prozkoumávání samotné fáze trénování, která k těmto protokolům vedla. Kdežto profesionální a festivaloví AI umělci, na obecné úrovni, se zaměřují na umělecké a kritické prozkoumávání trénovací fáze AI generátorů obrázků (například prozkoumáváním databází, budováním trénovacích sad, doladěním modelů, zkoumáním společenských nebo environmentálních důsledků AI atd.), PAIA umělci využívají hotové modely. V PAIA je tedy kreativní prozkoumávání soustředěno na fázi inferencí a zaměřuje se na dodržování technických protokolů prostřednictvím inženýrství podnětů.
Z historického hlediska se jedná o paradox, protože, jak uvádí Montagu, velký důraz na to, aby vizuální umění vyprávělo příběhy, začal už v rané renesanci jako pokus posunout malbu z kategorie manuální práce do kategorie svobodných umění. Malíři přibližovali své práce k narativní poezii, protože [p]oezie byla akceptována jako svobodné umění, a proto, pokud by bylo prokázáno, že i malba se zabývá vyprávěním příběhů, plnila stejné funkce – učit, těšit a hýbat, pak by malba měla stejný nárok jako poezie na tento cenný status“ (Montagu 1994, 61). To dokládá důležitost schopnosti konceptualizovat obsah díla na úkor jeho vykonávání. Stejná logika funguje i v případě populárního AI umění, jak ukazuje například tvrzení Stability AI, že s jejich Stable Artisan botem „můžete proměnit své myšlenky v úchvatné obrazy“ (Stability AI 2024, n.pag); výzva OpenAI, aby „oživili svou představivost“ (OpenAI 2024, n.pag); nebo vyzvání Canva, aby „jednoduše zadali podnět, vybrali styl a sledovali, jak se jejich slova proměňují v krásné umění“ (Canva 2025, n.pag.). Tento přístup dává uživatelům prostor pro kreativitu, ale deleguje náročnou práci vykonávání na generátor obrazů AI.
Avšak paradoxně v PAIA (a v akademii) probíhá kreativní práce konceptualizace v trénovací fázi (například když velké technologické společnosti nebo Le Brun kurátorovali trénovací data a indukovali předsudky), zatímco použití finálního modelu je otázkou vykonávání již zavedených protokolů. V tomto smyslu jsou praktiky umělců PAIA – kteří bojují s inženýrstvím podnětů a využívají přednastavené filtry v AI modelech pro vytvoření „správného“ obrazu, ale nezabývají se vývojem modelu – srovnatelné s boji studentů v akademii, kteří byli školeni k tomu, aby odpovídali specifickým stavům mysli v historických nebo biblických postavách, které malovali, s konkrétním vizuálním výstupem, ale jejich kreativní představivost byla přísně omezena na specifické žánry a motivy, které určoval Le Brunův obrazový model.
V procesu vykonávání estetických protokolů mají umělecké nástroje a studia zásadní význam. Aby studenti akademie skutečně používali modely a vykonávali obrazové programy, prošli školením, které je umožnilo koordinovat mysl, oči, ruce, štětce a další, zatímco většina populárních umělců AI se učí ovládat AI modely prostřednictvím grafických uživatelských rozhraní. Místo toho, aby pracovali s API (rozhraní pro programování aplikací) a vytvořili vlastní studio na úrovni kódu (což otevřený kód Stability Diffusion skutečně umožňuje), populární AI umělci se přihlašují k platformám jako ChatGPT, Bing, DreamUp nebo podobným, které nabízejí grafická uživatelská rozhraní určená pro laiky. Avšak jak přesvědčivě analyzovala Chun (2013, kapitola 2), snadné používání těchto rozhraní a schopnost uživatelů ovládat přednavržené možnosti interaktivity (například zadávání textových podnětů a získávání obrazového výstupu) znamenají, že nejde jen o to, že uživatelé pracují s rozhraním, ale také o to, že samotná rozhraní vytvářejí své uživatele. Takže zatímco nové generátory obrázků AI umožňují lidem být kreativní pouze prostřednictvím přirozeného jazyka (viz například OpenAI 2025), může jít nejen o to, že umělci PAIA vytvářejí nové umění pomocí generátorů obrázků AI, ale také o to, že společnosti stojící za těmito generátory obrázků generují nové uživatele a předplatitele, jejichž data mohou být extrahována, využíváním „umění“.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский