Ha avuto un certo risalto anche da noi la notizia del premio vinto ad una fiera d’arte in Colorado da un imprenditore nel settore dei giochi elettronici, Jason Allen, presentando tre opere create da una intelligenza artificiale e poi trattate con software di elaborazione di immagini (almeno Photoshop e Gigapixel AI). Le tre opere, di cui nella nostra copertina vedete una che non ha vinto, hanno come tema generale l’opera nello spazio. L’opera vincitrice, Théatre d’Opéra Spatial, è notevole, molto bella, e molti appassionati riconosceranno alcuni topoi (per esempio, il paesaggio che si vede dalla finestra sembra appartenere ad un habitat artificiale, tipo Halo o gli Orbitali di Iain Banks). Lo stile poi ricorda Gustave Moreau.
Il fatto ha creato qualche scompiglio, con gli illustratori digitali che paventano il rischio di essere messi fuori mercato da AI che lavorano su basi di immagini colossali (un database molto utilizzato contiene oltre 600 milioni di immagini, tra cui quelle dei suddetti artisti) reperite in rete e che permetterebbero a chiunque sappia scrivere una descrizione testuale di un’immagine (non è scontato) di generare illustrazioni e opere di pittura digitale di ottimo livello. Alternativamente, ma la cosa non esclude l’altra, alcuni degli artisti digitali più famosi, come Greg Rutkowsky, creatore di illustrazioni per videogame della Sony, temono che il proprio stile distintivo finisca per diluirsi talmente da mettere a repentaglio la propria posizione e carriera. Bisogna dire che questo dipende anche dall’effetto-gregge che affligge la creazione digitale per i videogiochi e i siti: una breve analisi degli stili richiesti dagli utilizzatori di Stability. AI, una delle intelligenze artificiali più rinomate nel settore, ha rivelato che, mentre Rutkowsy viene citato 93.000 volte, artisti ben più famosi non superano le 3000. A parte i produttori di falsi e i millantatori, evidentemente molti ritengono che, visto che la Sony ha scelto uno stile, se si presentassero con un portfolio con lo stesso stile sarebbero scelti per il prossimo videogioco su Playstation. Vabbè, auguri.
Un risalto minore hanno avuto le polemichette sul fatto se si possa trattare di un’opera d’arte, visto che l’autore si limita a inserire una descrizione testuale e il resto lo fa la AI. Oltre al fatto che non sempre è vero, la questione è logora e si sarebbe sperato fosse stata superata. La recente sentenza su Maurizio Cattelan, portato in tribunale da uno dei creatori materiali delle sue opere, ha chiarito anche dal punto di vista legale che la proprietà di un’opera è di chi ha l’idea, non di chi la esegue. Tra l’altro, che le opere solo in alcuni casi sono completamente realizzate da un artista è assodato da molto tempo e nessuno risulta si sia mai scandalizzato. Basta pensare alle botteghe rinascimentali, per un caso recente. Per quanto riguarda la critica ancora più becera sugli strumenti informatici che sostituiscono la creatività individuale, sarebbe da ricordare l’utilizzo da sempre di cartoni, esempi, camere oscure (senza di esse come sarebbe stato Canaletto?), fotografie, eccetera. Ci tratteniamo dall’affondare il colpo sugli artisti digitali: quanto della suggestione delle loro opere si deve all’applicazione dei filtri di Photoshop o di modelli 3D standard (ci sono tutti i draghi e i guerrieri che volete…) messi in posa e poi esportati e renderizzati? E tutti gli artisti d’avanguardia evidentemente si sono dimenticati dell’affermazione di Sol LeWitt: “L’idea diventa una macchina che fa l’opera d’arte”, e la sua opera tutta.
Utilizzati 3598 caratteri (spazi inclusi) per dire questo, veniamo al dunque. Il nostro Studio partecipa ai beta test di due delle AI più famose nel settore: Midjourney, autrice materiale dell’opera premiata di cui si diceva, e la già citata Stability. AI, cui si accede attraverso un front end abbastanza user-friendly che si chiama DreamStudio. Anche Midjourney è accessibile tramite un front end, come robot di Discord.com, una piattaforma per applicazioni e discussione. Qui l’interfaccia utente è tutt’altro che amichevole, ma basta avere avuto un minimo di dimestichezza con le command line per non avere problemi. Certo, bisogna leggere le istruzioni, fatevene una ragione.
Dal momento che in Italia non sembra che qualcuno lo abbia già fatto, eccovi alcune nostre esperienze. Diciamo subito che parleremo solo delle immagini più semplici e su cui non abbiamo fatto interventi successivi. Cominciamo con Midjourney. Dal momento che i modelli di queste AI ricorrono quasi tutte a modelli diffusivi (per maggior informazioni vedete ad esempio qui https://ai.googleblog.com/2021/07/high-fidelity-image-generation-using.html) che si addestrano su immagini esistenti, abbiamo proposto all’AI una descrizione prima improbabile e poi anacronistica.
1) Hills landscape with two distant moons. Midjourney di base produce quattro immagini (la variazione dipende dall’applicazione di alcuni parametri arbitrari). Ecco il risultato:
Come si può vedere l’AI solo in un caso ha interpretato abbastanza correttamente la descrizione, o forse due, se nell’immagine in basso a destra quella che sembra una nuvola tondeggiante in realtà è una luna. Esteticamente solo l’ultima immagine è piacevole, a giudizio di chi scrive, ma altri possono avere gusti diversi.
2) Green hilly landascape, two distant moons, Claude Lorraine style. Qui abbiamo aggiunto un’indicazione di mood di colore e in più uno stile che garantisce grande qualità di paesaggio (il Lorenese è uno dei maestri creatori della pittura di paesaggio occidentale, dove la presenza delle figure umane è incidentale) e che è anche in grado di costringere la AI a inserire elementi che è impossibile che ritrovi nelle opere del pittore francese o della sua scuola.
Anche in questo caso solo un’immagine su quattro ha interpretato tutte le indicazioni. Il mood verde del colore è stato esteso anche a parti che normalmente non sono verdi, ma è comunque accettabile e suggestivo (e nulla esclude che la luce del sole di questo pianeta con due lune possa dare al cielo una sfumatura verde, per esempio se fosse più freddo del nostro). Quanto allo “stile Lorraine” più che la Campagna romana e i dintorni di Tivoli, Palestrina e dei Castelli il paesaggio ricorda certe campagne inglesi con le alture a panettone. Per vedere se l’effetto potesse essere migliorato, abbiamo chiesto all’AI tramite un bottone di generare altre quattro immagini a partire da quella in alto a sinistra.
I risultati sono un po’ strani. I due paesaggi in alto mantengono gli elementi principali di quello di base, ma aggiungono troppe lune. Quelli in basso o si perdono una luna oppure deformano le alture. É vero che un paesaggio alieno potrebbe ben essere “alieno”, ma qui l’esercizio si basa sull’inserimento di elementi fisicamente plausibili ma di fantasia in un paesaggio “terrestre”. Abbiamo così deciso di chiedere all’AI di ingrandire l’immagine di partenza.
Il risultato è alquanto sorprendente. L’AI non solo ingrandisce, ma aggiunge particolari e modifiche suggestive. Per esempio, l’altura a torre sulla sinistra sullo sfondo si rivela essere effettivamente la rovina di una torre coperta di vegetazione, con una strada a spirale che sale dalla pianura, molto lorenesco. Anche la grana della pittura è realistica, forse più Scuola di Barbizon che Lorraine. La seconda luna, bassa sull’orizzonte, è seminascosta dalle nuvole, su cui proietta la propria luce che ne viene riflessa. Infine, ci sono le stelle, come se ci trovassimo al crepuscolo. Astronomicamente, le due lune sono piene, per cui il sole è alle spalle di chi guarda, vicino all’orizzonte. E infatti non ci sono ombre nel paesaggio. Questi ultimi punti sono quelli che mi hanno impressionato di più.
Però l’AI non sta applicando un modello fisico, non sa nemmeno che per essere piena una luna deve avere la luce che la illumina a 180 gradi. Non “sa” nulla della realtà, ma solo delle sue rappresentazioni, degli elementi che la compongono e delle loro relazioni. Semplicemente tra i milioni di immagini, fotografie o pitture che ha assimilato, il fatto era ritratto così. Sempre un passo avanti rispetto a certe immagini fantascientifiche in cui un sole al tramonto è accompagnato da una luna piena che sorge dallo stesso punto del cielo.
A mio parere, l’immagine risultante potrebbe tranquillamente essere utilizzata per la copertina di un libro o per un’illustrazione da rivista, così com’è. Lavorandoci un po’, sia direttamente che stimolando l‘AI di nuovo, non sfigurerebbe in una cornice, magari in tinta o dorata, sulle pareti di una casa elegante. Ah, l’aggiunta dei particolari viene facile: molte applicazioni di ingrandimento di immagini governate da AI utilizzano proprio un modello a diffusione.
Passiamo a Stability.ai. Gli esperimenti che abbiamo fatto sono stati di natura diversa. Anche qui si inserisce una descrizione (c’è anche una breve lista di consigli), ma il controllo sui parametri è più semplice, via sliding knobs. Non è detto però, come vedremo, che chiedendo all’AI uno “sforzo” maggiore il risultato sia più soddisfacente.
Qui sotto vediamo come ha risposto l’AI alla richiesta di generare un’immagine sulla base di questa descrizione: A river flowing between high cliffs, a lake in the distance with a high rise city on the shore of the lake, with a lot of plants and flowers, sailboats and barges, Bright sun light, realistic shadows e con uno stile pittorico chiaramente definito.
3) Luminist style
4) Da Vinci style
5) Sargent style
6) Ruskin style
7) Alphonse Mucha style
La qualità delle immagini è buona, anche tenendo conto della bassa risoluzione (512 X 512, anche se l’interfaccia permette di arrivare a 1024 X 1024) e del basso numero di iterazioni (circa 20, su un massimo di 150). Anche il parametro che regola la fedeltà alla descrizione è stato tenuto basso (un valore 7 su un massimo di 20). Nessuna traccia di barche a vela, di chiatte e nemmeno di città con alti palazzi. Lo stile dei Luministi, a parte lo stilema di ritrarre il sole frontalmente (un’innovazione che, a quanto è noto, si deve a Lorraine), si può dire soddisfacente solo con grande generosità. Anche Sargent si sarebbe potuto fare meglio. Assolutamente sorprendente la resa secondo lo stile Mucha, uno dei maggiori illustratori Art Noveau. Il paesaggio è quasi coperto da una cascata di rampicanti e fiori. È vero che Mucha è noto per i suoi manifesti e locandine, quasi tutte basate su scene in primo piano, ma ha realizzato anche grandi cicli pittorici e paesaggistici. Forse con maggiori interazioni e maggiore richiesta di fedeltà l’AI sarebbe persino potuto andare a pescarli. O forse no.
Guardate che succede infatti se si chiede di generare in stile William Turner un’immagine in base a questa descrizione:
8) A train running in the rain sunset smoke clouds
Se si aggiunge un arcobaleno completo nella descrizione,
Oppure solo dei riflessi di luce.
Sono tutte molto Turner. Prima che possiate chiedervelo: sì, avevo in mente il famoso Rains, Steam and Speed – The Great Western Railway della National Gallery. Le immagini dell’AI combinano gli elementi del treno con quelli di alcune opere atmosferiche di Turner. Però, anche queste immagini sono state ottenute con i parametri che abbiamo descritto sopra. Guardiamo allora cosa succede se invece alziamo gli stessi parametri: risoluzione 1024 X 768, grado di fedeltà 15, iterazioni 100. Dovrebbe uscirne una cosa superturneriana…
Ha un suo perché ma, a parte il fatto che quello è un autobus o al massimo un tram, certamente NON è Turner. Ricorda molto certi notturni in acrilico degli anni ’70-80, almeno a me.
Questo non significa che le AI, e nella fattispecie Stability.ai, non funzionino. Funzionano, solo che il risultato non è perfettamente predicibile a priori. Anzi, a volte non è predicibile proprio. E quel che vi abbiamo fatto vedere è nulla. Abbiamo provato a generare l’immagine di un’automobile a sei ruote e il risultato è stato un’auto a quattro ruote con sopra il tetto un’altra auto di cui si vedono solo le ruote davanti. Ehi, AI, non puoi dire seriamente!
Comments