Si parla di generatori di immagini AI da più di un anno, più o meno dalla prima versione di Dall-E, e se sei stato sui social media, hai guardato la TV o letto una rivista, è quasi impossibile che tu non abbia visto delle immagini generate dall’IA più o meno inconsapevolmente. Sono ovunque, ed è facile capire il motivo: gli strumenti necessari per crearli sono quasi gratuiti e disponibili in tutto il mondo. In queesti mesi abbiamo provati i più famosi, quindi se anche tu desideri iniziare a smanettarci o aggiungere alcune funzionalità alimentate dall’IA ai tuoi flussi di lavoro, puoi farti un’idea di dove partire da questo articolo:
I migliori generatori di immagini AI
- DALL·E 2: per un generatore di immagini AI facile da usare
- Midjourney: per i migliori risultati delle immagini AI
- Firefly (Photoshop): per l’integrazione delle immagini generate dall’IA nelle foto
Prima di iniziare: Come funzionano i generatori di immagini AI?
Tutti questi generatori di immagini AI prendono un prompt di testo e cercano di trasformarlo nel miglior modo possibile in un’immagine corrispondente. Ciò apre alcune possibilità sorprendenti, poiché il tuo prompt può essere qualsiasi cosa, dal “un dipinto a olio impressionista di un uomo canadese che cavalca un alce attraverso una foresta di alberi di acero” a “un dipinto in stile Vermeer di un grande levriero irlandese soffice che gusta una pinta di birra in un pub tradizionale” o “una fotografia di un asino sulla Luna”.
I limiti reali sono solo la tua immaginazione, la capacità del generatore di immagini AI di comprendere il tuo prompt e qualsiasi filtro dei contenuti messo in atto per evitare che attori malintenzionati inondino Internet con contenuti generati dall’IA violenti o non adatti al lavoro.
La maggior parte dei generatori di immagini AI funziona in modo abbastanza simile. Miliardi di coppie immagine-testo vengono utilizzate per addestrare una rete neurale (in sostanza, un algoritmo informatico molto sofisticato modellato liberamente sul cervello umano) su ciò che sono le cose. Consentendo al modello di elaborare innumerevoli immagini, impara cos’è un cane, il colore rosso, i Vermeer e tutto il resto. Il passo successivo è renderizzare l’immagine generata dall’IA. Le ultime generazioni di generatori di immagini AI lo fanno attraverso un processo chiamato diffusion. In sostanza, partono da un campo casuale di rumore e lo modificano in una serie di passaggi per farlo corrispondere alla loro interpretazione del prompt. È un po’ come guardare un cielo nuvoloso, trovare una nuvola che assomiglia vagamente a un cane e poi essere in grado di schioccare le dita per renderla sempre più simile a un cane.
Prompt “vibrant digital art portrait of a Japanese woman painting his dreams as explosions in a night sky”
Il miglior generatore di immagini AI per facilità d’uso: DALL·E 2
DALL·E 2, la nostra scelta per i migliori strumenti di marketing digitale per un generatore di immagini AI facile da usare.
pro: Incredibilmente facile da usare; relativamente conveniente, costa solo $0,13 per prompt DALL·E 2.
contro: Abbastanza basico; produce in generale i risultati meno fotorealistici; non offre più una prova gratuita.
DALL·E 2 è indiscutibilmente il generatore di immagini AI più famosi e con buone ragioni. È stato il primo generatore di immagini alimentato da IA abbastanza buono da creare immagini incredibilmente interessanti ed era ampiamente disponibile a sufficienza per le persone da diventare virale. E sebbene il primo non significhi necessariamente il migliore, DALL·E 2 ha molto a suo favore.
La carta vincente di DALL·E 2 è la semplicità di utilizzo. Scrivi ciò che vuoi vedere, clicca su Genera e in pochi secondi avrai quattro varianti generate dall’IA tra cui scegliere. Purtroppo, DALL·E 2 non è più gratuito da provare, ma a $15 per 115 crediti – che corrisponde a circa $0,13 per prompt o $0,0325 per variante di immagine – vale ancora la pena provarlo.
Anche se molto semplice da usare, DALL·E 2 ha alcune funzionalità potenti. L’editor di immagini (che è anche in versione beta) ti permette di aggiungere frame generati aggiuntivi, in modo da poter espandere un’immagine, che tu l’abbia generata con DALL·E 2 o l’abbia caricata. Questa tecnica, chiamata out-painting, significa che puoi creare opere d’arte AI più grandi. C’è anche un cancellino, quindi puoi rimuovere parti di un’immagine e sostituirle con elementi generati dall’IA (questa tecnica si chiama in-painting).
Come Prompt una frase dei Placebo da “This Picture”: “I hold an image of the ashtray girl Of cigarette burns on my chest I wrote a poem that described her world”
Il generatore di immagini AI con i migliori risultati: Midjourney
Midjourney, la nostra scelta per il generatore di immagini AI con i migliori risultati
pro: Produce le immagini generate dall’IA migliori come creatività di intepretazione del soggetto e possibilità tecniche; inoltre la comunità è un ottimo modo per ottenere ispirazione Midjourney.
contro: Può essere utilizzato solo tramite Discord, il che è un po’ scomodo; le immagini generate sono pubbliche per impostazione predefinita.
Le immagini che crea Midjourney sembrano più coerenti, con migliori texture e colori – e nel complesso, i risultati sono semplicemente più interessanti e visivamente accattivanti. In particolare, le persone e gli oggetti del mondo reale sembrano più vivi e naturali rispetto agli altri generatori di immagini AI, e l’ultima versione può anche riuscire a rendere bene le mani, punto dolente delle prime versioni. È significativo che sia stato il primo generatore di immagini AI a vincere un concorso d’arte.
La versione beta è accessibile solo tramite Discord. Una volta che ti unisci al server Discord di Midjourney o inviti il bot di Midjourney a uno che controlli, puoi inserire un prompt digitando /imagine [quello che vuoi vedere]. Il bot genererà quindi quattro varianti del tuo prompt, che puoi scaricare, ingrandire, rieditare e altro ancora.
Per impostazione predefinita, ogni immagine che generi viene pubblicata pubblicamente sul server Discord di Midjourney. Questo conferisce a tutto un aspetto comunitario interessante, ma significa che chiunque desideri può vedere cosa stai creando. Anche se non è necessariamente un problema per gli artisti, potrebbe essere un fattore decisivo se stai cercando di utilizzare Midjourney per scopi commerciali.
Inoltre la documentazione di Midjourney è davvero buona e ti guiderà attraverso i primi passi così come tutte le sue funzionalità avanzate, come le diverse versioni del modello, l’ingrandimento delle immagini, la miscelazione di più immagini e l’uso di diversi parametri per controllare le cose. Una volta comprese le diverse opzioni, i risultati che puoi ottenere sono davvero sorprendenti.
Le prove gratuite di Midjourney sono attualmente sospese a causa del grande numero di persone che cercano di usarlo, ma occasionalmente vengono ripristinate per alcuni giorni. Se perdi una finestra di prova gratuita, il piano di base parte da $10 al mese e include 3,3 ore di tempo di GPU al mese, o circa 200 immagini. Hai anche la possibilità di acquistare ulteriore tempo di GPU e puoi utilizzare le tue immagini per scopi commerciali.
Background generato in Photoshop Beta senza nessun editing aggiuntivo
Miglior generatore di immagini AI per l’integrazione di immagini generate dall’IA nelle foto: Adobe Photoshop (Firefly)
Adobe Firefly, è la nostra scelta per il miglior generatore di immagini AI per l’integrazione di immagini generate dall’IA nelle foto. Sebbene Adobe abbia inserito strumenti AI nelle sue app da più di 15 anni, è stato solo quest’anno che l’azienda ha rilasciato un generatore di testo per immagini, almeno in versione beta. Puoi provarlo gratuitamente sul web o tramite Adobe Express, ma è al suo massimo nell’ultima beta di Photoshop, alla quale devi essere abbonato a Creative Cloud per accedere.
Il modello AI di Adobe, chiamato Firefly, ha alcuni trucchi nella manica. Oltre a essere in grado di generare nuove immagini da una dettagliata descrizione testuale, può creare effetti di testo da un prompt scritto (pensa alla parola “TOAST” scritta con lettere che sembrano fatte di toast), ricolorare illustrazioni vettoriali o aggiungere elementi generati dall’IA alle tue immagini. Puoi provare tutto questo tramite l’app web, ma è con quest’ultima funzionalità che Firefly si distingue.
Questa particolare funzionalità si chiama Generative Fill. L’idea è che tu utilizzi gli strumenti regolari di Photoshop per selezionare un’area della tua immagine e quindi, semplicemente cliccando su un pulsante e digitando un prompt, puoi sostituirla con qualcos’altro. Generative Fill comprende il contesto della tua immagine. Nella schermata sopra, puoi vedere che Photoshop ha abbinato lo sfocato della profondità di campo e i colori per il castello che ho aggiunto utilizzando Generative Fill. Ha un aspetto coeso.
Per quanto riguarda il generatore di testo per immagini, i risultati di Firefly possono essere abbastanza altalenanti. Può corrispondere o superare DALL·E 2 o Stable Diffusion per alcuni prompt, ma per altri, mi chiedo cosa stesse cercando di fare. D’altra parte, la sua integrazione con Photoshop, il programma standard del settore per la modifica di immagini, è di un livello superiore.