Come funziona DALL-E: il generatore di immagini Open AI

Ecco come funziona DALL-E, il generatore di immagini Open AI. Una guida completa su come usare DALL-E in italiano anche su ChatGPT.

L’evoluzione tecnologica negli ultimi anni sta cambiando notevolmente l’approccio degli utenti alla quotidianità, se fino a pochi anni fa era difficile prevedere l’impatto delle nuove tecnologie, oggi vediamo un crescente interesse e coinvolgimento degli utenti nei confronti dell’IA (Intelligenza Artificiale), magari hai già sentito parlare di ChatGPT o di Imagine With Meta AI, software capaci di sfruttare al meglio le chat scritte per generare contenuti.

Oggi andremo ad analizzare nello specifico DALL-E, un generatore di immagini rivoluzionare basato su un algoritmo di intelligenza artificiale. Vediamo di cosa si tratta e come usarlo al meglio.

Indice

Cos’è e come funziona DALL-E

Come funziona DALL-E

Quando si utilizza il termine DALL-E ci si riferisce all’algoritmo sviluppato dall’azienda OpenAI capace di generare immagini da una descrizione testuale. Possiamo, quindi, considerarlo un vero e proprio generatore di immagini con intelligenza artificiale. Nel corso del tempo DALL-E ha introdotto sempre più funzioni, passando dalla semplice generazione di grafiche della prima versione, alle modifiche in tempo reale dell’ultima.

Ma come funziona? Tecnicamente DALL-E si basa su GPT-3 (Generative Pre-trainded Transformer), cioè una tecnologia capace di riconoscere il testo grazie alla corrispondenza, non neurale, di 175 miliardi di parametri. Il generatore di immagini sviluppato da OpenAI, annunciato nel 2021, integrava 12 miliardi di parametri, mentre la seconda versione ha raggiunto i 175 miliardi.

I modelli di AI si basano principalmente su due fasi: allenamento e azione.

  • Con l’allenamento l’intelligenza artificiale “impara” dai dati che gli vengono forniti con un enorme dataset di immagini e testi.
  • Con l’azione siamo noi utenti a chiedere all’AI di estrapolare dal dataset le informazioni che ci servono.

Come puoi immaginare, tale processo è particolarmente semplificato per le chat di intelligenza artificiale, dato che ci sono solo le fasi di allenamento e azione. Con DALL-E, che rappresenta un generatore di immagini, il processo non è così immediato. Infatti, gli sviluppatori implementano un dataset enorme di testi e immagini, ma molto più avanzato, applicando un modello CLIP enbeddato, cioè a ogni termine corrisponde una determinata immagine e informazione. In questo caso si ha una correlazione tra le due funzioni, allenamento e azione, fornendo dei risultati migliori con oltre 650 milioni di immagini associate.

Cosi si può fare con DALL-E

DALL-E

Valida alternativa a Midjourney, DALL-E 2 ha introdotto invece il vero e proprio modello generativo, cioè quello che crea di fatto le immagini quando avvii una proposta all’intelligenza artificiale. L’algoritmo di DALL-E è diviso in due parti, il modello PIOR, che ha lo scopo di creare un’immagine CLIP, e il modello DECODER che ha l’obiettivo di produrre immagini correlate alle informazioni CLIP.

Attualmente DALL-E può creare immagini da un testo e modificarle, ma in futuro ci saranno sicuramente novità interessanti. Quando utilizzi questo strumento, ti consigliamo di scrivere una descrizione lunga e dettagliata. Come ti abbiamo anticipato, il sistema dispone di tantissime informazioni che vengono correlate alle immagini, migliore sarà la descrizione e più vicino a ciò che stavi immaginando sarà il risultato.

DALL-E 2 può creare immagini e opere d’arte particolarmente realistiche, ma tantissimi artisti stanno criticando fortemente tale caratteristica. OpenAI si sta impegnando, con DALL-E 3, a migliorare la generazione AI tutelando gli artisti e rendendo sempre più complementare al loro lavoro questo algoritmo. Nello specifico DALL-E 3 migliora notevolmente nella capacità di apprendimento, cioè interpreta e comprende molto meglio le istruzioni testuali.

Affinché tu possa usare questo strumento dovresti accedere alla pagina dedicata e sfruttare il sistema di crediti. Puoi testare gratuitamente DALL-E nella versione beta, ed ottenere 50 crediti per la prima iscrizione e 15 crediti gratuiti ogni mese.

Come generare immagini con DALL-E

generatore di immagini ia

Stabilito che DALL-E è un generatore di immagini che può creare da un semplice testo una grafica da zero, è interessante capire come poterlo utilizzare.

Recati sulla pagina ufficiale di DALL-E ed esegui l’accesso con il tuo account OpenAI, va bene anche quello di ChatGPT; altrimenti puoi accedere con un account Google, Microsoft e Apple. Si avvierà una pagina su cui dovrai cliccare Start creating with DALL-E. Se decidessi di registrarti con una nuova e-mail, OpenAI ti invierà un codice tramite SMS per verificare che tu non sia un bot.

Avviata la pagina principale noterai nella parte centrale una stringa vuota dove puoi inserire il testo. Sebbene il software sia stato sviluppato per funzionare al meglio con la lingua inglese, puoi anche avviare una chat in italiano.

Questa è la fase più importante per ottenere la tua immagine AI, infatti, dovrai scrivere una descrizione dettagliata di ciò che desideri. Cerca di essere preciso e una volta completata la descrizione clicca su Generate, a destra. Se disponi di una versione Plus di ChatGPT il software si avvierà automaticamente per la generazione di immagini, mentre se hai già utilizzato in passato i crediti gratuiti, ti toccherà acquistarli cliccando su Buy credits, poco sotto la stringa della chat. Per maggiori info puoi leggere la guida ai crediti di DALL-E.

Come utilizzare DALL-E su ChatGPT

generatore di immagini intelligenza artificiale

L’idea di acquistare i crediti per questo generatore di immagini proprio non è nei tuoi piani? Allora puoi optare per il plug-in su ChatGPT. Infatti, potrai testare DALL-E 2 dalla stessa chatGPT-4, ma come attivarlo?

Affinché tu possa utilizzare tutte le funzionalità, plug-in annessi, dovresti necessariamente avere un piano in abbonamento a ChatGPT Plus, versione a pagamento che ha un costo mensile di 20 dollari. In realtà anche ChatGPT Enterprise ti consente di farlo, ma è una soluzione indicata prettamente alle aziende.

Accedi, quindi, a ChatGPT Plus e clicca sul menu GPT-4, in alto. Spunta la voce Plugins, ma se non è presente premi sui tre puntini posti vicino al tuo nome utente, in basso a sinistra, seleziona Settings e accedi alla sezione Funzionalità, in cui devi attivare Plugins.

Torna alla pagina iniziale e visita il Plugin Store, da qui cerca DALL-E e installalo. Automaticamente potrai poi utilizzarlo nella chat principale di ChatGPT scrivendo prompt creativi e divertenti.

Per saperne di più leggi anche: Come funziona GPT Store, lo store di ChatGPT

Fabrizio Cannatelli

Autore e Founder di Informarea, sono un appassionato di informatica e tecnologia da sempre. La voglia di comunicare e di condividere sul Web le mie curiosità e le mie conoscenze, mi ha spinto a lanciarmi nel progetto di questo sito. Nato un po' per gioco e un po' per passione, oggi è diventato una grande realtà.

Fabrizio Cannatelli