Google: l'AI di Imagen 2 crea anche le GIF

Imagen 2 è la seconda generazione della piattaforma basata sulla AI di Google che permette di produrre immagini a partire da una semplice descrizione testuale. Questa nuova versione è stata presentata nel corso dell'evento Cloud Next 2024 di Las Vegas e rispetto alla sua declinazione precedente ha la capacità di creare anche delle GIF.

Imagen 2 è disponibile per gli utenti di Vertex AI, la piattaforma di machine learning che permette di addestrare e distribuire modelli e applicazioni AI tramite il Cloud di Big G. Tra le novità più interessanti di questo rilascio vi è sicuramente il supporto per l'inpainting e l'outpainting che sono già disponibili da qualche tempo su alcuni servizi dei competitor.

Grazie all'inpainting e all'outpainting si possono effettuare alcune procedure di editing avanzate come per esempio l'espansione dei bordi di un'immagine, la rimozione di porzioni indesiderate e l'iserimento di elementi addizionali. Imagen 2 permette inoltre di effettuare facilmente delle sovrapposizioni, come il posizionamento di un logo su un altro contenuto.

Il modello di Mountain View, o meglio la famiglia di modelli, non è più soltanto uno strumento text-to-image ma anche un supporto per text-to-live. L'utilizzatore può infatti formulare un prompt testuale e ricevere in output una breve animazione, per il momento quest'ultimo non potrà durare più di 4 secondi ma siamo solo all'inizio di un nuova evoluzione.

Sempre per quanto riguarda il text-to-live, i contenuti che si possono ottenere sono ancora a bassa risoluzione e non vanno oltre al formato 360 x 640 px. Sono invece più rilevanti i passi avanti fatti nel contrasto ai Deepfake grazie all'introduzione di un watermak non visibile che viene crittografato tramite il SynthID di DeepMind, controllata dalla stessa Google.