Gli strumenti di arte IA : scoprili e trova quello che fa per te - Una panoramica ragionata (1)

Uno degli scogli maggiori per i neofiti è orientarsi tra i tanti strumenti a disposizione nella creazione di immagini con intelligenza artificiale generativa basati su modelli a diffusione. Il panorama è così vario che non è affatto una operazione semplice; per riuscirci ho diviso in due parti l'operazione:

1) nella prima parte (link in basso) analizzo quali sono in genere le caratteristiche di questi strumenti
2) in base a queste caratteristiche nella seconda parte (questo video)analizzo gli strumenti più diffusi in modo da consentirne la valutazione e la scelta di quello che puà essere più utile.

Tra gli strumenti analizzati: quelli appartenenti alla suite Adobe, DALL-E, MidJourney, Dreamstudio, Stable Diffusion con le interfacce A1111, VLAD SDnext, Comfy.ui
prima parte: https://youtu.be/-UtTxX5qgVg seconda parte: https://youtu.be/S2EBqKruAzw

Altri video:
Immagini dall''intelligenza artificiale - Midjourney, Stablediffusion e altre diavolerie; le basi. https://youtu.be/10hF9Vr_n3c?si=TPYaG...
Immagini dall'intelligenza aartificiale - La creazione di un nuovo mondo - Stablediffusion, GAN https://youtu.be/n5KnZ7aASIQ?si=_Fwzj...
Immagini dall'intelligenza artificiale - Il prompt, cosa significa e come funziona https://youtu.be/xxXCKOD8zGM?si=fjGHy...
Immagini dall'intelligenza artificiale - stable diffusion img2img https://youtu.be/e0UjPMxRglY?si=CUu_E...
Immagini dall'intelligenza artificiale - sistemi dall-e, midjourney, stablediffusion, automatic 1111 https://youtu.be/HsfP3MrNq40?si=jH6dK...
Immagini dall'intelligenza artificiale - Parametri di configurazione stablediffusion https://youtu.be/fcbRqg2_OE4?si=bRGmF...
Immagini dall'intelligenza artificiale - inserire proprie foto: gradients, hypernetworks, embeddings https://youtu.be/J8eDMYN_LcU?si=dOZZZ...

Chiedendo a chatGPT di riassumere il video:

Il video in questione ha lo scopo di fornire una panoramica completa delle possibilità di generare immagini con l'intelligenza artificiale generativa. L'autore del video specifica che l'orientamento verso i vari software disponibili può risultare complicato, quindi l'obiettivo è guidare e aiutare a comprendere le principali applicazioni software e le loro funzionalità.

Nell'argomento, si è soffermato sul modello di diffusione basato sul database di immagini Lion, che è partito dal lavoro diScuchmann. Il modello di diffusione può generare immagini a partire da un testo di input, attraverso un processo descritto come "diffusion model".

Tra le varie possibilità offerte dal modello, si possono generare immagini virtuali a partire da fotografie esistenti - sia attraverso estensioni scaricate da terzi (ad esempio, per generare vestiti in stile vittoriano su un modello), sia attraverso estensioni personalizzate basate su fotografie personali (ad esempio, per generare scatti virtuali di una modella).

È inoltre possibile controllare e modificare le modalità di formazione dell'immagine, per farla aderire il più possibile alle proprie esigenze. Si possono modificare, ad esempio, la posa del modello, le linee principali dell'immagine o la profondità dell'immagine.

Nel prossimo video, l'autore presenterà una tabella con le caratteristiche dei principali sistemi di generazione di immagini, per aiutare l'utente a fare una scelta informata sul software da utilizzare. Le caratteristiche prese in considerazione includono la possibilità di selezionare un modello di base, regolare le dimensioni delle immagini, addestrare il modello con immagini personali, gestire le estensioni, controllare vari aspetti dell'immagine e assicurarsi che l'immagine generata rispetti il copyright e le norme sulla decenza.