Sintografia

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Un'immagine sintografica generata con Stable Diffusion e la tecnica dell'outpainting

La sintografia[1] è il metodo per generare sinteticamente immagini digitali utilizzando l'apprendimento automatico. Questo è distinto da altri metodi di creazione e modifica grafica in quanto la sintografia utilizza modelli di intelligenza artificiale text-to-Image per generare media sintetici. È comunemente ottenuto mediante descrizioni testuali di "prompt engineering" come input per creare o modificare un'immagine desiderata.[2]

I modelli Text-to-Image, gli algoritmi e i software sono strumenti utilizzati nella sintografia progettati per avere competenze tecniche nella creazione dell'output mediante input umano. La sintesi utilizza generalmente modelli Text-to-Image per sintetizzare nuove immagini come un derivato dei set di dati di addestramento su cui sono stati addestrati. Un'altra tecnica consiste nel addestrare un modello su uno specifico set di dati di immagini per insegnargli un concetto specifico.

Etimologia[modifica | modifica wikitesto]

Dalla sintesi latina "raccolta, composizione", dalla sintesi greca "composizione, un mettere insieme".[3]
"-grafia" è l'elemento che forma la parola che significa "processo di scrittura o registrazione" o "una scrittura, registrazione o descrizione" (nell'uso moderno specialmente nella formazione di nomi di scienze descrittive). Dal francese o dal tedesco -graphie, dal greco -graphia "descrizione di", usato in sostantivi astratti da graphein prima "disegnare, rappresentare con linee tracciate", originariamente "raschiare, grattare" (su tavolette di argilla con uno stilo).[4] Il termine è ancora agli inizi, poiché varie persone usano terminologie diverse per la stessa tecnica.

Storia[modifica | modifica wikitesto]

L'evento noto per aver avviato l'ampio utilizzo dei modelli da testo a immagine è la pubblicazione di DALL-E da parte di OpenAI nel gennaio 2021.[5] Sebbene non sia stato rilasciato al pubblico, CLIP (Contrastive Language-Image Pre-training) è stato pubblicato in open source, il che ha portato a una successione di implementazioni con altri generatori come Generative adversarial networks e Diffusion models.[6][7] Il prossimo grande evento, che ha portato a un aumento della popolarità di tale tecnica, è stato il rilascio di DALL-E 2 nell'aprile 2022. Dopo averlo rilasciato lentamente come beta privata, è diventato pubblico nel luglio 2022. Nell'agosto 2022, Stable Diffusion è stato reso open source da Stability AI,[8] che ha promosso un movimento guidato dalla comunità.

Metodologia[modifica | modifica wikitesto]

Poiché la sintografia si riferisce al metodo di generazione dell'arte visiva AI, questi sono i mezzi o le categorie utilizzate nel metodo.

Medium di sintografia
input Output testo Immagine Modello 3D video
testo chatbot da testo a immagine da testo a 3D da testo a video
Immagine da immagine a testo da immagine a immagine da immagine a 3D da immagine a video
video da video a video
Legenda
sfondo bianco Non esiste ancora
sfondo verde chiaro Attualmente esiste nel mondo accademico o beta
sfondo verde Esiste commercialmente o ampiamente disponibile

Differenza tra sintografia e Ai Art (Arte Visuale iA)[modifica | modifica wikitesto]

Relazione tra Intelligenza Artificiale (Artificial Intelligence Art) e modelli generativi (Sintografia), diagramma di Venn

La sintografia è il metodo utilizzato per creare media sintetici utilizzando modelli generativi. L'Ai-Art (che comprende la musica, la cucina e il design dei livelli dei videogiochi) è il risultato creato utilizzando l'intelligenza artificiale, una categoria troppo ampia e sempre più vasta.

Quando Elke Reinhuber ha coniato il termine sintografia nel suo articolo "Synthography - An Invitation to Reconsider the Rapidly Changing Toolkit of Digital Image Creation", ha parlato di una "crisi di legittimazione" come origine della necessità di tale termine. Prima che venissero utilizzati i modelli generativi, gli "algoritmi artistici" di intelligenza artificiale esistevano già in mezzi come software di editing grafico (ad esempio: riempimento sensibile al contesto, applicazione di stili artistici esistenti, miglioramento/aumento della risoluzione), che impiegano un'ampia gamma di strumenti di intelligenza artificiale, e le fotocamere DSLR e smartphone (ad esempio: riconoscimento degli oggetti, messa a fuoco in-camera, algoritmi di apprendimento automatico in condizioni di scarsa illuminazione), che continuano a subire un rapido e costante sviluppo.

I modelli generativi come le GAN (reti generative avversarie) e i modelli di diffusione sono un sottoinsieme delle reti neurali, a loro volta un sottoinsieme delle tecniche di apprendimento automatico, che compongono un sottoinsieme dei metodi che impiegano intelligenza artificiale. La relazione tra tutti questi modelli è rappresentata nel diagramma di Venn qui riportato. La sintografia utilizza specificamente modelli generativi, come quelli diffusi da software quali DALL-E, Midjourney e Stable Diffusion.

Note[modifica | modifica wikitesto]

  1. ^ Elke Reinhuber, Synthography–An Invitation to Reconsider the Rapidly Changing Toolkit of Digital Image Creation as a New Genre Beyond Photography, su scholar.google.com, Springer, Cham, 2 dicembre 2021. URL consultato il 20 dicembre 2022.
  2. ^ Thomas Smith, What is Synthography? An Interview With Mark Milstein - Synthetic Engineers, su syntheticengineers.com, Synthetic Engineers, 26 ottobre 2022. URL consultato il 20 dicembre 2022.
  3. ^ synthesis, su etymonline.com, Online Etymology Dictionary. URL consultato il 27 dicembre 2022.
  4. ^ -graphy, su etymonline.com, Online Etymology Dictionary. URL consultato il 27 dicembre 2022.
  5. ^ Ted Underwood, Mapping the latent spaces of culture, su tedunderwood.com, tedunderwood.com, 21 ottobre 2021. URL consultato il 6 febbraio 2023.
  6. ^ Alexa Steinbrück, VQGAN+CLIP - How does it work?, su alexasteinbruck.medium.com, medium.com, 3 agosto 2021. URL consultato il 6 febbraio 2023.
  7. ^ Ethan Smith, A Traveler’s Guide to the Latent Space, su notion.com. URL consultato il 6 febbraio 2023.
  8. ^ Kevin Roose, A Coming-Out Party for Generative A.I., Silicon Valley’s New Craze, su nytimes.com, 21 ottobre 2022. URL consultato il 6 febbraio 2023.
  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica