Storia dell’AI Generativa
Un viaggio attraverso le pietre miliari dell’Intelligenza Artificiale Generativa
Test di Turing
Alan Turing pubblica “Computing Machinery and Intelligence”
Il test di Turing propone un metodo per valutare se una macchina possa essere considerata intelligente. L’idea è che se un valutatore umano non riesce a distinguere le risposte della macchina da quelle di un essere umano, la macchina può essere considerata “intelligente”.
Conferenza di Dartmouth
Nascita ufficiale del campo dell’Intelligenza Artificiale
La conferenza riunì i più brillanti ricercatori dell’epoca per un workshop estivo di due mesi. Fu qui che il termine “Intelligenza Artificiale” venne coniato e il campo venne formalmente stabilito come disciplina accademica.
Perceptron
Frank Rosenblatt sviluppa il primo perceptron
Il perceptron è stato il primo algoritmo di apprendimento automatico per il riconoscimento di pattern. Rappresentava un modello matematico di come i neuroni biologici elaborano le informazioni.
ELIZA
Primo chatbot della storia
ELIZA è stato il primo programma in grado di simulare una conversazione con un essere umano. Simulava uno psicoterapeuta rogersiano, riflettendo le frasi dell’utente sotto forma di domande.
Prime Reti Neurali
Sviluppo delle prime reti neurali artificiali
Le prime implementazioni di reti neurali artificiali multi-strato vengono sviluppate, anche se con capacità limitate a causa delle restrizioni computazionali dell’epoca.
MYCIN
Primo sistema esperto per diagnosi mediche
MYCIN era un sistema esperto che utilizzava regole di inferenza per la diagnosi di infezioni del sangue e la raccomandazione di antibiotici.
Reti Neurali Ricorrenti (RNN)
Introduzione delle reti neurali con memoria
Le RNN introducono il concetto di memoria nelle reti neurali, permettendo di processare sequenze di dati mantenendo informazioni sul contesto temporale.
Backpropagation
Algoritmo di apprendimento per reti neurali
La backpropagation viene formalizzata come metodo efficiente per addestrare reti neurali multi-strato, permettendo l’apprendimento di rappresentazioni complesse.
Reti Neurali Convoluzionali (CNN)
Yann LeCun sviluppa LeNet
Le CNN vengono applicate con successo al riconoscimento di caratteri scritti a mano, introducendo i concetti di convoluzione e pooling.
GAN
Introduzione delle Reti Generative Avversarie
Le GAN introducono un nuovo paradigma nell’apprendimento generativo, dove due reti neurali competono tra loro per migliorare la qualità dei risultati.
ResNet
Microsoft Research introduce ResNet
ResNet ha introdotto le connessioni residue, permettendo l’addestramento di reti neurali molto più profonde e superando il problema del vanishing gradient.
Transformer
Google introduce l’architettura Transformer
L’architettura Transformer ha rivoluzionato l’elaborazione del linguaggio naturale introducendo il meccanismo dell’attention e eliminando la necessità di ricorrenza.
GPT-2
OpenAI rilascia GPT-2
GPT-2 rappresenta un significativo avanzamento nei modelli linguistici, con 1.5 miliardi di parametri. Il suo rilascio è stato graduale per preoccupazioni etiche.
ChatGPT 3.5
OpenAI rilascia ChatGPT
ChatGPT ha dimostrato capacità sorprendenti nella conversazione naturale e nella comprensione del contesto, diventando il primo modello linguistico ad uso pubblico di massa.
Stable Diffusion e DALL-E 2
L’era della generazione di immagini da testo
Stable Diffusion e DALL-E 2 rappresentano una svolta nella generazione di immagini da descrizioni testuali. Stable Diffusion viene rilasciato come open source, mentre DALL-E 2 introduce innovazioni nella coerenza e nel realismo.
Midjourney
Lancio di Midjourney
Midjourney si distingue per il suo approccio artistico alla generazione di immagini, offrendo uno stile unico e risultati particolarmente adatti all’arte digitale.
DALL-E 3
Evoluzione nella generazione di immagini
DALL-E 3 rappresenta un significativo miglioramento nella qualità e precisione della generazione di immagini, con una migliore comprensione delle richieste testuali e maggiore coerenza visiva.
GPT-4
OpenAI rilascia GPT-4
GPT-4 rappresenta un significativo avanzamento rispetto ai modelli precedenti, con migliori capacità di ragionamento e comprensione multimodale.
Sora
OpenAI introduce Sora, un modello text-to-video avanzato
Sora rappresenta un significativo avanzamento nella generazione di video da descrizioni testuali, capace di creare video realistici di alta qualità fino a 60 secondi.