Il MIT ha risolto un’equazione differenziale secolare per rompere il collo di bottiglia computazionale dell’IA “liquida”.

L’anno scorso, il MIT ha sviluppato un algoritmo AI/ML in grado di apprendere e adattarsi a nuove informazioni durante il lavoro, non solo durante la sua fase di formazione iniziale. Queste reti neurali “liquide”. (nel Bruce Lee senso) giocano letteralmente a scacchi 4D — i loro modelli richiedono dati di serie temporali per funzionare, il che li rende ideali per l’uso in attività urgenti come il monitoraggio di pacemaker, previsioni meteorologiche, previsioni di investimento o navigazione autonoma di veicoli. Ma il problema è che il throughput dei dati è diventato un collo di bottiglia e il ridimensionamento di questi sistemi è diventato proibitivo dal punto di vista computazionale.

Martedì, i ricercatori del MIT hanno annunciato di aver escogitato una soluzione a tale restrizione, non ampliando la pipeline di dati, ma risolvendo un’equazione differenziale che ha lasciato perplessi i matematici dal 1907. In particolare, il team ha risolto “l’equazione differenziale dietro l’interazione di due neuroni attraverso le sinapsi… per sbloccare un nuovo tipo di algoritmi di intelligenza artificiale veloci ed efficienti.”

“I nuovi modelli di machine learning che chiamiamo ‘CfC’s’ [closed-form Continuous-time] sostituire l’equazione differenziale che definisce il calcolo del neurone con un’approssimazione in forma chiusa, preservando le meravigliose proprietà delle reti liquide senza la necessità di integrazione numerica”, ha dichiarato la professoressa del MIT e direttrice del CSAIL Daniela Rus in una dichiarazione alla stampa di martedì. “I modelli CfC sono causali, compatti, spiegabili ed efficienti da addestrare e prevedere. Aprono la strada a un apprendimento automatico affidabile per applicazioni critiche per la sicurezza”.

Quindi, per quelli di noi senza un dottorato in Really Hard Math, le equazioni differenziali sono formule che possono descrivere lo stato di un sistema in vari punti discreti o passaggi durante il processo. Ad esempio, se si dispone di un braccio robotico che si sposta dal punto A al punto B, è possibile utilizzare un’equazione differenziale per sapere dove si trova tra i due punti nello spazio in qualsiasi fase del processo. Tuttavia, anche la risoluzione di queste equazioni per ogni passaggio diventa rapidamente costosa dal punto di vista computazionale. La soluzione “in forma chiusa” del MIT risolve questo problema modellando funzionalmente l’intera descrizione di un sistema in un unico passaggio computazionale. COME spiega il team del MIT:

Immagina di avere una rete neurale end-to-end che riceve input di guida da una telecamera montata su un’auto. La rete è addestrata a generare output, come l’angolo di sterzata dell’auto. Nel 2020, il team ha risolto questo problema utilizzando reti neurali liquide con 19 nodi, quindi 19 neuroni più un piccolo modulo di percezione potrebbero guidare un’auto. Un’equazione differenziale descrive ogni nodo di quel sistema. Con la soluzione in forma chiusa, se lo sostituisci all’interno di questa rete, ti darebbe il comportamento esatto, poiché è una buona approssimazione della dinamica effettiva del sistema. Possono quindi risolvere il problema con un numero ancora inferiore di neuroni, il che significa che sarebbe più veloce e meno costoso dal punto di vista computazionale.

Risolvendo questa equazione a livello di neurone, il team spera di poter costruire modelli del cervello umano che misurino milioni di connessioni neurali, cosa impossibile oggi. Il team osserva inoltre che questo modello CfC potrebbe essere in grado di prendere l’addestramento visivo appreso in un ambiente e applicarlo a una situazione completamente nuova senza lavoro aggiuntivo, ciò che è noto come generalizzazione fuori distribuzione. Non è qualcosa che i modelli di ultima generazione possono davvero fare e si rivelerebbe un passo significativo verso i sistemi IA generalizzati di domani.

Tutti i prodotti consigliati da Engadget sono selezionati dalla nostra redazione, indipendente dalla nostra casa madre. Alcune delle nostre storie includono link di affiliazione. Se acquisti qualcosa tramite uno di questi link, potremmo guadagnare una commissione di affiliazione. Tutti i prezzi sono corretti al momento della pubblicazione.

Leave a Comment