In occasione del suo evento GTC, NVIDIA ha annunciato una serie di nuovi hardware, piattaforme di calcolo e motori di simulazione volti ad accelerare lo sviluppo dell'IA generativa e della robotica.
Ieri, il fondatore e CEO di NVIDIA Jensen Huang ha presentato gli ultimi prodotti che l'azienda fornirà agli sviluppatori delle soluzioni AI di domani.
Huang ha dichiarato: "Il calcolo accelerato ha raggiunto il punto di svolta. L'elaborazione generica ha esaurito le sue potenzialità. Abbiamo bisogno di un altro modo di fare informatica per continuare a scalare, per continuare a ridurre il costo dell'informatica, per continuare a consumare sempre più informatica in modo sostenibile".
Per garantire l'aggiornamento massiccio di cui ha bisogno l'infrastruttura mondiale dell'intelligenza artificiale, Huang ha presentato le seguenti nuove soluzioni hardware e software:
- La piattaforma di GPU e di calcolo Blackwell
- Supercomputer NVIDIA DGX SuperPOD
- Microservizi NIM: un nuovo modo di creare software AI
- Omniverse - un simulatore del mondo reale per l'addestramento dei robot
- Il software Isaac Perceptor e il Progetto GR00T - un modello di base per robot umanoidi e software di robotica di uso generale
Ecco un'occhiata più da vicino a queste nuove ed entusiasmanti uscite.
Blackwell
Huang ha dichiarato che per consentire l'addestramento multimodale di modelli di IA sempre più grandi, il settore ha bisogno di GPU molto più grandi. NVIDIA sostiene che il suo nuovo chip Blackwell è "il più grande chip fisicamente possibile" e contiene 104 miliardi di transistor.
Collegandone due a una GPU si ottiene un notevole incremento dell'elaborazione. Blackwell offre 2,5 volte le prestazioni di NVIDIA Tramoggia prestazioni dell'architettura in FP8 per l'addestramento, per chip, e 5x con FP4 per l'inferenza.
L'interconnessione NVLink che collega queste GPU è due volte più veloce del suo predecessore e permette di interconnettere 576 GPU Blackwell.
Collegando due GPU Blackwell e una CPU Grace si ottiene il Superchip Grace Blackwell che costituisce la base dei rack GB200 NVL2 di NVIDIA. Questi offrono un'elaborazione exaflop in un singolo rack.
NVIDIA ha collegato alcuni di questi per creare il suo nuovo supercomputer AI chiamato NVIDIA DGX SuperPOD, che offre 11,5 exaflop di supercomputing AI con precisione FP4.
Il comunicato stampa elenca AWS, Google Cloud, Microsoft Azure e Oracle come i primi a poter utilizzare il nuovo hardware di calcolo che, secondo NVIDIA, è in grado di "costruire ed eseguire IA generativa in tempo reale su modelli linguistici di grandi dimensioni da un trilione di parametri a costi e consumi fino a 25 volte inferiori rispetto al suo predecessore".
Ecco come si presenta il progresso del computing di NVIDIA negli ultimi 8 anni.
NIM NVIDIA
"Come costruiremo il software in futuro? È improbabile che lo si scriva da zero o che si scriva un mucchio di codice Python o qualcosa del genere", ha detto Huang. "È molto probabile che si metta insieme un team di IA".
Huang ha detto che invece di scrivere software, le aziende "assembleranno modelli di IA, daranno loro missioni, forniranno esempi di prodotti di lavoro, rivedranno i piani e i risultati intermedi".
NVIDIA ha lanciato una raccolta di contenitori, o microservizi, pre-costruiti che chiama NIM (NVIDIA Inference Microservice).
Le NIM sono come piccole scatole di software AI con all'interno un modello preaddestrato, API e altri componenti software. Le aziende potranno distribuirle in modo simile a come si usano i GPT o Zapier, invece di dover ricreare la funzionalità da zero.
Omniverso
L'IA incarnata, o IA fisica, è il settore in cui si sta sviluppando molto. L'addestramento dei robot nel mondo fisico è costoso e inefficiente e NVIDIA afferma di avere la soluzione per questo problema.
Omniverse è un motore di simulazione del mondo virtuale che agisce come una "palestra" virtuale per un robot che impara l'articolazione e la fisica dell'interazione con il mondo reale.
NVIDIA offre agli sviluppatori l'accesso alle API per addestrare i propri robot in Omniverse. Gli sviluppatori possono creare un gemello digitale di uno spazio fisico, come un magazzino, e ottimizzare le attrezzature automatizzate e i robot prima di distribuirli nello spazio fisico.
Software Isaac e Progetto GR00T
Huang ha annunciato un nuovo software a supporto degli sviluppatori di robotica. Il software Isaac Perceptor e la libreria Isaac Manipulator aiuteranno i robot a vedere, navigare e manipolare i loro ambienti.
NVIDIA ha anche presentato Project GR00T (General Robotics 003), un modello di base di uso generale per robot umanoidi. Questo modello, insieme al software Isaac Perceptor, verrà eseguito su un nuovo computer, Jetson Thor, per aiutare ad addestrare i robot nell'Omniverse e quindi a distribuirli a colpo sicuro nel mondo reale.
Il primo giorno del GTC ha visto alcuni importanti annunci tecnologici che probabilmente vedranno il prezzo delle azioni di NVIDIA continuare a salire. Sarà interessante vedere quali altre sorprese ci riserverà Huang nei prossimi giorni.
Potete guardare il keynote di Huang qui.