NVIDIA presenterade en rad nya hårdvaru-, datorplattformar och simuleringsmotorer som syftar till att påskynda utvecklingen av generativ AI och robotik vid sitt GTC-event.
Igår presenterade NVIDIA:s grundare och VD Jensen Huang de senaste produkterna som företaget kommer att erbjuda utvecklare av morgondagens AI-lösningar.
Huang sade: "Accelerated computing har nått en brytpunkt. Den generella databehandlingen har tappat ångan. Vi behöver ett annat sätt att göra databehandling på så att vi kan fortsätta att skala, så att vi kan fortsätta att sänka kostnaden för databehandling, så att vi kan fortsätta att konsumera mer och mer databehandling samtidigt som vi är hållbara."
För att leverera den massiva uppgradering som världens AI-infrastruktur behöver presenterade Huang följande nya hård- och mjukvarulösningar:
- Blackwell GPU och dataplattform
- Superdatorn NVIDIA DGX SuperPOD
- NIM microservices - ett nytt sätt att skapa AI-mjukvara
- Omniverse - en simulator för utbildning av robotar i den verkliga världen
- Programvaran Isaac Perceptor och Project GR00T - en generell grundmodell för humanoida robotar och programvara för robotik
Här följer en närmare titt på dessa spännande nyheter.
Blackwell
Huang sa att för att möjliggöra multimodal träning av allt större AI-modeller behöver branschen mycket större GPU: er. NVIDIA hävdar att deras nya Blackwell-chip är "det största chipet som är fysiskt möjligt" och innehåller 104 miljarder transistorer.
Genom att ansluta två av dem till en GPU får man en betydande ökning av bearbetningen. Blackwell levererar 2,5x NVIDIA:s Hopper arkitekturprestanda i FP8 för träning, per chip, och 5x med FP4 för inferens.
NVLink-interconnect som kopplar samman dessa GPU:er är dubbelt så snabb som sin föregångare och gör att 576 Blackwell GPU:er kan kopplas samman.
Genom att ansluta två Blackwell GPU:er och en Grace CPU får man Grace Blackwell Superchip som utgör grunden för NVIDIA:s GB200 NVL2-rack. Dessa levererar exaflop-beräkningar i ett enda rack.
NVIDIA kopplade ihop några av dessa för att skapa sin nya AI-superdator kallad NVIDIA DGX SuperPOD som levererar 11,5 exaflops AI-superdatorer med FP4-precision.
I pressmeddelandet listas AWS, Google Cloud, Microsoft Azure och Oracle som de första i kö för den nya hårdvaran som enligt NVIDIA kan "bygga och köra generativ AI i realtid på stora språkmodeller med biljoner parametrar till upp till 25 gånger lägre kostnad och energiförbrukning än föregångaren".
Så här ser NVIDIA:s framsteg inom databehandling ut under de senaste 8 åren.
NVIDIA NIMs
"Hur ska vi bygga programvara i framtiden? Det är osannolikt att du kommer att skriva den från grunden eller skriva en hel massa Python-kod eller något liknande", sa Huang. "Det är mycket troligt att du sätter ihop ett team av AI."
Huang sa att istället för att skriva programvara kommer företagen att "sätta ihop AI-modeller, ge dem uppdrag, ge exempel på arbetsprodukter, granska planer och mellanliggande resultat".
NVIDIA har lanserat en samling förbyggda containrar, eller mikrotjänster, som de kallar NIM (NVIDIA Inference Microservice).
NIMs är som små lådor med AI-programvara med en förtränad modell, API:er och andra programvarukomponenter inuti. Företag kommer att kunna distribuera dessa på liknande sätt som vi använder GPT:er eller Zapier, istället för att behöva återskapa funktionaliteten från grunden.
Omniverse
Embodied AI, eller fysisk AI, är ett område där mycket av utvecklingen sker just nu. Att träna robotar i den fysiska världen är dyrt och ineffektivt och NVIDIA säger sig ha lösningen på det.
Omniverse är en simuleringsmotor för virtuella världar som fungerar som ett virtuellt "gym" där en robot kan lära sig artikulation och fysiken i interaktionen med den verkliga världen.
NVIDIA ger utvecklare tillgång till API:er för att träna sina robotar i Omniverse. Utvecklare kan skapa en digital tvilling av ett fysiskt utrymme, t.ex. ett lager, och optimera automatiserad utrustning och robotar innan de används i det fysiska utrymmet.
Isaac programvara och projekt GR00T
Huang tillkännagav ny programvara för att stödja robotutvecklare. Programvaran Isaac Perceptor och biblioteket Isaac Manipulator hjälper robotar att se, navigera och manipulera sin omgivning.
NVIDIA presenterade också Project GR00T (General Robotics 003), en generell grundmodell för humanoida robotar. Denna modell, tillsammans med programvaran Isaac Perceptor, kommer att köras på en ny dator, Jetson Thor, för att hjälpa till att träna robotar i Omniverse och sedan sätta ut dem i den verkliga världen.
Den första dagen av GTC såg några stora nya tekniska tillkännagivanden som sannolikt kommer att se NVIDIAs aktiekurs fortsätta att klättra. Det ska bli intressant att se vilka andra överraskningar Huang har för oss under de närmaste dagarna.
Du kan se Huangs keynote här.