NVIDIA annoncerede en række nye hardware-, computerplatforme og simuleringsmotorer, der har til formål at fremskynde udviklingen af generativ AI og robotteknologi ved sit GTC-arrangement.
I går fremviste NVIDIAs grundlægger og CEO Jensen Huang de nyeste produkter, som virksomheden vil levere til udviklere af morgendagens AI-løsninger.
Huang sagde: "Accelereret databehandling har nået et vendepunkt. General-purpose computing er løbet tør for damp. Vi har brug for en anden måde at lave computere på, så vi kan fortsætte med at skalere, så vi kan fortsætte med at sænke omkostningerne til computere, så vi kan fortsætte med at bruge flere og flere computere og samtidig være bæredygtige."
For at levere den massive opgradering, som verdens AI-infrastruktur har brug for, afslørede Huang følgende nye hardware- og softwareløsninger:
- Blackwell GPU og computerplatform
- NVIDIA DGX SuperPOD supercomputer
- NIM-mikrotjenester - en ny måde at skabe AI-software på
- Omniverse - en simulator til træning af robotter i den virkelige verden
- Isaac Perceptor-software og projekt GR00T - en generel grundmodel for humanoide robotter og robotsoftware
Her er et nærmere kig på disse spændende nye udgivelser.
Blackwell
Huang sagde, at industrien har brug for meget større GPU'er for at muliggøre multimodal træning af stadig større AI-modeller. NVIDIA hævder, at deres nye Blackwell-chip er "den største chip, der er fysisk mulig" og indeholder 104 milliarder transistorer.
Hvis man kobler to af dem sammen til en GPU, giver det et betydeligt løft i processoren. Blackwell leverer 2,5 gange NVIDIA's Hopper arkitekturens ydeevne i FP8 til træning, pr. chip, og 5x med FP4 til inferens.
NVLink-forbindelsen, der forbinder disse GPU'er, er dobbelt så hurtig som sin forgænger og gør det muligt at forbinde 576 Blackwell-GPU'er med hinanden.
Ved at forbinde to Blackwell GPU'er og en Grace CPU får man Grace Blackwell Superchip, som danner grundlag for NVIDIA's GB200 NVL2-racks. Disse leverer exaflop-beregninger i et enkelt rack.
NVIDIA har forbundet et par af disse for at skabe sin nye AI-supercomputer kaldet NVIDIA DGX SuperPOD, som leverer 11,5 exaflops AI-supercomputing med FP4-præcision.
I pressemeddelelsen nævnes AWS, Google Cloud, Microsoft Azure og Oracle som de første i køen til den nye computerhardware, som ifølge NVIDIA kan "bygge og køre generativ AI i realtid på store sprogmodeller med billioner af parametre med op til 25 gange lavere omkostninger og energiforbrug end sin forgænger."
Sådan ser NVIDIA's computerfremskridt ud i løbet af de sidste 8 år.
NVIDIA NIM'er
"Hvordan bygger vi software i fremtiden? Det er usandsynligt, at du vil skrive det fra bunden eller skrive en hel masse Python-kode eller noget i den stil," sagde Huang. "Det er meget sandsynligt, at man samler et team af AI'er."
Huang sagde, at i stedet for at skrive software vil virksomheder "samle AI-modeller, give dem missioner, give eksempler på arbejdsprodukter, gennemgå planer og mellemliggende resultater."
NVIDIA har lanceret en samling af præbyggede containere eller mikrotjenester, som de kalder NIM (NVIDIA Inference Microservice).
NIM'er er som små kasser med AI-software med en forudtrænet model, API'er og andre softwarekomponenter indeni. Virksomheder vil kunne implementere disse på samme måde, som vi bruger GPT'er eller Zapier, i stedet for at skulle genskabe funktionaliteten fra bunden.
Omniversum
Embodied AI, eller fysisk AI, er det område, hvor der sker en masse udvikling lige nu. Det er dyrt og ineffektivt at træne robotter i den fysiske verden, og NVIDIA siger, at de har løsningen på det.
Omniverse er en simuleringsmotor til en virtuel verden, der fungerer som en virtuel "gymnastiksal", hvor en robot kan lære at bevæge sig og forstå fysikken i at interagere med den virkelige verden.
NVIDIA giver API-adgang til udviklere, så de kan træne deres robotter i Omniverse. Udviklere kan skabe en digital tvilling af et fysisk rum, f.eks. et lager, og optimere automatiseret udstyr og robotter, før de sættes ind i det fysiske rum.
Isaac-software og projekt GR00T
Huang annoncerede ny software til støtte for robotudviklere. Isaac Perceptor-softwaren og Isaac Manipulator-biblioteket vil hjælpe robotter med at se, navigere og manipulere deres omgivelser.
NVIDIA afslørede også Project GR00T (General Robotics 003), en generel grundmodel for humanoide robotter. Denne model vil sammen med Isaac Perceptor-softwaren køre på en ny computer, Jetson Thor, for at hjælpe med at træne robotter i Omniverse og derefter indsætte dem zero shot i den virkelige verden.
Den første dag på GTC bød på nogle store teknologiske nyheder, som sandsynligvis vil få NVIDIA's aktiekurs til at fortsætte med at stige. Det bliver interessant at se, hvilke andre overraskelser Huang har til os i løbet af de næste par dage.
Du kan se Huangs keynote her.