Kappløpet om kraftigere og mer effektiv AI-maskinvare skjøt fart denne uken, da Intel og Google kunngjorde nye brikker som skal hjelpe dem å bli mindre avhengige av NVIDIA-teknologi.
Det virker som om det lanseres nye AI-modeller hver uke. Bak hver utgivelse ligger flere uker med trening på datasentre i skyen, hvorav de fleste er drevet av NVIDIA GPU-er.
Både Intel og Google kunngjorde nye interne AI-brikker som kan trene opp og distribuere store AI-modeller raskere, samtidig som de bruker mindre strøm.
Intels Gaudi 3 AI-akseleratorbrikke
Intel er sannsynligvis bedre kjent for brikkene som driver PC-en din, men på tirsdag ble selskapet kunngjort sin nye AI-brikke kalt Gaudi 3.
NVIDIAs H100 GPU-er har utgjort hoveddelen av AI-datasentre, men Intel sier at Gaudi 3 leverer "50% i gjennomsnitt bedre inferens og 40% i gjennomsnitt bedre strømeffektivitet enn Nvidia H100 - til en brøkdel av prisen."
En stor bidragsyter til energieffektiviteten til Gaudi 3 er at Intel brukte Taiwan Semiconductor Manufacturing Co's 5nm-prosess for å lage brikkene.
Intel ga ingen prisinformasjon, men på spørsmål om hvordan den kan sammenlignes med NVIDIAs produkter, sa Das Kamhout, VP for Xeon-programvare hos Intel: "Vi forventer at den vil være svært konkurransedyktig."
Dell Technologies, Hewlett Packard Enterprise, Lenovo og Supermicro blir de første til å ta i bruk Gaudi 3 i sine AI-datasentre.
Intels administrerende direktør Pat Gelsinger oppsummerte selskapets AI-ambisjoner slik: "Intel bringer AI overalt i hele virksomheten, fra PC-en til datasenteret til edge."
Den #IntelGaudi 3 #AI akseleratoren er et svært konkurransedyktig alternativ til NVIDIAs H100 med høyere ytelse, økt skalerbarhet og PyTorch-integrasjon. Utforsk flere viktige produktfordeler. https://t.co/sXdQKjYFw0 pic.twitter.com/iJSndBQkvT
- Intel AI (@IntelAI) 9. april 2024
Googles Arm- og TPU-oppgraderinger
Tirsdag kunngjorde Google sin første tilpassede Arm-baserte prosessorer som de planlegger å bruke til å drive datasentrene sine. Den nye brikken, kalt Axion, er en direkte konkurrent til Intel og AMDs CPU-er.
Google hevder at Axion leverer "30% bedre ytelse enn de raskeste Arm-baserte instansene som er tilgjengelige i skyen i dag, opptil 50% bedre ytelse og opptil 60% bedre energieffektivitet enn sammenlignbare x86-baserte instanser av dagens generasjon".
Google har flyttet flere av sine tjenester, som YouTube og Google Earth, til sin nåværende generasjon Arm-baserte servere, som snart vil bli oppgradert med Axion-brikker.
Med et kraftig Arm-basert alternativ blir det enklere for kundene å migrere CPU-basert AI-trening, inferencing og andre applikasjoner til Googles skyplattform uten å måtte redesigne dem på nytt.
For storskala modelltrening har Google i stor grad stolt på sine TPU-brikker som et alternativ til NVIDIAs maskinvare. Disse vil også bli oppgradert med én ny TPU v5p, som nå inneholder mer enn dobbelt så mange brikker som den nåværende TPU v4-poden.
TPU v5p, vår kraftigste og mest skalerbare TPU, er nå tilgjengelig for alle! #GoogleCloudNext pic.twitter.com/mmfWlzHeqs
- Google Cloud Tech (@GoogleCloudTech) 9. april 2024
Google er ikke ute etter å selge verken sine nye Arm-brikker eller TPU-er. Selskapet ønsker å drive sine cloud computing-tjenester i stedet for å bli en direkte maskinvarekonkurrent til NVIDIA.
De oppgraderte TPUene vil gi et løft til Googles AI Hyperdatamaskin som muliggjør AI-modelltrening i stor skala. AI Hypercomputer bruker også NVIDIA H100 GPU-er som Google sier snart vil bli erstattet med NVIDIAs nye Blackwell GPUer.
Etterspørselen etter AI-brikker kommer sannsynligvis ikke til å avta med det første, og det ser ikke ut som om NVIDIA er en ener i dette kappløpet.