Het laboratorium van IBM Research in Almaden, Californië, heeft het prototype van de NorthPole-chip aangekondigd, waarmee AI aan de rand sneller dan verwacht werkelijkheid zou kunnen worden.
Het uitvoeren van AI-modellen vereist veel verwerking en veel energie. De bijna wekelijkse aankondigingen van snellere, krachtigere apparaten lijken onverbiddelijk, maar er nadert een harde grens. IBM's Noordpool kunnen ingenieurs helpen om de grenzen van de huidige technologieën te verleggen.
De Wet van Moore stelt dat het aantal transistors in geïntegreerde schakelingen elk jaar verdubbelt, met bijbehorende prestatieverbeteringen. Lange tijd gold deze wet, maar de toename in dichtheid is de laatste tijd vertraagd.
De wetten van de thermodynamica stellen een harde limiet aan het aantal transistors dat je in een vierkante nanometer kunt stoppen, maar het is de typische lay-out van chips die voorlopig de prestaties belemmert.
De "von Neumann bottleneck" is de grootste boosdoener als het gaat om het vertragen en inefficiënter maken van chips. Von Neumann architectuur verwijst naar de typische layout van computerchips met geheugen aan de ene kant, verwerking aan de andere kant en een databus die de twee verbindt.
De NorthPole chip bestaat uit 256 rekeneenheden, of kernen, die elk hun eigen geheugen bevatten. Door deze combinatie van rekenkracht en geheugen op hetzelfde stukje chip is er geen geheugen buiten de chip nodig.
Omdat gegevens niet van het geheugen naar de processor en weer terug naar het geheugen hoeven te worden verschoven, is de chip een stuk sneller en energiezuiniger.
Op hersenen geïnspireerd chipontwerp
Dharmendra Modha, IBM's chief scientist for brain-inspired computing, zegt dat de kernen met elkaar verbonden zijn op een manier die geïnspireerd is op de witte-materieverbindingen in de hersenschors van het menselijk brein.
IBM deelde de testresultaten op Science.org waarin stond dat "NorthPole een 25 keer hogere energiemeting van frames per seconde (FPS) per watt, een 5 keer hogere ruimtemeting van FPS per transistor en een 22 keer lagere tijdmeting van latency behaalt."
Eigenlijk zeggen ze dat ze veel minder stroom verbruiken, veel kleiner zijn en veel sneller werken dan andere chips.
Wat de eerste resultaten van IBM extra opwindend maakt, is dat NorthPole is gemaakt met behulp van 12 nm-technologie. Dit betekent dat de transistors in de chip 12 nm groot zijn. De huidige geavanceerde chipproductietechnologie is al teruggebracht tot 3 nm.
Als IBM de chiparchitectuur van NorthPole op dat niveau reproduceert, zullen de verwerkingsdichtheid en efficiëntie ver voor liggen op alles wat de industrie op dit moment beschikbaar heeft.
Vooruitgangen op het gebied van verwerking van chips die kleiner zijn en veel minder stroom verbruiken, maken AI on the edge-toepassingen tot een prikkelend vooruitzicht. Autonome voertuigen en zelfs handheld apparaten of wearables zouden uiteindelijk volledige AI-modellen kunnen draaien zonder dat cloud computing nodig is.