Nvidia hat den H200 vorgestellt, seinen neuesten High-End-Chip, der für das Training von KI-Modellen entwickelt wurde.
Der am Montag, den 13. November 2023, angekündigte neue Grafikprozessor soll die Fähigkeiten von KI-Modellen durch die Integration von 141 GB HBM3"-Speicher der nächsten Generation deutlich verbessern.
Der H200 stellt eine Weiterentwicklung seines Vorgängers, des H100, dar, der eine wichtige Rolle im KI-Ökosystem gespielt hat.
Die Begeisterung für die KI-GPUs von Nvidia hat die Aktie des Unternehmens um einen phänomenal 230% im Jahr 2023Das Unternehmen rechnet für sein drittes Geschäftsquartal mit einem Umsatz von rund $16 Milliarden, was einer Steigerung von 170% gegenüber dem Vorjahr entspricht.
Ein Hauptmerkmal des H200 ist seine verbesserte Leistung bei der Inferenz, d. h. bei der Verwendung eines trainierten KI-Modells zur Erstellung von Vorhersagen oder Entscheidungen auf der Grundlage neuer, ungesehener Daten.
Dies unterscheidet sich von der Trainingsphase eines Modells, in der die KI Muster aus einem großen Datensatz lernt.
Aktuelle Daten deuten darauf hin, dass die Leistung des H200 fast doppelt so hoch ist wie die des H100, wie die Llama 2 Large Language Model (LLM) Benchmarks von Meta zeigen.
Die Auslieferung des H200 wird für das zweite Quartal 2024 erwartet. Dann wird er wahrscheinlich schon immense Aufträge von KI-Unternehmen aus der ganzen Welt erhalten, außer in China, Iran und Russland. US-Exporte von KI-Hardware werden verboten.
Der H200 wird mit bestehenden Systemen, die den H100 verwenden, kompatibel sein, so dass KI-Unternehmen aufrüsten können, ohne ihre Serversysteme oder Software ändern zu müssen.
Er wird in Serverkonfigurationen mit vier oder acht GPUs auf Nvidias HGX-Komplettsystemen und auch als separater Chip namens GH200 erhältlich sein, der die H200-GPU mit einem Arm-basierten Prozessor kombiniert.
Allerdings könnte die Position des H200 als schnellster KI-Chip von Nvidia nur von kurzer Dauer sein. Aufgrund der hohen Nachfrage nach seinen GPUs plant Nvidia, zu jährlichen Veröffentlichungsmustern überzugehen, um die KI-Industrie fest in der Tasche zu haben.
Ein weiterer Chip, der B100-Chip, der auf einer völlig neuen Blackwell-Architektur basiert, ist in Arbeit und könnte im Jahr 2024 angekündigt und veröffentlicht werden.