A Nvidia revelou o H200, o seu mais recente chip topo de gama concebido para treinar modelos de IA.
Anunciada na segunda-feira, 13 de novembro de 2023, esta nova GPU está preparada para aumentar as capacidades dos modelos de IA ao incorporar 141 GB de memória "HBM3" de última geração.
O H200 representa uma evolução do seu antecessor, o H100, que tem sido fundamental para o ecossistema de IA.
Este entusiasmo em torno das GPUs de IA da Nvidia fez aumentar as suas acções em fenómeno 230% em 2023A empresa prevê cerca de $16 mil milhões de receitas para o terceiro trimestre fiscal, o que representa um aumento de 170% em relação ao ano anterior.
Uma caraterística fundamental do H200 é o seu desempenho melhorado na inferência, que se refere ao processo de utilização de um modelo de IA treinado para fazer previsões ou tomar decisões com base em dados novos e não vistos.
Isto é diferente da fase de formação de um modelo, em que a IA aprende padrões a partir de um grande conjunto de dados.
Os dados actuais sugerem que o desempenho do H200 é quase o dobro do desempenho do H100, tal como evidenciado nos testes de referência do modelo de linguagem grande (LLM) Llama 2 da Meta.
Previsto para ser comercializado no segundo trimestre de 2024, o H200 começará provavelmente a receber imensas encomendas de empresas de IA em todo o mundo, exceto na China, Irão e Rússia, onde Exportações de hardware de IA dos EUA são proibidas.
O H200 será compatível com os sistemas existentes que utilizam o H100, permitindo que as empresas de IA actualizem sem necessidade de alterar os seus sistemas de servidor ou software.
Estará disponível em configurações de servidor de quatro ou oito GPUs nos sistemas completos HGX da Nvidia e também como um chip separado denominado GH200, que associa a GPU H200 a um processador baseado em Arm.
No entanto, a posição do H200 como o chip de IA mais rápido da Nvidia pode ser de curta duração. Devido à elevada procura das suas GPU, a Nvidia planeia mudar para padrões de lançamento anuais, numa tentativa de manter a indústria da IA bem presente no seu bolso.
Há outro chip em preparação, o chip B100, baseado numa arquitetura Blackwell totalmente nova, que poderá ser anunciado e lançado em 2024.