A NVIDIA anunciou uma gama de novo hardware, plataformas de computação e motores de simulação destinados a acelerar o desenvolvimento da IA generativa e da robótica no seu evento GTC.
Ontem, o fundador e CEO da NVIDIA, Jensen Huang, apresentou os mais recentes produtos que a empresa irá fornecer aos programadores das soluções de IA do futuro.
Huang afirmou: "A computação acelerada atingiu o ponto de viragem. A computação para fins gerais esgotou-se. Precisamos de outra forma de fazer computação para podermos continuar a escalar, para podermos continuar a baixar o custo da computação, para podermos continuar a consumir cada vez mais computação, sendo ao mesmo tempo sustentáveis".
Para realizar a atualização maciça de que a infraestrutura mundial de IA necessita, Huang apresentou as seguintes novas soluções de hardware e software:
- A GPU e a plataforma de computação Blackwell
- Supercomputador NVIDIA DGX SuperPOD
- Microsserviços NIM - uma nova forma de criar software de IA
- Omniverse - um simulador do mundo real para treinar robôs
- Software Isaac Perceptor e Projeto GR00T - um modelo de base de uso geral para robôs humanóides e software de robótica
Eis um olhar mais atento sobre estes novos e excitantes lançamentos.
Blackwell
Huang afirmou que, para permitir o treino multimodal de modelos de IA cada vez maiores, a indústria precisa de GPUs muito maiores. A NVIDIA afirma que o seu novo chip Blackwell é "o maior chip fisicamente possível" e contém 104 mil milhões de transístores.
A ligação de dois deles numa GPU proporciona um aumento significativo do processamento. A Blackwell oferece 2,5x o desempenho da NVIDIA Tremonha desempenho da arquitetura em FP8 para treino, por chip, e 5x com FP4 para inferência.
A interligação NVLink que liga estas GPUs é duas vezes mais rápida do que a sua antecessora e permite a interligação de 576 GPUs Blackwell.
A ligação de duas GPUs Blackwell e uma CPU Grace resulta no Grace Blackwell Superchip que forma a base dos bastidores GB200 NVL2 da NVIDIA. Estes fornecem computação exaflop num único bastidor.
A NVIDIA ligou alguns deles para criar o seu novo supercomputador de IA chamado NVIDIA DGX SuperPOD, que fornece 11,5 exaflops de supercomputação de IA com precisão FP4.
O comunicado de imprensa referiu a AWS, o Google Cloud, o Microsoft Azure e a Oracle como os primeiros na linha de espera do novo hardware de computação que, segundo a NVIDIA, pode "construir e executar IA generativa em tempo real em modelos de linguagem de grande dimensão com triliões de parâmetros a um custo e consumo de energia até 25x inferior ao do seu antecessor".
Este é o aspeto do progresso computacional da NVIDIA nos últimos 8 anos.
NIMs NVIDIA
"Como é que vamos construir software no futuro? É improvável que o escrevamos do zero ou que escrevamos um monte de código Python ou algo do género", disse Huang. "É muito provável que se reúna uma equipa de IAs".
Huang afirmou que, em vez de escrever software, as empresas irão "montar modelos de IA, dar-lhes missões, dar exemplos de produtos de trabalho, rever planos e resultados intermédios".
A NVIDIA lançou uma coleção de contentores pré-construídos, ou microsserviços, a que chama NIM (NVIDIA Inference Microservice).
Os NIMs são como pequenas caixas de software de IA com um modelo pré-treinado, APIs e outros componentes de software no seu interior. As empresas poderão implementá-los de forma semelhante à forma como utilizamos os GPTs ou o Zapier, em vez de terem de recriar a funcionalidade de raiz.
Omniverso
A IA incorporada, ou IA física, é onde se está a desenvolver muito atualmente. O treino de robôs no mundo físico é dispendioso e ineficaz e a NVIDIA diz ter a solução para isso.
O Omniverse é um motor de simulação do mundo virtual que funciona como um "ginásio" virtual para um robô aprender a articulação e a física da interação com o mundo real.
A NVIDIA fornece acesso à API aos programadores para treinarem os seus robôs no Omniverse. Os programadores podem criar um gémeo digital de um espaço físico, como um armazém, e otimizar o equipamento automatizado e os robôs antes de os implementar no espaço físico.
Software Isaac e Projeto GR00T
Huang anunciou novo software para apoiar os programadores de robótica. O software Isaac Perceptor e a biblioteca Isaac Manipulator ajudarão os robots a ver, navegar e manipular os seus ambientes.
A NVIDIA também revelou o Projeto GR00T (General Robotics 003), um modelo de base de utilização geral para robôs humanóides. Este modelo, juntamente com o software Isaac Perceptor, será executado num novo computador, o Jetson Thor, para ajudar a treinar robôs no Omniverse e, em seguida, colocá-los no mundo real.
O primeiro dia da GTC assistiu a alguns anúncios importantes de novas tecnologias que provavelmente farão com que o preço das acções da NVIDIA continue a subir. Será interessante ver que outras surpresas Huang nos reserva nos próximos dias.
Pode ver a apresentação de Huang aqui.