NVIDIA Blackwell em números - o potencial impacto do novo superchip de IA da NVIDIA

6 de junho de 2024

  • O próximo chip Blackwell da NVIDIA é o seu modelo mais potente até à data
  • É muitas vezes mais potente do que os seus antecessores, com uma eficiência energética superior
  • Que impacto poderá a Blackwell ter na indústria da IA e, na verdade, no mundo?
IA NVIDIA

NVIDIA CEO Jensen Huang descreveu recentemente em pormenor o mais recente chip acelerador de IA da empresa, denominado Blackwell, na apresentação da empresa na Computex 2024. 

Com o Blackwell, a NVIDIA pretende cimentar o seu domínio no crescente espaço do hardware de IA, ao mesmo tempo que prova a sua capacidade de inovar progressivamente.

Com a capitalização bolsista da empresa a aproximar-se da marca dos $3 biliões, a ascensão da NVIDIA ao comando supremo da infraestrutura de IA tem sido nada menos do que espantosa.

Huang não vê sinais de estagnação do progresso, uma vez que a empresa continua a superar as expectativas dos analistas

Mas o que é que as especificações e os números nos dizem realmente sobre as capacidades e o potencial impacto da Blackwell? 

Vejamos mais de perto o impacto que poderá ter na indústria da IA e na sociedade em geral. 

Potência bruta de computação

O número principal é que um único Blackwell "superchip" - que consiste em duas matrizes de GPU ligadas por uma ligação de alta velocidade - tem uns impressionantes 208 mil milhões de transístores. 

Trata-se de um aumento de quase 3X em relação ao chip Hopper da geração anterior da NVIDIA. A NVIDIA afirma que isto se traduz num aumento de velocidade de 30X em tarefas de inferência de IA em comparação com o Hopper.

Para colocar isto em perspetiva, consideremos um exemplo de modelo de linguagem de grande dimensão (LLM) com 100 mil milhões de parâmetros, semelhante em escala ao GPT-3. 

Para treinar um modelo deste tipo nas GPUs A100 da geração anterior da NVIDIA seriam necessários cerca de 1024 chips A100 a funcionar durante um mês.

Com o Blackwell, a NVIDIA afirma que o mesmo modelo pode ser treinado em pouco mais de uma semana utilizando 256 chips Blackwell - uma redução de 4X no tempo de treino.

Eficiência energética

Apesar dos seus ganhos dramáticos de desempenho, a NVIDIA afirma que o Blackwell pode reduzir o custo e o consumo de energia até 25 vezes em comparação com o Hopper para determinadas cargas de trabalho de IA. 

A empresa deu o exemplo do treino de um modelo com 1,8 biliões de parâmetros, que anteriormente teria exigido 8000 GPUs Hopper com 15 megawatts de potência.

Com o Blackwell, a NVIDIA diz que isto pode ser conseguido com 2.000 GPUs que consomem apenas 4 megawatts.

Embora um consumo de energia de 4 megawatts para uma única execução de treinamento de IA ainda seja substancial, é impressionante que a Blackwell possa fornecer um aumento de quase 4X na eficiência energética para uma tarefa tão exigente.

Não vamos subestimar os números. Para colocar esse valor de 4 megawatts em perspetiva, é equivalente ao consumo médio de energia de mais de 3.000 residências nos EUA.

Assim, um único supercomputador de IA da Blackwell a treinar um modelo de última geração consumiria tanta energia como uma cidade inteira durante o período de treino.

E isto é apenas para um treino - as organizações que desenvolvem grandes modelos de IA refinam frequentemente os seus modelos através de muitas iterações, e depois temos de considerar que há centenas de organizações a desenvolver grandes modelos.

Custos ambientais

Mesmo com uma maior eficiência energética, a adoção generalizada da Blackwell poderá aumentar significativamente o consumo global de energia da indústria.

Por exemplo, vamos supor que existem atualmente 100.000 GPUs de elevado desempenho a serem utilizadas para formação e inferência de IA em todo o mundo. 

Se a Blackwell permitir um aumento de 10X na adoção da IA nos próximos anos, o que não parece ser um número extraordinário, isso significaria 1 milhão de GPUs Blackwell em utilização.

Com o consumo de energia de 1,875 kilowatts por GPU que Huang citou, 1 milhão de GPUs Blackwell consumiriam 1,875 gigawatts de energia - quase a produção de duas centrais nucleares médias.

As centrais nucleares demoram muitos anos a construir e custam biliões. Foram concebidas principalmente para apoiar infra-estruturas nacionais e não apenas para treinar modelos de IA. 

Análises anteriores previram que as cargas de trabalho de IA poderão consumir tanta energia como um pequeno país até 2027, e é difícil ver exatamente como estas exigências serão satisfeitas de forma razoável.

O consumo de água é também um problema colossal, com a Microsoft a revelar enormes aumentos nos seus consumo de água de 2022 a 2023que se correlacionava com a formação de modelos de IA e a procura de centros de dados.

Algumas zonas dos EUA já enfrentaram escassez de água devido ao consumo dos centros de dados.

Sem encontrar melhores formas de fazer funcionar o hardware de IA a partir de energias renováveis, as emissões de carbono e o consumo de água da IA alimentada por Blackwell serão enormes, com a NVIDIA a acelerar a era da "hiperescala" do treino de modelos de IA.

E para além do consumo de energia, é essencial considerar outros custos ambientais, como os minerais de terras raras e outros recursos necessários para fabricar chips avançados como o Blackwell à escala e os resíduos gerados quando chegam ao fim da vida útil.

Isto não quer dizer que os benefícios sociais das capacidades de IA reveladas por Blackwell não possam compensar estes custos ambientais.

Mas isso significa que o impacto ambiental terá de ser cuidadosamente gerido e atenuado como parte de qualquer plano de implantação responsável do Blackwell. Há um ponto de interrogação persistente sobre se isso é possível ou realista.  

O potencial impacto da Blackwell

Vejamos como seria o mundo numa era de adoção generalizada do Blackwell.

Algumas estimativas de fundo de caixa dão uma ideia das possibilidades e dos riscos:

  • Os modelos linguísticos com 10 vezes a dimensão do GPT-3 poderão ser treinados num período de tempo semelhante e utilizando uma quantidade de recursos informáticos semelhante à do GPT-3. Isto permitirá dar um grande salto nas capacidades de IA da linguagem natural.
  • Conforme descrito na cerimónia de aberturaA IA, os assistentes digitais com capacidades que se aproximam das dos seres humanos podem tornar-se potencialmente rentáveis em termos de desenvolvimento e implantação generalizada. Uma IA capaz de realizar 80% das tarefas de um trabalho típico de conhecimento a 1/10 do custo de um trabalhador humano poderia deslocar até 45 milhões de empregos só nos EUA.
  • A capacidade computacional para treinar um sistema de IA com inteligência geral igual ou superior à do cérebro humano pode estar ao nosso alcance. As estimativas da capacidade computacional do cérebro variam entre 10^13 e 10^16 ligações neuronais. Um supercomputador da Blackwell com 1 milhão de GPUs teria uma capacidade de computação estimada em 10^18 flops - potencialmente suficiente para simular aspectos do cérebro humano em tempo real.

É claro que se trata de cenários altamente especulativos e que devem ser encarados com alguma cautela. A viabilidade técnica não se traduz necessariamente numa implementação no mundo real.

No entanto, destacam o potencial tremendo e disruptivo da aceleração da IA que a NVIDIA está a permitir com a Blackwell.

Huang descreveu o Blackwell como "uma nova plataforma de computação para uma nova era de computação". Com base nos números, é difícil argumentar contra essa caraterização. 

A Blackwell parece estar preparada para dar início à próxima grande fase da revolução da IA - para o bem e para o mal.

Por mais impressionantes que sejam as especificações do chip, a sociedade precisará de mais do que inovações de hardware para lidar com as implicações da tecnologia. 

A ponderação cuidadosa do impacto ambiental e dos esforços deve fazer parte da equação e da análise custo-benefício. 

Embora os chips como o Blackwell estejam a tornar-se mais eficientes do ponto de vista energético, só isso é provavelmente insuficiente para sustentar os actuais progressos.

Será que o sector vai encontrar uma solução? Provavelmente.

Mas ainda temos alguns anos para descobrir como é que os riscos e os benefícios da IA se vão repercutir na sociedade e, na verdade, no próprio planeta.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições