A NVIDIA, um nome sinónimo de tecnologia de ponta e inovação, foi fundada há apenas três décadas, em 1993.
De um início humilde como designer de chips gráficos focado na indústria de jogos, a NVIDIA evoluiu para um líder global em IA e computação de alto desempenho.
A NVIDIA foi avaliada em "apenas" cerca de $100 mil milhões em 2019. Agora vale cerca de $2 triliõesA empresa é a terceira maior empresa do mundo em termos de capitalização bolsista, abaixo da Microsoft e da Apple e à frente da Saudi Aramco, da Amazon, da Google e da Meta Platforms.
A NVIDIA foi fundada por Jensen Huang, Chris Malachowsky e Curtis Priem, que partilhavam a visão de revolucionar a computação gráfica.
No início dos anos 90, o trio reconheceu o potencial inexplorado dos processadores gráficos especializados e decidiu criar uma empresa que transformaria a crescente indústria dos jogos.
Um dos primeiros triunfos da empresa resultou de um momento de acaso.
Em 1995, a Sega estava a desenvolver a sua consola de jogos da próxima geração, a Sega Saturn. A Sega estava à procura de um chip gráfico 3D para alimentar a consola e tinha inicialmente feito uma parceria com a 3Dfx Interactive, concorrente da NVIDIA.
No entanto, num encontro casual entre um engenheiro da NVIDIA e um executivo da Sega numa conferência, a NVIDIA demonstrou o chip NV1 da empresa, o que impressionou a Sega. A Sega decidiu utilizar o chip da NVIDIA na Saturn em vez do da 3Dfx.
Curiosamente, o chip NV1 utilizado na Sega Saturn não foi um êxito comercial para a NVIDIA no mercado dos PC. O produto subsequente da empresa, o RIVA 128 (NV3), foi a sua primeira GPU de sucesso para PC e lançou as bases para o seu futuro domínio no mercado das placas gráficas.
Outro avanço precoce ocorreu em 1999 com o GeForce 256comercializada como a primeira GPU do mundo.
Isto lançou as bases para o domínio da NVIDIA na indústria dos jogos, e a linha de GPUs GeForce tornou-se rapidamente um nome conhecido entre os entusiastas dos jogos.
À medida que a NVIDIA continuou a ultrapassar os limites da tecnologia gráfica no início dos anos 2000, lançando GPUs cada vez mais potentes que proporcionavam experiências de jogo envolventes, a I&D da empresa estabeleceu-a como líder no processamento paralelo.
Isso seria mais tarde fundamental para o futuro sucesso da NVIDIA na área da IA e da computação de alto desempenho.
Para além dos jogos: a ascensão da GPGPU e da CUDA
Embora a indústria de jogos tenha catalisado o sucesso inicial da NVIDIA, a liderança da empresa reconheceu o potencial das GPUs para além da renderização de gráficos.
Em 2006, a NVIDIA introduziu a Compute Unified Device Architecture (CUDA), um modelo de programação que permitia aos programadores aproveitar o poder de processamento paralelo das GPUs para computação de uso geral (GPGPU).
A CUDA simplificou o processo de programação de GPUs, permitindo aos programadores escrever código utilizando linguagens familiares como C e C++. Isto abriu novas oportunidades para a NVIDIA na investigação científica, exploração de petróleo e gás, simulações financeiras e imagiologia médica, abrindo assim uma miríade de novas parcerias para a NVIDIA.
Isto também mostrou como a NVIDIA se tornaria fundamental na infraestrutura crítica de alta tecnologia, expandindo a sua clientela para além dos compradores empresariais para governos e instituições públicas.
Semicondutores: um mercado notoriamente difícil de conquistar
A indústria dos semicondutores é notoriamente complexa e altamente competitiva, com apenas um punhado de empresas a deixar a sua marca.
Uma das principais razões para o número limitado de grandes fabricantes de semicondutores é o custo extremo e a complexidade do processo de fabrico.
O fabrico de semicondutores requer instalações de ponta, conhecidas como fundições, que podem custar milhares de milhões de dólares para construir e manter.
Estas fundições têm de funcionar em ambientes extremamente limpos para evitar que até as mais pequenas partículas interfiram com o processo de fabrico.
Além disso, o equipamento utilizado para o fabrico de semicondutores, como as máquinas de litografia, é altamente especializado e dispendioso, com algumas máquinas a custarem mais de $100 milhões.
Em conjunto, isto cria enormes barreiras à entrada de novos intervenientes na indústria, o que ajudou a manter a NVIDIA no topo da hierarquia, apesar da concorrência da AMD, Intel e Qualcomm.
A revolução da IA
À medida que a procura por IA e aprendizagem automática crescia na década de 2010, a NVIDIA estava perfeitamente posicionada para capitalizar esta tendência emergente.
Com I&D em processamento paralelo, as GPUs da empresa tornaram-se o hardware preferido para treinar redes neuronais profundas e alimentar cargas de trabalho de IA.
Reconhecendo o imenso potencial da IA, a NVIDIA fez investimentos estratégicos no campo, colaborando com as principais instituições de investigação e empresas tecnológicas para fazer avançar as tecnologias de IA.
O apoio inicial da empresa à OpenAI mostrou a sua capacidade de entrar em sectores de ponta e de assumir riscos para expandir a sua base de clientes.
A NVIDIA também desenvolveu módulos de computação especializados, como a série DGX, especificamente concebidos para acelerar a formação de modelos de linguagem grandes (LLMs) e outras arquitecturas de IA. Estes sistemas potentes tornaram-se rapidamente o hardware de eleição para investigadores e programadores de IA em todo o mundo.
E esse é um ponto crucial. Quando se trata de hardware de IA topo de gama, há a NVIDIA e depois há os outros.
Trata-se de uma configuração invulgar, mesmo nas grandes empresas de tecnologia. A Google, a Amazon, a Meta, a Apple e a Microsoft não são assim tão diferentes quando se resumem as suas principais unidades de negócio.
Há tão poucos actores no mercado dos semicondutores, em parte porque é difícil e em parte porque a NVIDIA o tornou assim através de investimentos estratégicos.
O ecossistema coeso da NVIDIA também oferece segurança aos programadores, uma vez que a NVIDIA se tornou tão fiável. Esta é uma empresa livre das controvérsias da Big Tech, das lutas pela liderança, das acções regulamentares e da dependência de tecnologias digitais menos tangíveis, como as redes sociais.
A NVIDIA compreende isto, utilizando software e hardware para reforçar o domínio sobre o ecossistema de IA e criar um conjunto de ferramentas e bibliotecas de software que melhoram as estratégias de entrada no mercado para os seus clientes.
O papel da NVIDIA na IA generativa
A ascensão da IA generativa solidificou ainda mais a posição da NVIDIA como uma potência de IA. Esta é a fase em que a NVIDIA se estabeleceu verdadeiramente como uma das empresas mais influentes do mundo.
A IA generativa envolve o treino de modelos em vastos dados para criar novos conteúdos com base em padrões e estilos aprendidos, como texto, imagens e música.
Reconhecendo o seu imenso potencial, a NVIDIA introduziu as Fundações de IA, uma plataforma baseada em cloud que democratizou o acesso a modelos de IA generativa de última geração.
As Fundações de IA permitem que as empresas e os programadores aproveitem o poder da IA generativa sem a necessidade de grandes recursos ou conhecimentos internos.
As Fundações de IA da NVIDIA incluíam inicialmente modelos pré-treinados, como o NeMo para processamento de linguagem natural e o Picasso para geração de imagens e vídeos.
Mais uma vez, isto mostra o empenhamento da NVIDIA em criar um ecossistema em vez de produtos individuais. É aqui que se diferenciam de outros fabricantes, em especial dos concorrentes no fabrico de semicondutores.
A NVIDIA é um balcão único para o desenvolvimento de IA de ponta, oferecendo hardware, software e fortes colaborações com recursos de nuvem através da Google, Microsoft, Amazon e outros.
GPUs da NVIDIA
No meio do boom da IA generativa, a NVIDIA expandiu amplamente o seu portefólio de chips de IA, introduzindo vários processadores inovadores concebidos para ultrapassar os limites da IA e das tecnologias de computação em vários setores.
Vejamos mais de perto estes chips e os seus contributos:
- A100 e H100: O H100 tornou-se rapidamente o carro-chefe da NVIDIA para aplicações de IA, com velocidades de relógio 6x mais rápidas do que o seu antecessor, o A100.
- GPU HGX H200: Baseado na arquitetura Hopper, o H200 apresenta a memória HBM3e, fornecendo quase o dobro da capacidade e 2,4 vezes mais largura de banda do que a sua antecessora, a A100. Ela foi projetada para dobrar a velocidade de inferência no Llama 2, um LLM de 70 bilhões de parâmetros, em comparação com o H100. O H200 é compatível com várias configurações de centros de dados e o seu lançamento está previsto para o início ou meados de 2024.
- GH200 Grace Hopper Superchip: A GH200 combina a GPU HGX H200 com uma CPU NVIDIA Grace baseada em Arm. Destina-se a aplicações de supercomputação para lidar com aplicações complexas de IA e HPC. Espera-se que o GH200 seja utilizado em mais de 40 supercomputadores de IA em todo o mundo, incluindo projetos significativos como o sistema JUPITER na Alemanha, que deverá ser o sistema de IA mais poderoso do mundo após sua instalação em 2024.
- Blackwell GPU: Apresentado em GTC 2024A GPU Blackwell é o processador da próxima geração da NVIDIA, sucedendo às GPUs H100 e H200. Considerado pela NVIDIA como o chip mais potente do mundo, o Blackwell foi concebido especificamente para as exigências da IA generativa. Ele oferece um aumento de desempenho de 30 vezes em relação ao H100 para cargas de trabalho LLM com eficiência energética 25 vezes melhor.
Blackwell será enorme, com Comunicado de imprensa da NVIDIA que demonstrou o interesse de uma lista dos maiores nomes da Big Tech, como Satya Nadella da Microsoft, Sundar Pichai e Demis Hassabis da Google e DeepMind, Sam Altman da OpenAI, e muitos outros.
NVIDIA supera o governo dos EUA
O sucesso da NVIDIA estende-se à sua estratégia empresarial ágil, governação e resposta às pressões do mercado. Isto inclui evitar os esforços do governo dos EUA para restringir as exportações de hardware topo de gama para a China, um dos seus maiores clientes.
Em agosto de 2022, o Departamento de Comércio dos EUA impôs requisitos de licenciamento à importação de determinadas GPU topo de gama, incluindo os chips A100 e H100 da NVIDIA, para a China e a Rússia. Isto fez com que o seu stock caísse temporariamente quase 8%.
As restrições foram concebidas para evitar que estes chips sejam utilizados em aplicações militares, como supercomputadores e sistemas de IA.
Em outubro de 2022, os EUA reforçaram ainda mais os seus controlos das exportações, introduzindo um vasto conjunto de regras destinadas a impedir a China de aceder a determinadas pastilhas de semicondutores fabricadas em qualquer parte do mundo com equipamento dos EUA. Estas regras restringiram igualmente a exportação de ferramentas e componentes fabricados nos EUA, essenciais para o fabrico de pastilhas.
Com cada iteração destas regras, a NVIDIA encontrou formas de as contornar, alterando os seus chips para contornar especificamente as proibições de exportação.
Por exemplo, em novembro, a NVIDIA lançou três novos produtos - HGX H20, L20 PCle e L2 PCle - baseados no potente chip H100 da NVIDIA, mas concebidos para cumprir as restrições à exportação.
Estes chips são menos potentes do que os modelos A100 e H800, anteriormente restritos, mas continuam a oferecer capacidades de desempenho eficazes para tarefas de IA.
Como anotado por SemiAnalysis"A Nvidia está a ultrapassar perfeitamente a linha do desempenho máximo e da densidade de desempenho com estes novos chips para os fazer cumprir os novos regulamentos dos EUA".
De acordo com o South China Post, estima-se que 20 a 25% das receitas dos centros de dados da NVIDIA sejam geradas por compradores chineses, apesar das proibições de exportação cada vez mais rigorosas.
Robótica com o Projeto GR00T e o Jetson Thor
A NVIDIA apoia tecnologias de ponta e emergentes através das suas plataformas de desenvolvimento de robótica empresarial.
Na conferência GTC 2024, a empresa anunciou Projeto GR00T e Jetson Thor. O GR00T pretende revolucionar a robótica humanoide, fornecendo um modelo de base de uso geral que permite aos robôs aprender com as acções humanas e aprender rapidamente a coordenação, a destreza e outras competências.
Hoje é o início da nossa missão para resolver a AGI incorporada no mundo físico. É com grande entusiasmo que anuncio o Projeto GR00T, a nossa nova iniciativa para criar um modelo de base de uso geral para a aprendizagem de robôs humanóides.
O modelo GR00T permitirá que um robô compreenda... pic.twitter.com/EqN19Z3cXH
- Jim Fan (@DrJimFan) 18 de março de 2024
O Jetson Thor, apresentado juntamente com o Projeto GR00T, é uma nova plataforma de computação concebida para estes robôs humanóides. Está equipada com uma GPU de última geração baseada na arquitetura Blackwell da NVIDIA.
A NVIDIA também está a desenvolver ativamente os seus Plataforma robótica Isaac para apoiar o desenvolvimento de robôs sofisticados com movimentos assíncronos naturais e destreza.
Desempenho financeiro da NVIDIA e domínio do mercado
O sucesso da NVIDIA em jogos, IA e computação de alto desempenho traduziu-se num desempenho financeiro notável. Em 2023, as receitas da empresa aumentaram 61% em relação ao ano anterior.
Com este crescimento, a capitalização bolsista da empresa aumentou ultrapassou a marca dos $1 biliões em meados de 2023 e continuou até atingir o $2 marca de trilião, waqui está ele hoje.
O segmento de centro de dados, que inclui IA e computação de alto desempenho, representou $11,2 mil milhões, ou 42% da receita total, destacando a importância crescente destas áreas para o negócio da NVIDIA.
Impressionantemente, o segmento de jogos da NVIDIA continuou a prosperar, contribuindo com $9,3 mil milhões, ou 35% da receita total, demonstrando a sua capacidade para manter a liderança na indústria dos jogos e, simultaneamente, expandir-se para novos mercados.
O sucesso financeiro da NVIDIA atingiu novos patamares no primeiro trimestre do ano fiscal de 2024, com as receitas a dispararem para $13,5 mil milhões, um aumento impressionante de 88% em relação ao trimestre anterior. O segmento de centros de dados foi o principal impulsionador, com vendas recorde que ultrapassaram os $10 mil milhões.
A ascensão da NVIDIA vai continuar?
A indústria tecnológica, em geral, está a viver um par de anos extraordinário, com a Alphabet, a Meta e a Microsoft a apresentarem resultados impressionantes em 2023.
A Alphabet, a Amazon, a NVIDIA, a Apple, a Meta e a Microsoft dominam o índice S&P 500, representando 9% das suas vendas, 16% dos seus lucros líquidos e cerca de 25% da sua capitalização bolsista.
As receitas da NVIDIA no ano passado foram de cerca de $60 mil milhões, um aumento de 126% em relação ao ano anterior. A sua elevada avaliação e o preço das acções baseiam-se nessas receitas e no seu crescimento contínuo previsto.
Para efeitos de comparação, a Amazon tem um valor de mercado inferior ao da NVIDIA, mas facturou quase $575 mil milhões em vendas no ano passado.
Esta disparidade mostra o caminho íngreme que a NVIDIA tem de percorrer para registar lucros suficientemente grandes para justificar a sua avaliação de $2 biliões, especialmente à medida que a concorrência no mercado de chips de IA se intensifica.
Mas, apesar disso, os analistas aumentaram os preços-alvo para a NVIDIA, com o analista da UBS Timothy Arcuri recentemente a aumentar para 1100 de 800, citando o potencial da NVIDIA para captar a procura das empresas e governos globais com a Blackwell.
No entanto, alguns acreditam que o gráfico de acções da NVIDIA mostra sinais de enfraquecimento. De facto, é extremamente elevado para uma empresa que ainda não enviou a grande maioria das suas encomendas de A100 e H100.
Olhando para o futuro, o futuro da grande tecnologia e o crescimento da NVIDIA permanecem incertos. Embora o potencial de crescimento seja imenso, as empresas também têm de enfrentar a possibilidade de um arrefecimento do caso de amor com a IA, as limitações tecnológicas e os obstáculos regulamentares.
O tráfego do ChatGPT, por exemplo, diminuiu desde maio de 2023 e alguns investidores estão a abrandar os seus investimentos em empresas relacionadas com a IA. Existe alguma preocupação de que a IA generativa tenha surgido demasiado depressa, atingindo rapidamente um pico que poderá ter dificuldade em ultrapassar num futuro próximo.
Além disso, bA computação de força bruta consome muitos recursos, tanto para a NVIDIA quanto para seus clientes. Quando somados às cargas de trabalho globais de IA, os chips precisam de uma potência constante que rivaliza com a capacidade das pequenas nações.
E não se trata apenas de energia, mas também de água, que é bombeada através dos centros de dados ao ritmo de milhares de milhões de litros por dia. Os recursos naturais necessários para construir hardware de IA topo de gama, como os metais de terras raras, também não são ilimitados.
A NVIDIA está muito consciente dos desafios energéticos da indústria, daí que os seus novos chips sejam consideravelmente mais eficientes em termos energéticos.
Na GTC 2024, Huang afirmou: "A computação acelerada atingiu o ponto de viragem. A computação de uso geral perdeu o fôlego. Precisamos de outra forma de fazer computação para que possamos continuar a escalar, para que possamos continuar a baixar o custo da computação, para que possamos continuar a consumir cada vez mais computação sendo sustentáveis".
Pelo menos Huang é realista em relação a estas questões.
Pode ter a certeza de que a NVIDIA irá canalizar mais fundos para desbloquear o crescimento da IA eficiente em termos energéticos que liberte a indústria dos grilhões da computação acelerada de força bruta.
Se tal for conseguido, a ascensão da NVIDIA poderá não ter limites óbvios.