A demanda por IA (inteligência artificial) cresceu exponencialmente entre 2022 e 2023. E esse cenário revelou os limites da cadeia global de suprimentos de chips avançados, usados ​​no desenvolvimento e disponibilização de modelos de IA.

Para quem tem pressa:

A crise no fornecimento de chips afetou tanto empresas grandes quanto pequenas – entre elas algumas das principais plataformas do setor de IA. Segundo analistas do setor ouvidos pela CNN, a situação pode continuar assim por pelo menos um ano ou mais antes de melhorar.

Escassez de chips e IA

Ilustração digital de chip de IA
(Imagem: IM Imagery/Shutterstock)

O sinal mais recente de uma escassez potencialmente prolongada de chips de IA apareceu no relatório anual da Microsoft, divulgado em julho.

Esse relatório identificou, pela primeira vez, a disponibilidade de GPUs (unidades de processamento gráfico) como um possível fator de risco para os investidores.

As GPUs são um tipo crucial de hardware que ajuda a executar os inúmeros cálculos envolvidos no treinamento e na implantação de algoritmos de inteligência artificial.

Continuamos identificando e avaliando oportunidades para expandir nossos locais de datacenter e aumentar nossa capacidade de servidor para atender às crescentes necessidades de nossos clientes, principalmente devido à crescente demanda por serviços de IA. Nossos datacenters dependem da disponibilidade de terreno permitido e edificável, energia previsível, suprimentos de rede e servidores, incluindo unidades de processamento gráfico (GPUs) e outros componentes.

Trecho do relatório da Microsoft

A menção a GPUs por parte da Microsoft destaca como o acesso ao poder de computação é um gargalo para a IA.

O gargalo

Chips semicondutores em uma placa de circuito
(Imagem: dexmac/Pixabay)

A questão afeta diretamente as empresas que estão construindo ferramentas e produtos de IA. E afeta indiretamente empresas e usuários finais que esperam aplicar a tecnologia para seus próprios fins.

O CEO da OpenAI, Sam Altman, sugeriu, durante seu depoimento perante o Senado dos EUA em maio, que o ChatGPT enfrentava dificuldade para acompanhar o número de solicitações dos usuários.

Temos poucas GPUs, quanto menos pessoas usarem a ferramenta, melhor.

Sam Altman, CEO da OpenAI, dona do ChatGPT

Um porta-voz da OpenAI disse mais tarde à CNN que a empresa está comprometida em garantir capacidade suficiente para atender as demandas dos usuários.

O problema pode soar como uma reminiscência da escassez de eletrônicos durante a pandemia de Covid-19.

Na época, atrasos na fabricação, falta de mão-de-obra, interrupções no transporte global e demanda competitiva persistente de mineradoras de criptomoedas contribuíram para o suprimento escasso de GPUs.

Aumento da demanda

Ilustração digital de GPU da Nvidia
(Imagem: Divulgação/Nvidia)

No entanto, a escassez atual é muito diferente, dizem especialistas do setor. Em vez de uma interrupção no fornecimento de GPUs voltadas para o consumidor, a escassez contínua reflete a demanda repentina e explosiva por GPUs de última geração destinadas a trabalhos avançados – por exemplo: treinamento e uso de modelos de IA.

A produção dessas GPUs está em sua capacidade máxima. Mas a pressa da demanda sobrecarregou as poucas fontes de suprimento existentes.

Só que uma empresa em particular deve se beneficiar enormemente com o aumento da IA: a Nvidia, fabricante de chips avaliada em trilhões de dólares. A controla 84% do mercado de GPUs, de acordo com estimativas da indústria.

Em sua teleconferência de resultados realizada em maio, a Nvidia disse que “adquiriu uma oferta substancialmente maior para o segundo semestre do ano” para atender à crescente demanda por chips de IA.

Mais um problema

Um dos chips da Nvidia
(Imagem: I-Hwa Cheng/Bloomberg News)

Os próprios fabricantes de GPU não conseguem obter informações importantes de seus próprios fornecedores, disse Sid Sheth, fundador e CEO da startup de IA d-Matrix.

A tecnologia, conhecida como interposer de silício, combina chips de computação autônomos com chips de memória com alta largura de banda. Ela é necessária para completar as GPUs.

O governo de Joe Biden, presidente dos EUA, fez do aumento da capacidade de fabricação de chips no país uma prioridade.

A aprovação da Lei dos Chips em 2022 deve fornecer bilhões de dólares em financiamento para a indústria estadunidense de chips e para pesquisa e desenvolvimento dos componentes.

No entanto, esses investimentos visam uma ampla gama de tecnologias de chips e não visam especificamente aumentar a produção de GPU.