A demanda por IA (inteligência artificial) cresceu exponencialmente entre 2022 e 2023. E esse cenário revelou os limites da cadeia global de suprimentos de chips avançados, usados no desenvolvimento e disponibilização de modelos de IA.
Para quem tem pressa:
A crise no fornecimento de chips afetou tanto empresas grandes quanto pequenas – entre elas algumas das principais plataformas do setor de IA. Segundo analistas do setor ouvidos pela CNN, a situação pode continuar assim por pelo menos um ano ou mais antes de melhorar.
Escassez de chips e IA
O sinal mais recente de uma escassez potencialmente prolongada de chips de IA apareceu no relatório anual da Microsoft, divulgado em julho.
Esse relatório identificou, pela primeira vez, a disponibilidade de GPUs (unidades de processamento gráfico) como um possível fator de risco para os investidores.
As GPUs são um tipo crucial de hardware que ajuda a executar os inúmeros cálculos envolvidos no treinamento e na implantação de algoritmos de inteligência artificial.
Continuamos identificando e avaliando oportunidades para expandir nossos locais de datacenter e aumentar nossa capacidade de servidor para atender às crescentes necessidades de nossos clientes, principalmente devido à crescente demanda por serviços de IA. Nossos datacenters dependem da disponibilidade de terreno permitido e edificável, energia previsível, suprimentos de rede e servidores, incluindo unidades de processamento gráfico (GPUs) e outros componentes.
Trecho do relatório da Microsoft
A menção a GPUs por parte da Microsoft destaca como o acesso ao poder de computação é um gargalo para a IA.
O gargalo
A questão afeta diretamente as empresas que estão construindo ferramentas e produtos de IA. E afeta indiretamente empresas e usuários finais que esperam aplicar a tecnologia para seus próprios fins.
O CEO da OpenAI, Sam Altman, sugeriu, durante seu depoimento perante o Senado dos EUA em maio, que o ChatGPT enfrentava dificuldade para acompanhar o número de solicitações dos usuários.
Temos poucas GPUs, quanto menos pessoas usarem a ferramenta, melhor.
Sam Altman, CEO da OpenAI, dona do ChatGPT
Um porta-voz da OpenAI disse mais tarde à CNN que a empresa está comprometida em garantir capacidade suficiente para atender as demandas dos usuários.
O problema pode soar como uma reminiscência da escassez de eletrônicos durante a pandemia de Covid-19.
Na época, atrasos na fabricação, falta de mão-de-obra, interrupções no transporte global e demanda competitiva persistente de mineradoras de criptomoedas contribuíram para o suprimento escasso de GPUs.
Aumento da demanda
No entanto, a escassez atual é muito diferente, dizem especialistas do setor. Em vez de uma interrupção no fornecimento de GPUs voltadas para o consumidor, a escassez contínua reflete a demanda repentina e explosiva por GPUs de última geração destinadas a trabalhos avançados – por exemplo: treinamento e uso de modelos de IA.
A produção dessas GPUs está em sua capacidade máxima. Mas a pressa da demanda sobrecarregou as poucas fontes de suprimento existentes.
Só que uma empresa em particular deve se beneficiar enormemente com o aumento da IA: a Nvidia, fabricante de chips avaliada em trilhões de dólares. A controla 84% do mercado de GPUs, de acordo com estimativas da indústria.
Em sua teleconferência de resultados realizada em maio, a Nvidia disse que “adquiriu uma oferta substancialmente maior para o segundo semestre do ano” para atender à crescente demanda por chips de IA.
Mais um problema
Os próprios fabricantes de GPU não conseguem obter informações importantes de seus próprios fornecedores, disse Sid Sheth, fundador e CEO da startup de IA d-Matrix.
A tecnologia, conhecida como interposer de silício, combina chips de computação autônomos com chips de memória com alta largura de banda. Ela é necessária para completar as GPUs.
O governo de Joe Biden, presidente dos EUA, fez do aumento da capacidade de fabricação de chips no país uma prioridade.
A aprovação da Lei dos Chips em 2022 deve fornecer bilhões de dólares em financiamento para a indústria estadunidense de chips e para pesquisa e desenvolvimento dos componentes.
No entanto, esses investimentos visam uma ampla gama de tecnologias de chips e não visam especificamente aumentar a produção de GPU.
Fonte: Olhar Digital
Comentários