O que a descoberta do DeepSeek diz (e não diz) sobre a 'corrida da IA' com a China

O que a descoberta do DeepSeek diz (e não diz) sobre a ‘corrida da IA’ com a China

Artigo diz que que foco excessivo dos EUA na restrição a chips pode não bastar para manter a vantagem na corrida tecnológica

Por Editor
02/02/2025 09:00
Atualizado em 07/04/2025 16:06

_{Este artigo foi publicado originalmente em inglês no site do think tank Atlantic Council}

Por Kenton Thibaut

Nesta semana, os espaços de tecnologia e política externa estão agitados com a notícia de que um modelo de linguagem de raciocínio de código aberto (LLM) baseado na China, DeepSeek-R1, foi encontrado para corresponder ao desempenho do modelo o1 da OpenAI em uma série de tarefas principais. Ele teria feito isso por uma fração do custo, e você pode acessá-lo gratuitamente.

O mais impressionante sobre o desempenho do DeepSeek-R1, vários pesquisadores de inteligência artificial (IA) apontaram, é que ele supostamente não atingiu seus resultados por meio do acesso a grandes quantidades de poder computacional alimentado por chips H100 de alto desempenho, cujo uso por empresas chinesas é proibido pelos controles de exportação dos EUA. Em vez disso, ele pode ter conduzido a maior parte do treinamento para este novo modelo otimizando a largura de banda de memória entre chips dos H800s menos sofisticados (permitindo que esses chips menos sofisticados “compartilhem” o tamanho de um modelo muito grande). Isso significa que treinar o modelo custou muito menos em comparação a modelos de desempenho semelhante treinados em chips mais caros e de ponta. O avanço do DeepSeek levou alguns a questionarem se os controles de exportação do governo dos EUA para a China falharam.

No entanto, tal conclusão é prematura. Outros “avanços” recentes nas tecnologias de chips chinesas foram o resultado não de inovação nativa, mas de desenvolvimentos que já estavam em andamento antes que os controles de exportação impactassem seriamente o fornecimento de chips e equipamentos semicondutores disponíveis para empresas chinesas. No final de 2023, por exemplo, observadores da política externa dos EUA ficaram chocados quando a Huawei anunciou que havia produzido um smartphone com um chip de sete nanômetros, apesar das restrições de exportação que deveriam ter tornado isso impossível. Mas, em vez de mostrar a capacidade da China de inovar tais capacidades internamente ou adquirir equipamentos ilegalmente, o avanço foi mais um resultado de empresas chinesas estocando as máquinas de litografia necessárias da empresa holandesa ASML antes que as restrições de exportação entrassem em vigor. O influxo de máquinas deu tempo à China antes que o impacto dos controles de exportação fosse visto no mercado interno.

*A inteligência artificial (IA) é uma das tecnologias mais revolucionárias do século (Foto: Ecole Polytechnique/Flickr)*

Há evidências que sugerem que o DeepSeek está se beneficiando de uma dinâmica semelhante. Pesquisadores de IA da China apontaram que ainda há data centers operando na China rodando em dezenas de milhares de chips pré-restrição. Eles também observam que o impacto real das restrições na capacidade da China de desenvolver modelos de fronteira aparecerá em alguns anos, quando chegar a hora de atualização. Ou pode aparecer depois que a arquitetura Blackwell de próxima geração da Nvidia for mais completamente integrada ao ecossistema de IA dos EUA.

Embora a conquista da DeepSeek não tenha exatamente minado a estratégia de controle de exportação dos Estados Unidos, ela levanta questões importantes sobre a estratégia mais ampla dos EUA em IA. Grande parte da conversa nos círculos de formulação de políticas dos EUA se concentra na necessidade de limitar as capacidades da China — especificamente restringindo sua capacidade de acessar poder computacional. Embora não esteja errado à primeira vista, esse enquadramento em torno do poder computacional e do acesso a ela assume o verniz de ser uma abordagem de “bala de prata” para vencer a “corrida da IA”. Esse tipo de enquadramento cria margem de manobra narrativa para argumentos de má-fé de que regular a indústria prejudica a segurança nacional — incluindo argumentos hipócritas de que governar a IA em casa prejudicará a capacidade dos Estados Unidos de superar a China.

Tais argumentos enfatizam a necessidade de os Estados Unidos ultrapassarem a China na ampliação das capacidades de poder computacional necessárias para desenvolver inteligência geral artificial (AGI) a todo custo, antes que a China “alcance”. Isso levou algumas empresas de IA a argumentar de forma convincente, por exemplo, que as externalidades negativas da construção rápida de data centers massivos em escala valem o benefício de longo prazo do desenvolvimento de AGI. Tal argumento tem um lado comercial significativo para as empresas de IA, pois elas acumulam um número maior de chips para obter uma vantagem competitiva. O que o exemplo do DeepSeek ilustra é que esse foco esmagador na segurança nacional — e no poder comptacional — limita o espaço para uma discussão real sobre as compensações de certas estratégias de governança e os impactos que elas têm em espaços além da segurança nacional.

Para preencher essa lacuna, os Estados Unidos precisam de uma melhor articulação no nível de políticas sobre o que significa uma boa governança. Isso deve incluir uma visão proativa de como a IA é projetada, financiada e governada internamente, juntamente com mais transparência do governo sobre os riscos à segurança nacional decorrentes do acesso de adversários a certas tecnologias. Também exige que o governo dos EUA seja claro sobre quais capacidades, tecnologias e aplicações relacionadas à IA ele está especificamente buscando regular. Isso ajudaria a elevar as discussões sobre risco e permitir que comunidades de prática se unam para estabelecer estratégias de governança adaptáveis nos domínios tecnológico, econômico, político e social — assim como para a segurança nacional.

Como desenvolver, implementar e governar da melhor forma as tecnologias habilitadas por IA não é uma questão que pode ser respondida com soluções “mágicas”. Em vez disso, é um processo que exige um envolvimento consistente e reflexivo de profissionais e especialistas de uma ampla variedade de áreas e experiências. Nenhuma estratégia única vencerá a “corrida da IA” com a China — e, à medida que novas capacidades surgem, os Estados Unidos precisam de uma estrutura mais adaptável para enfrentar os desafios que essas tecnologias e aplicações trarão.

O que a descoberta do DeepSeek diz (e não diz) sobre a ‘corrida da IA’ com a China

ONU alerta: 60% das famílias em Gaza não têm acesso diário à água potável em meio à crise humanitária

Não é a BYD quem está surpreendendo o mercado chinês de carros elétricos

Afeganistão pode perder até 25 mil professoras e profissionais de saúde até 2030, alerta UNICEF

Alemanha bate recorde histórico e supera EUA na produção de munição

Zelensky ameaça sancionar israelenses por compra de grãos de áreas ocupadas pela Rússia

Oceanos protegidos ultrapassam 10% pela primeira vez, mas meta global de 2030 ainda exige avanço acelerado