Tesla revela novo supercomputador, o quinto mais poderoso do mundo, para treinar IA

A Tesla revelou seu novo supercomputador, que já é o quinto melhor mundo, e que atua como como predecessor do “Dojo”, que segundo a montadora de carros elétricos será o hardware mais poderoso que existiu. Atualmente, o equipamente está sendo usado para treinar as redes neurais que alimentam o piloto automático (Autopilot) e a próxima inteligência artificial (IA) direção autônoma.

Nos últimos anos, a Tesla teve um foco claro no poder da computação dentro e fora de seus veículos. No entanto, foram desenvolvidos outros supercomputadores antes do Dojo, e agora o chefe de IA da marca, Andrej Karpathy, revelou durante apresentação da “Conferência de 2021 sobre Visão Computacional e Reconhecimento de Padrões” o mais recente hardware utilizado pela empresa.

E, de acordo com a Tesla, as especificações técnicas do sistema (cluster) são bastante insanas, o suficiente para torná-lo aproximadamente o quinto computador mais poderoso do mundo:

  • 720 nós (nodes) de 8x A100 80GB. (5760 GPUs, no total)
  • 1.8 EFLOPS (720 nodes * 312 TFLOPS-FP16-A100 * 8 gpu/nodes)
  • 10 PB de armazenamento NVME “hot tier” a 1,6 TBps
  • 640 Tbps de capacidade total de comutação
  • “Temos uma rede neural bem arquitetada e temos um conjunto de dados de 1,5 petabytes que requer uma grande quantidade de computação. Então, eu queria dar uma chance a este supercomputador insano que estamos construindo e usando agora. Para nós, a visão computacional é o ‘pão com manteiga’ do que fazemos e do que habilita o piloto automático. E para que isso funcione realmente bem, precisamos dominar os dados da frota, treinar redes neurais massivas e fazer muitos experimentos. Portanto, investimos muito na computação (…) Portanto, este é um supercomputador enorme. Na verdade, acho que em termos de flops, é aproximadamente o supercomputador número 5 do mundo”, detalhou Karpathy na apresentação.

Dojo: o novo supercomputador da Tesla

Sobre o vindouro Dojo, o engenheiro da Tesla não quis entrar em detalhes, mas afirmou que será um “supercomputador ainda melhor otimizado para treinamento de rede neural do que o cluster atual” da montadora.

O CEO da empresa, Elon Musk, provoca desde 2020 sobre o projeto, que aparentemente consiste em um supercomputador exaFLOP (1.000 petaFLOPS), capaz de realizar um quintilhão (1018) de operações em ponto flutuante em um segundo – tornando-o um dos computadores mais poderosos – talvez o “número ‘ – do mundo.

Tesla tem trabalhado arduamente no Dojo nos últimos anos, e Musk tem sugerido que ele deve estar pronto no fim deste ano para um lançamento em 2022. Além disso, o CEO diz que planeja, eventualmente, disponibilizar seus supercomputadores para outras empresas treinarem suas redes neurais neles.