A Tesla revelou seu novo supercomputador, que já é o quinto melhor mundo, e que atua como como predecessor do “Dojo”, que segundo a montadora de carros elétricos será o hardware mais poderoso que existiu. Atualmente, o equipamente está sendo usado para treinar as redes neurais que alimentam o piloto automático (Autopilot) e a próxima inteligência artificial (IA) direção autônoma.
Nos últimos anos, a Tesla teve um foco claro no poder da computação dentro e fora de seus veículos. No entanto, foram desenvolvidos outros supercomputadores antes do Dojo, e agora o chefe de IA da marca, Andrej Karpathy, revelou durante apresentação da “Conferência de 2021 sobre Visão Computacional e Reconhecimento de Padrões” o mais recente hardware utilizado pela empresa.
E, de acordo com a Tesla, as especificações técnicas do sistema (cluster) são bastante insanas, o suficiente para torná-lo aproximadamente o quinto computador mais poderoso do mundo:
- 720 nós (nodes) de 8x A100 80GB. (5760 GPUs, no total)
- 1.8 EFLOPS (720 nodes * 312 TFLOPS-FP16-A100 * 8 gpu/nodes)
- 10 PB de armazenamento NVME “hot tier” a 1,6 TBps
- 640 Tbps de capacidade total de comutação
- “Temos uma rede neural bem arquitetada e temos um conjunto de dados de 1,5 petabytes que requer uma grande quantidade de computação. Então, eu queria dar uma chance a este supercomputador insano que estamos construindo e usando agora. Para nós, a visão computacional é o ‘pão com manteiga’ do que fazemos e do que habilita o piloto automático. E para que isso funcione realmente bem, precisamos dominar os dados da frota, treinar redes neurais massivas e fazer muitos experimentos. Portanto, investimos muito na computação (…) Portanto, este é um supercomputador enorme. Na verdade, acho que em termos de flops, é aproximadamente o supercomputador número 5 do mundo”, detalhou Karpathy na apresentação.
Dojo: o novo supercomputador da Tesla
Sobre o vindouro Dojo, o engenheiro da Tesla não quis entrar em detalhes, mas afirmou que será um “supercomputador ainda melhor otimizado para treinamento de rede neural do que o cluster atual” da montadora.
O CEO da empresa, Elon Musk, provoca desde 2020 sobre o projeto, que aparentemente consiste em um supercomputador exaFLOP (1.000 petaFLOPS), capaz de realizar um quintilhão (1018) de operações em ponto flutuante em um segundo – tornando-o um dos computadores mais poderosos – talvez o “número ‘ – do mundo.