No Twitter, a equipe de IA da Tesla está compartilhando seus planos para modelos fundamentais para robôs autônomos, como o Tesla Bot.

O objetivo da Tesla com o Tesla Bot é criar um robô humanoide universal, autônomo e bípede capaz de realizar tarefas perigosas, repetitivas ou entediantes. Assim como em outros projetos de robótica, a Tesla espera alcançar esse objetivo usando modelos fundamentais para robôs autônomos.

Esses modelos são treinados com grandes quantidades de dados, e suas capacidades gerais formam a base para aplicações especializadas. Na área de linguística computacional, o GPT-4 é um exemplo desse tipo de modelo.

A Tesla conta com o uso de grandes volumes de dados (incluindo vídeo)

Para os modelos robóticos, a Tesla planeja contar com redes neurais multimodais já utilizadas nos veículos autônomos da Tesla. Essas redes processam múltiplas modalidades, como vídeo da câmera, mapas, navegação, IMU (Unidade de Medição Inercial) ou GPS para prever se há veículos, ciclistas, pessoas ou outros objetos no caminho.

Vídeo: Tesla

De acordo com a equipe de IA da Tesla, essas redes também podem ser usadas para evitar colisões em qualquer robô. Todos os dados da frota inteira também são usados para reconstruir seções da estrada sobre as quais a IA pode ser treinada ainda mais. Além disso, a equipe está desenvolvendo modelos generativos que podem, por exemplo, produzir pequenos clipes de vídeo novos nos quais o veículo se comporta de maneira diferente com base em diversos dados do mundo real.

Vídeo: Tesla

Isso aumenta a quantidade de dados disponíveis – um requisito básico para os modelos fundamentais. Um breve clipe também mostra como um Tesla Bot ou sistema semelhante coleta dados em escritórios.

Vídeo: Tesla

Modelos fundamentais de vídeo como “cérebro” do robô Optimus

Juntos, eles criarão modelos fundamentais de vídeo que formam o “cérebro” de carros e robôs. O Google também está experimentando com modelos fundamentais desse tipo para robôs e mostrou que eles podem ser usados para construir robôs melhores com o seu Robotic Transformer multimodal.

A Tesla tem uma clara vantagem de dados, pelo menos na área de direção autônoma, e também poderia coletar os dados necessários para modelos fundamentais de robôs com o robô Optimus planejado para produção em massa.

Para isso, é necessário poder de computação, e a Tesla pretende fazer com que seu próprio supercomputador Dojo alcance 100 exaflops até outubro de 2024, o equivalente a cerca de 400.000 GPUs Nvidia A100. A interessante visão sobre seus planos, no entanto, é principalmente uma tentativa de recrutar os especialistas que a Tesla está desesperadamente procurando.