En Twitter, el equipo de inteligencia artificial de Tesla está compartiendo sus planes para modelos fundamentales de robots autónomos, como el Tesla Bot.
El objetivo de Tesla con el Tesla Bot es crear un robot humanoide bípedo, autónomo y universal capaz de realizar tareas peligrosas, repetitivas o tediosas. Al igual que con otros proyectos de robótica, Tesla espera alcanzar este objetivo utilizando modelos fundamentales para robots autónomos.
Estos modelos se entrenan con grandes cantidades de datos, y sus capacidades generales constituyen la base de aplicaciones especializadas. En el ámbito de la lingüística computacional, GPT-4 es un ejemplo de este tipo de modelos.
Tesla confía en el uso de grandes cantidades de datos (incluido el vídeo)
Para los modelos robóticos, Tesla planea basarse en redes neuronales multimodales ya utilizadas en los vehículos autónomos de Tesla. Estas redes procesan múltiples modalidades como vídeo de cámara, mapas, navegación, IMU (Unidad de Medición Inercial) o GPS para predecir si hay vehículos, ciclistas, personas u otros objetos en el camino.
Según el equipo de IA de Tesla, estas redes también pueden utilizarse para evitar colisiones en cualquier robot. Los datos de toda la flota se utilizan también para reconstruir tramos de carretera en los que se puede seguir entrenando a la IA. Además, el equipo está desarrollando modelos generativos que pueden, por ejemplo, producir nuevos videoclips cortos en los que el vehículo se comporta de forma diferente en función de diversos datos del mundo real.
Esto aumenta la cantidad de datos disponibles, un requisito básico para los modelos fundamentales. Un breve clip muestra también cómo un Tesla Bot o un sistema similar recopila datos en las oficinas.
Modelos fundamentales de vídeo como «cerebro» del robot Optimus
Juntos, crearán modelos de vídeo fundamentales que formarán los «cerebros» de coches y robots. Google también está experimentando con estos modelos fundamentales para robots y ha demostrado que pueden utilizarse para construir mejores robots con su Robotic Transformer multimodal.
Tesla tiene una clara ventaja en materia de datos, al menos en el ámbito de la conducción autónoma, y también podría recopilar los datos necesarios para los modelos fundamentales de robots con el robot Optimus, cuya producción en serie está prevista.
Tesla is building the foundation models for autonomous robots pic.twitter.com/VUES9jU3ze
— Tesla AI (@Tesla_AI) June 21, 2023
Para ello, se requiere poder de computación, y Tesla tiene previsto que su propio superordenador Dojo alcance los 100 exaflops para octubre de 2024, lo que equivale a aproximadamente 400,000 GPU Nvidia A100. La interesante visión de sus planes, sin embargo, se centra principalmente en reclutar a los expertos que Tesla está buscando desesperadamente.