テスラのAIチームはツイッターで、テスラボットなどの自律型ロボットの基本モデルの計画を共有している。

テスラ・ボットに関するテスラの目標は、危険な作業や反復的な作業、退屈な作業をこなせる、普遍的で自律的な二足歩行の人型ロボットを作ることだ。他のロボット工学プロジェクトと同様、テスラは自律型ロボットの基本モデルを使用することでこの目標を達成したいと考えている。

これらのモデルは大量のデータで訓練され、その一般的な能力が特殊なアプリケーションの基礎となる。計算言語学の分野では、GPT-4がそのようなモデルの一例である。

テスラは大量のデータ(ビデオを含む)の利用に依存している。

ロボットモデルについては、テスラはすでにテスラの自律走行車で使用されているマルチモーダルニューラルネットワークに依存する計画だ。これらのネットワークは、カメラ映像、地図、ナビゲーション、IMU(慣性計測装置)、GPSなど複数のモダリティを処理し、邪魔な車両や自転車、人などがいるかどうかを予測する。

ビデオテスラ

テスラのAIチームによると、これらのネットワークはあらゆるロボットの衝突回避にも利用できるという。また、全車両の全データは、AIがさらに訓練できる道路のセクションを再構築するために使用される。さらに、チームは、例えば、現実世界の様々なデータに基づいて、車両が異なる動作をする短い新しいビデオクリップを生成できる生成モデルを開発している。

ビデオテスラ

これにより、利用可能なデータ量が増加する。これは、基本的なモデルの基本要件である。短いクリップでは、テスラボットや同様のシステムがオフィスでデータを収集する様子も紹介されている。

ビデオテスラ

ビデオ Optimusロボットの「脳」としての基本モデル

テスラは、自動車やロボットの “頭脳 “となる基本的なビデオモデルを作成する予定だ。グーグルもこの種のロボットの基本モデルを実験しており、マルチモーダルなロボティック・トランスフォーマーでより優れたロボットを作るために使えることを示している。

テスラは、少なくとも自律走行の分野では明確なデータ優位性を持っており、量産が計画されているオプティマスロボットでロボットの基本モデルに必要なデータを収集することもできる。

そのためにはコンピューティングパワーが必要で、テスラは2024年10月までに自社のスーパーコンピューター「Dojo」を100エクサフロップスに到達させることを目指している。これは、Nvidia A100 GPU約40万個分に相当する。しかし、その計画に関する興味深い洞察は、主にテスラが切実に求めている専門家をリクルートする試みである。