自律走行用のAIモデルは、交通ルールの内外を問わず、数多くの交通状況を映像から学習する必要がある。しかし、学習材料がボトルネックとなっている。

合成データは、まだ大規模な車両を実際の交通に乗せていないメーカーも含め、すべてのメーカーにとってこのボトルネックを軽減するのに役立つ。2017年に設立され、自律走行モデルのためのディープラーニング技術を専門とする英国企業Wayve社のGAIA-1生成AIモデルは、まさにこのタスクのために設計されている。GAIAは「Generative Artificial Intelligence for Autonomy」の略。

道路交通のためのマルチモーダルな「世界モデル

GAIA-1は、ビデオ、テキスト、車両情報を含む運転データのマルチモーダルコーパスで学習された。言語モデルがシーケンスの次の文字を予測するように学習するのと同様に、GAIA-1もビデオシーケンスの次のフレームを予測するように学習した。

しかしウェイヴによれば、GAIA-1は「標準的な生成ビデオモデル」ではない。その代わりに、さまざまな車両とその特徴、道路、建物、信号機など、「運転の重要な概念を理解し、解明するために学習する」「真の世界モデル」である。

GAIA-1の真のすばらしさは、私たちが住む世界を支える生成的ルールを顕在化させる能力にある。多様な運転データに対する広範なトレーニングを通じて、我々のモデルは現実世界に内在する構造とパターンを合成し、驚くほどリアルで多様な運転シーンを生成することができます。

ウェイヴ

この確かな論文の証拠として、WayveはGAIA-1が数秒間の入力映像から「拡張されたもっともらしい未来」を生成する能力を挙げている。AIが未来を見れば見るほど、短い入力の重要性は薄れていった。その後生成されたシーンには、ソースの内容はまったく含まれていなかった。

「これは、GAIA-1が我々の住む世界を支えるルールを理解していることを示している」とウェイヴは書いている。シミュレートされた運転挙動は、駐車中や移動中の車の環境と同様、リアルである。

このモデルは、動いている車と環境の両方にさまざまな設定ができるように設計されている。例えば、トレーニングデータに含まれていない運転状況をシミュレートすることができる。これは、例えば、自律走行用のAIモデルを評価するために使用できる危険な運転状況をシミュレートするのに有用である。GAIA-1は、市街地運転のためのモデルベース模倣学習の研究に基づいている。

テキストから交通情報へ

GAIA-1は、以下のビデオで複数のバスの間をナビゲートするような特定のシーンを作成するために、自然言語で指示することができる。

シーンがすでに実行されている場合でも、テキストを挿入することで修正することができます。以下の動画では、「夜なのでヘッドライトをつけます」というフレーズから夜間走行が生成されています。

Wayveは、このモデルを「複雑な実世界のシナリオをより効率的にナビゲートする自律システムをよりよく訓練するユニークな方法」と説明し、自律走行用の独自のAIモデルをさらに開発するために使用する計画だ。Wayveは今後数ヶ月のうちにGAIA-1に関する詳細情報を発表する予定である。