研究者は、3DコンピュータビジョンとジェネレーティブAIのAI開発を促進するために、1,000万以上の3DオブジェクトのデータセットであるObjaverse-XLを発表した。

AIの進歩は、大量の学習データへのアクセスの増加によって推進されてきた。これは、ウェブから収集された膨大なデータセットで訓練されてきたテキストや画像の生成AIシステムにも当てはまる。

AIの次のフロンティアの1つである3Dコンピュータビジョンと3DのためのジェネレーティブAIは、高品質の3Dデータを取得することの難しさのために遅れている。

Objaverse-XLには1000万個の3Dオブジェクトが含まれている。

この問題に対処するため、研究者チームは1,000万以上の3Dオブジェクトからなる大規模なコレクション、Objaverse-XLを公開した。

Objaverse-XLは、Sketchfab、Thingiverse、Polycamなど、さまざまなオンライン・ソースから収集されたもので、4月にリリースされたObjaverseデータセットの10倍に拡張された。

当時、Sketchfabは、データは彼らやアーティストの知らないうちに大量に収集されたものだと主張していた。2月、Sketchfabはこれを防ぐために “NoAI “というタグを導入したが、結果的には遅すぎた。

Zero123は、3D用のジェネレーティブAIモデルである。

研究者たちは、Objaverse-XLを使用して、斬新な視覚化合成モデルの学習に成功した。得られたモデルZero123-XLは、フォトリアリスティックなアセット、漫画、イラスト、スケッチなど、さまざまな複雑なモダリティにわたって強力な汎化能力を実証した。

研究者らによると、Objaverse-XLを使った3D視覚タスクの実験では、データが数千から1千万アセットに増加するにつれて、有望なスケーラビリティの傾向が示されたという。このため、数十億のオブジェクトを含むさらに大規模なデータセットがあれば、これらのAIモデルの潜在能力がさらに高まる可能性があると研究者らは考えている。

Objaverse-XLとZero123は、アレンAI研究所、コロンビア大学、UWCSE、Stability AI、LAION、カリフォルニア工科大学の共同研究の成果である。

研究者らは、Objaverse-XLが最先端のモデルの性能を大幅に向上させ、拡張現実や仮想現実などの分野での応用を可能にすることで、3D向けAIの進歩を促進すると確信している。