AIが生成するメディアが従来のメディアと見分けがつかなくなり、その過程で社会や文明が破壊される未来を危惧する人は多いが、我々はまだそこに至っていない。その証拠に、AIが生成したシュールなビールのコマーシャルが週末に流行した。

Synthetic Summer(合成された夏)」と題されたこの30秒の動画は、ロンドンを拠点とする制作会社Privateisland.tvのヘレン・パワーとクリス・ボイルによって制作され、約1週間前にインスタグラムに初めて登場した。この記事が掲載される前に2人のコメントは得られていないが、動画の見た目から判断すると、おそらくランウェイの新しいGen-2 AIモデルを使って作成したものと思われる。このAIモデルは、Stable Diffusionが静止画を作成するのと同様に、書かれた指示に基づいて短いビデオクリップを作成することができる。

人工知能で作られたビールのCM

盛り上がる群衆とスマッシュ・マウスの「All Star」に合わせたビデオでは、ステレオタイプなアメリカの裏庭でのバーベキューでパーティーをする人々のシミュラクラが映し出され、時折、印象派的なビールの器と物理的に融合する。女性たちは顎を燃やして笑う。ビールグラスは缶ビールに変わる。燃え盛るグリルは円柱状の火の竜巻となり、庭を弧を描く。シュールな地獄絵図は、見慣れたものでありながら、印象的なほど奇妙だ。

なぜ奇妙なのか?現時点では、AIビデオジェネレーターはまだ原始的なものだ。クリエイターがモデルを訓練する際、静止画像AI合成モデルよりもはるかに少ない素材セットから作業しており、モデルの実行には劇的に計算コストがかかる。ビールコマーシャルの印象主義的な見方は、おそらく実際のビールコマーシャルのエッセンスをGen-2データセットに吸収したことに由来する。ランウェイはGen-2の学習に使用したデータセットを公表していないが、Gen-1(以前のモデル)の記事では、「2億4000万枚の画像からなる社内データセットと、640万本のビデオクリップからなるカスタマイズされたデータセット」を引用している。

私たちはGen-2(現在クローズドなテスト段階にある)で実験してみたが、このような奇妙に異質なクリップを生成するにも、まだ人間の根気が必要で、OKの結果を得るために何世代も実行しては破棄している。それでも、出来上がったクリップの長さはわずか数秒だ。シンセティック・サマー』の場合、Privateisland.tvがクリップを生成し、最適なものを選び、音楽とサウンドエフェクトを加えて一連のセグメントにまとめた。

しかし、AIがミーム的な目的で虚構の宣伝をする商品はビールだけではない。4月24日、”Pizza Later “と呼ばれる人物が、“Pepperoni Hug Spot“と呼ばれる架空のレストランのために、大部分がAIによって生成された動画をツイートした。この動画には、RunwayのGen-2によって生成されたピザを食べている人々の歪んだ動画が含まれている。さらに、この動画の制作者はGPT-4でスクリプトを生成し、静止画にはMidjourneyを使い、ナレーションはEleven Labsが担当したとされている。さらに、Adobe After Effectsを使ってすべてをまとめたという。

人間によって始められ、人間によってまとめられたこの2つの作品は、生成AIが自律的に社会を変えるミームで大衆を魅了できるようになるまでには、まだ長い道のりがあることを示している。これらの異質な作品のハンドルを握っているのはまだ人間であり、そこから私たちはある種の安らぎを得ることができる可能性がある。

それでも、AIが生成したウィル・スミスがスパゲッティを食べる純粋さと荘厳さに匹敵するビデオはない。