ゲームの世界と人工知能が完全に融合するとき……見た目もそうだが、音ももっと良くなることを期待したい。
台北で開催されたComputex 2023で、NvidiaのCEOであるジェンセン・フアンは、ゲームとAIが出会うときがどのようなものになるのかを、サイバーパンクのラーメン屋を再現したビジュアルで垣間見せた。
ダイアログの選択肢をクリックする代わりに、ボタンを押しながら自分の声で何かを言うだけで、ビデオゲームのキャラクターから反応が返ってくるようなイメージだ。Nvidiaはこれを「ゲームの未来を垣間見る」と呼んでいる。
残念ながら、実際の会話には不満が残る。次はGPT-4かSudowriteを使ってみてはどうだろう、Nvidia?
次はGPT-4かSudowriteを使ってみてください、Nvidiaさん:
プレイヤー:やあジン、元気かい?
ジン:残念ながら、あまりよくないよ。
どうして?
この辺の犯罪が心配なんだ。最近ひどくなってるんだ。うちのラーメン屋も巻き込まれたんだ。
手伝おうか?
どうにかしたいなら、青木公文という有力な犯罪組織のボスが街を混乱させているという噂を聞いたことがある。彼がこの暴力の根源かもしれない。
彼に話を聞こうと思うのですが、どこで会えますか?
街の東側の地下ファイトクラブに出入りしていると聞いている。そこに行ってみてください
わかった。
気をつけろよ、カイ。
たった1つの会話の動画を見るだけでは、これがNPCのダイアログ選択肢から選ぶよりも優れているとは思えないが、印象的なのは、生成AIが自然な会話に反応している点だ。願わくば、Nvidiaがデモを公開し、私たち自身で試してみて、根本的に異なる結果が得られることを期待したい。
このデモはNvidiaがConvaiと共同で開発したもので、制作に使用したツール、具体的にはNvidia ACE(Avatar Cloud Engine)for Gamesと呼ばれるミドルウェア・スイートで、ローカルでもクラウドでも実行できる。ACEスイートには、広範な言語モデル(LLM)を展開するための同社のNeMoツール、音声テキスト変換およびテキスト音声変換のためのRiva、その他のコンポーネントが含まれています。
重要なのは、デモがこれらのツール以上のものを利用していることだ。アンリアル・エンジン5で構築され、レイトレーシングを多用したレンダリング……そして視覚的にも印象的で、それに比べるとチャットボットの部分はやや物足りない。この時点で、私たちはチャットボットのもっと魅力的な対話を見てきた。たとえそれが時に陳腐で派生的であったとしても。
Computexのプレビューで、NvidiaのGeForceプラットフォーム担当副社長のジェイソン・ポールは、このテクノロジーは一度に複数のキャラクターに拡張でき、理論的にはNPC同士が会話することも可能だと述べた。
デモのような方法でACEツールセットをフルに採用する開発者がいるかどうかは不明だが、『S.T.A.L.K.E.R. 2 Heart of Chernobyl』と『Fort Solis』では、Nvidiaが「Omniverse Audio2Face」と呼ぶ部分が利用され、3Dキャラクターのフェイシャル・アニメーションと声優の発話との同期が試みられる。
The Vergeからの情報です。