われわれのゲスト共作者、藍 莫(らん もう)、ビデオゲームにおける人生シミュレーションにAIを利用することについて語ります。彼はかつてEAでプロダクトリーダーとして、この分野のクラシック作品であるThe Simsに携わりました。現在は、限界を拡張したいと考えています。
人生、友情、そしてコンパニオンをシミュレートすることは、ビデオゲームにおける絶え間ない追求です。Tamagotchiやポケモンなどでのシンプルな実装から、The Simsのような複雑な人生シミュレーションまで、仮想コンパニオンの組み込みは何百万ものプレイヤーの心に深く触れ、いくつかの持続的なフランチャイズの基盤を形成してきました。
デジタルコンパニオンを創造するプロセスは、本質的には感受性の本質をよりよく理解するための探求でもあります。そして、後に見ていくように、使用される技術はゲーム以外にも広範な適用があるでしょう。
特にAIがより強力になるにつれて、テクノロジーには新たな可能性が広がっています。デジタルな人生とコンパニオンを再構築するための新しいチャンスが生まれています。このエッセイは2つの部分に分かれています。第1部では、デジタルな人生シミュレーションの重要な節目のいくつかをたどります。第2部では、私たちProximaのこの探求を進める努力について探求します。では、始めましょう!(われわれのゲスト共作者、藍 莫(らん もう)、ビデオゲームにおける人生シミュレーションにAIを利用することについて語ります。彼はかつてEAでプロダクトリーダーとして、この分野のクラシック作品であるThe Simsに携わりました。現在は、限界を拡張したいと考えています。
人生、友情、そしてコンパニオンをシミュレートすることは、ビデオゲームにおける絶え間ない追求です。Tamagotchiやポケモンなどでのシンプルな実装から、The Simsのような複雑な人生シミュレーションまで、仮想コンパニオンの組み込みは何百万ものプレイヤーの心に深く触れ、いくつかの持続的なフランチャイズの基盤を形成してきました。
デジタルコンパニオンを創造するプロセスは、本質的には感受性の本質をよりよく理解するための探求でもあります。そして、後に見ていくように、使用される技術はゲーム以外にも広範な適用があるでしょう。
特にAIがより強力になるにつれて、テクノロジーには新たな可能性が広がっています。デジタルな人生とコンパニオンを再構築するための新しいチャンスが生まれています。このエッセイは2つの部分に分かれています。第1部では、デジタルな人生シミュレーションの重要な節目のいくつかをたどります。第2部では、私たちProximaのこの探求を進める努力について探求します。では、始めましょう!)
出発点:ビデオゲームにおける「生活」のスクリプト
現代のビデオゲームプログラミングの出発点はスクリプティングです。スクリプティングは広い意味を持つ用語で、非常にシンプルなプログラムから複雑な意思決定木や状態マシンまで様々な概念を含みます。しかし、本質的にスクリプティングは「真の知性」ではなく、あらかじめ定義されたルールに従う決定論的な応答を扱います。つまり、冒険の本のデジタルバージョンであり、プレイヤーが自分自身の進む道を選択することができるものです。
機械的な性質であるにもかかわらず、スクリプティングは没入感を作り出すために非常に強力です。BioWareの人気作品であるMass EffectやDragon Ageは、スクリプティングを使ってプレイヤーのコンパニオンとの深い関係の機会を創り出しています。プレイヤーの選択に応じて、プレイヤーは背景のストーリーを解き明かし、ゲームの結果に影響を与え、デジタルのコンパニオンとロマンチックな関係を築くことさえできます。これらの二つのフランチャイズの人気は、人間によって創り出された没入型ストーリーテリングの力の証です。
スクリプティングに関連する課題は、結局のところスケーラビリティです。デザイナーは各インタラクションを手動で設計するだけでなく、プレイヤーの可能な選択のすべての組み合わせを考慮する必要があります。これにより、プレイヤーの経験が進むにつれて、コンテンツのコストが指数関数的に増加します。以下の例を考えてみましょう:プレイヤーが特定のインタラクションで3つの異なるオプションを選択するとします。その選択に基づいて3つの新しいオプションが生じ、それが続いてゲーム全体で30の選択肢になります。これらの意思決定のシーケンス(重複がないと仮定します)は、地球上の砂粒よりも多くの事前にプログラムされたシナリオを必要とします!明らかに、大規模な没入を創り出すためには異なるアプローチが必要です。
The SimsとユーティリティベースのAI
EAのThe Simsフランチャイズで働く機会を得ましたが、そのフランチャイズがどれほどの情熱を引き起こすかを見ることができて素晴らしい経験でした。現在、The Simsを遊んでいる人は7000万人以上に上ります。第4版のゲームは既に20億ドル以上の収益を上げ、人気は今もなお高まっています。
このフランチャイズの核心にあるのはSimsです。彼らは自立したデジタルなコンパニオンで、独自のニーズ、好み、欲望を持っています。プレイヤーは彼らを時折制御したり、より広い環境を作り上げたりできます。しかし、これらのエージェントは自分たちの人生を完全に自律的に過ごすことができます。Mass Effectのような事前に計画されたストーリーや脚本ではなく、The Simsはこれらの自律的なコンパニオンたちによって形成される進行中の物語に重点を置いています。単純に言えば、The Simsは人生のシミュレーションです。
The Simsの創造者であるウィル・ライトは、彼の「バーチャルドールハウス」に向けて2つの情報源を参照しました。1つ目は、マズローの「人間の動機づけの理論」で、そこでは人間の欲求が階層的に分類されています。2つ目はチャールズ・ハンプデン=ターナーの著書「マインドの地図」で、ここでは思考がカタログ化され整理されています。
これら2つの情報源の組み合わせがThe SimsのAIエンジンをインスパイアし、それが「ユーティリティベースのAI」として知られるようになりました。このシステムでは、AIは2つの要素、すなわちコモディティ(commodities)とユーティリティ(utility)をバランスさせます。コモディティは、各Simの内部状態、つまり心理的なニーズを表します。ユーティリティ曲線は、これらのコモディティを満たす手段を表します。例えば、内部のニーズ(コモディティ)として「空腹」というものがあり、さまざまな食べ物の選択肢(料理するか残り物を温めるかなど)が、このニーズを満たす手段として考えられます。AIは同時に何百ものニーズと関連する意思決定を評価し、それらを優先順位付けして決定を下します。多くの点で、これは私たち人間が意思決定をする方法とあまり変わりません!
ただし、The SimsのAIの多くの成功にもかかわらず、何かが欠けているように感じられます。各Simは自らの即時のニーズの枠内に閉じこもっており、自分たちのニーズ以外のプレーヤーとのつながりを築く能力が欠けています。真の関係は単なる最適化を超えています。それは共に学び、経験し、成長することを含みます。これを達成するには、別のアプローチが必要です。
Black & Whiteと強化学習
ゲームBlack & Whiteは2001年に発売されました。Black & Whiteは、プレイヤーが不運な市民を統治する神のような存在として活動する「神のゲーム(god-game)」でした。しかし、真の主役は、プレイヤーが間接的に影響を与える仲間のクリーチャーでした。そのクリーチャーは養うことも破壊することもでき、独自の意図と欲望を持っていました。
プレイヤーは直接クリーチャーを制御することはできませんでしたが、報酬や罰(例:撫でることや叩くこと)によってその決定に影響を与えることができ、時間の経過と共に、これらの行動を通じてクリーチャーを善か悪かの方向に形作ることができました。それが「Black & White」という名前の由来です。
プレイヤーには気づかれることなく、クリーチャーは強化学習のアルゴリズムによって制御されていました。プレイヤーの行動、例えば撫でることや叩くことが、クリーチャーの欲求、信念、意図を時間と共に形作るトレーニングデータとなりました。単純に言えば、クリーチャーは学習することができたのです。
Black & Whiteは、ゲームに最新の人工知能を導入した最初の作品の1つでした。これは商業的、評価的にも成功し、IGNはそれを「奇跡の体験」と呼びました。しかし、Black & Whiteは当時のアルゴリズムと処理能力に厳しく制約されていました。当時のプロセッサは現在の力のごく一部でしかありませんでしたし、AIの現代的な処理に必要な専用のGPUはまだ初期段階にありました。
しかし、ゲームと先端技術との親密な関係を示す兆しとして、Black & Whiteの物語はそこで終わりませんでした。ゲームのAIプログラマーは若きエンジニアで、デミス・ハサビスという名前でした。Black & Whiteや他のゲーム業界での冒険の後、ハサビスは認知神経科学の博士号を取得するために学校に戻りました。卒業後、ハサビスは人工知能企業DeepMindを創設し、現在もそのCEOです。2014年、DeepMindはGoogleに約5億ドルで買収され、2016年には同社のAlphaGoプログラムが囲碁の世界チャンピオンを破るという快挙を達成しました。今日、DeepMindの強化学習技術はタンパク質の構造予測から風力発電所の効率向上まで、さまざまな分野で活用されています。これがすべて、ゲームでデジタルコンパニオンを作り始めたことから始まったと考えると興味深いですね。
今日とこれから
最近の人工知能の革新により、ゲームでの人生シミュレーションへの関心が再燃しました。一つのアプローチは、このElder Scrollsのモッドのように、会話型のチャットボットをゲームに直接組み込むことです。このアプローチは魅力的です。ゲームのアバターにチャットボットを接続し、音声認識とテキスト音声変換を統合し、ゲームの世界観をふんだんに追加すれば、本物の会話をするNPCが完成します!
しかし、このような実装は比較的表面的であり、本物の人生のシミュレーションとは言えません。ゲームは単にチャットボットの舞台として機能し、これらの体験の新鮮さはすぐに失われることがあります。
対照的に、より深い実装例がMinecraft Voyagerプロジェクトです。このプロジェクトでは、LLMによって制御されるエージェントがMinecraftの世界を探索し、人間の介入なしでスキルを習得していきます。エージェントは自分自身でタスクを提案し、知識のライブラリを構築し、その学習を活用して発展していきます。人間のガイダンスなしに、VoyagerはMinecraftの世界に意味を与え、自分自身の家を建て、最終的にダイヤモンドを採掘しました。
我々が注目した2つの点は、エージェントが自分の世界に意味を与える能力と、経験を通じて長期的な記憶を形成する能力です。では、これらの能力を単なる自律的なゲームエージェントとして利用するのではなく、本物の人生とコンパニオンをより良くシミュレートするために活用できるでしょうか?
プロトタイプ・ルマリ
私たちが達成したい目標の出発点として、犬のネーモという瞬間を考えてみてください。
- 知覚:ネーモは見知らぬ怖い見た目の人が自分の飼い主に近づいてくるのを見ます。
- 入力:飼い主は大声で叫び、腕を振ります。
- 記憶と個性:ネーモは自分が飼い主の保護者であり、飼い主が脅威にさらされているときは勇敢であることを思い出します。
一瞬で、ネーモはこれらすべてを解釈し、決断を下します。彼はすばやく行動し、飼い主と侵入者の間に飛び込んで唸り声をあげ、攻撃の用意をします。その後、ネーモは勇敢さを賞賛され、おやつで褒められ、彼の行動が強化されます。
しかし、もしネーモが勇敢ではなく臆病だったらどうでしょうか?彼は遠くから吠えることを選びますか?もし侵入者が実は飼い主が喜ぶ友人だった場合はどうでしょうか?ネーモは友人に対して唸ったことで叱られ、それを次回に覚えるでしょうか?これらの瞬間は予めプログラムできないリアルな人間関係のニュアンスを浮き彫りにします。しかし、これらの瞬間こそがコンパニオンを本物らしく、オーセンティックに感じさせるものです。私たちは現代の技術が、これら微妙な関係にアプローチし始めるほど進化したと信じています。
多くの現代のAIモデルは、transformersとして知られるニューラルネットワークのアーキテクチャに依存しています。transformersは、複数の大規模で多様なデータソースのコンテキストと依存関係を理解することに優れています。ゲーム内での人生のシミュレーションでは、これらのデータソースは記憶、知覚、ユーザーのコマンドなどを表すことができます。これをより理解するために、私たちはネーモを実際の犬から仮想のコンパニオンに変えてみましょう。
- 知覚:私たちは、3Dのゲームワールドを自然言語にリアルタイムに変換するシステムを構築しました。これにより、ネーモは常に周囲の世界を「知覚」することができます。
- 記憶、個性、意図:これらはデジタルで保存され解釈され(ベクトルファイルなどとして)、新しい経験によって常に進化します。これはまるで現実のようです。
- ユーザーの入力:プレイヤーの音声コマンドに対応するために音声認識を追加しました。しかし、これらのコマンドは他の形式のコントロール入力でも容易に行えます。
以下は、プロトタイプのデモンストレーションを含めています。
上記のシナリオを実現するために、知覚、記憶、ユーザーのコマンド、その他の情報から「意図を行動に変換する」ための大規模な言語モデルの最初の層を適用しました。ネーモの場合、出力は「ああ、飼い主が危険にさらされている。飼い主を守らなければ!」のようなものになります。
しかし、この意図はまだゲーム内のアクションにはなりません。これを実現するために、意図をリアルタイムで実行可能なゲームコマンドに変換するための大規模な言語モデルの2番目の層を導入する必要があります。「意図をアクションに変換する」のは特に難しく、そのコンテキスト内で実行可能なアクションの多様性を理解する必要があります。間違ったコマンドはゲームをクラッシュさせる可能性があるためです。そのため、ゲームロジックのエラーを自動的に修正し、リアルタイムでゲームの状態を変化させるAIシステムの3番目の層も追加しました。
最後に、観察と結果を記憶に記録する「リアルタイム学習」システムを追加しました。これにより、各アクションがネーモの長期記憶の一部に影響を与え、将来の決定の結果に影響を与えることができます。私たちは、この連続的な学習能力が将来の生活シミュレーションの中心的な要素になると考えています。
さらなる注釈:私たちはネーモを世界から分離して作成しました。ネーモはリアルタイムで周囲の世界を知覚し、解釈し、学習します。これは、私たちプレイヤーが行うように、彼自身が行動することを意味します。これは、従来のNPCのアプローチとは異なり、「世界の一部」として構築されたものではありません。ネーモのアーキテクチャは、彼を「環境から解放」し、プレイヤーと一緒に新しい経験を作り出すことを可能にし、将来的にはプレイヤー自身によって創造される無数の冒険の機会を提供します。
インプリケーションと将来
ゲーム内での生活のシミュレーションとコンパニオンシップには重要な意味があります。商業的には、これはThe Simsなどの最も持続的で収益性の高いフランチャイズの一部になっています。プレイヤーにとって、これらのコンパニオンはゲームへの参加を深める力を持っています。ゲーム以外でも、これらの探求は人間の関係と経験に対するより深い理解を象徴しています。
はっきりと述べると、まだ多くの課題や未解決の要素があります。そして、まだ解決していないパズルの多くがあります。同時に、技術革新のペースは見るものを驚かせるほど速いです。メタのオープンソースの基本モデルがリリースされて数週間後、研究者は高度なレベルで優れた特定のアプリケーション向けの軽量なモデルを訓練しました。
先端技術とモデルはその一部に過ぎません。真に新しい、没入型の体験を作り出すためには、ゲーム開発者が革新的な技術と深い芸術的なスキルを融合させる必要があります。私たちはProximaで、この次世代のインタラクティブな体験を構築するためにこれらの境界を押し広げることにワクワクしています。私たちはまだこの旅の初めに立っており、構築することを目指すものはまだたくさんあります。私たちは一人で学ぶよりも、一緒に学ぶことが一番だと信じています。
The Decoderの情報を元にしています。