Google DeepMindは、AlphaGoの能力と、OpenAIのChatGPTを支える技術であるGPT-4のような高度な言語モデルを組み合わせたGeminiと呼ばれるAIシステムを開発している。
ディープマインドのデミス・ハサビス最高経営責任者(CEO)はワイアードに対し、強化学習における同社の専門知識が、ジェミニに際立った能力を提供できると語った。強化学習や木探索といったAlphaGoの技術を活用することで、Geminiは問題解決やプランニングといった新たな機能を提供することを目指している。
「大まかに言えば、ジェミニは、AlphaGoタイプのシステムの利点のいくつかと、高度なモデルの驚くべき言語能力を組み合わせたものと考えることができます。また、非常に興味深い新機軸もいくつかあります”
デミス・ハサビス
Geminiは5月に正式に発表され、ハサビスによれば、あと数カ月は開発とトレーニングが行われる予定だ。Geminiは、これまでのモデルにはなかったマルチモーダル機能を持ち、ツールやAPIを統合するのに非常に効率的だと言われている。
ワイアードによると、このシステムの開発には数千万ドルから数億ドルの費用がかかる可能性があり、ChatGPTやその他のジェネレーティブAI技術に対するグーグルの対応において重要な役割を果たす可能性があるという。
Geminiは様々なサイズが用意され、記憶や計画といった将来のイノベーションをサポートするように設計されている。3月の噂では、GPT-4が持つと言われているように、このモデルは1兆個のパラメーターを持つとされている。このプロジェクトでは、数万個のグーグルのTPU AIチップがトレーニングに利用される見込みだ。
一方、OpenAIのCEOであるサム・アルトマンによると、GPT-5のリリースはまだ先で、トレーニングを開始するのは少なくとも半年後だという。2024年の発売が有力なようだ。グーグル・ディープマインドは、ジェミニの発売時期を明らかにしていない。