Googleがプロジェクトジェミニの存在を確認しました。GoogleはGoogle I/OでPaLM-2を発表し、これを次世代の言語モデルと呼びました。
先代のPaLMと比較して、PaLM-2はより多くの言語を話し、より優れた推論とコーディングができると言われています。PaLM-2は、100以上の異なる言語、多数の科学論文、数学のウェブサイト、およびコードデータベースからテキストを学習しました。
最小のPaLM-2モデルは、モバイルデバイスでの実行が期待されています。
詳細なサイズについては不明ですが、Googleによれば、このモデルはGecko、Otter、Bison、Unicornという4つの異なるサイズで提供される予定です。最小のGeckoモデルは、モバイルデバイスでの実行が可能で、デバイスがオフラインの場合でもデバイス内で対話型のアプリケーションを実行できます。
PaLM-2は、GoogleのチャットボットBardをはじめ、GmailやGoogle DocsなどのワークアプリケーションのAI機能を支えています。Googleの言語モデルは、Med-PaLM-2(医学向け)とSec-PaLM(サイバーセキュリティ向け)の2つの専門バリエーションでも利用可能です。Med-PaLM-2モデルには、直接X線を評価するなどのマルチモーダルな機能が追加されます。
aLM-2および特別なモデルは、GoogleのPaLM APIを介して制約付きで利用可能です。
「プロジェクトジェミニ」はすでに開発中です。
PaLM-2の発表とともに、GoogleはBrainチームとDeepMindチームの合併と「プロジェクトジェミニ」の噂についてもコメントしました。チームは「次世代のAIモデルへの道を築いており、すでにGoogleの次世代のマルチモーダルモデルであるGeminiに取り組んでいます。」と述べました。
Googleによれば、Geminiは最初からマルチモーダルであり、ツールとAPIを効率的に統合できる高度な能力を備え、メモリやプランニングなどの将来の革新に対応するよう設計されています。Geminiはまだトレーニング中ですが、Googleの発表によれば、以前のモデルでは見られなかったマルチモーダルの機能を既に示しています。
Googleは述べています。「セキュリティの厳格なテストおよび調整が行われた後、GeminiはPaLM 2と同様にさまざまな製品、アプリケーション、デバイスに展開できる予定です。これにより、すべての人々に利益をもたらすことができます。」