新しいGeminiマルチモーダルAIモデルにより、Googleは少なくともOpenAIのGPT-4に追いつくことを目指しています。最初のテストが進行中です。

The Informationの匿名の情報源3人によると、GoogleはGeminiのシンプルなチャットバージョンを一部の選ばれた企業に提供しました。これらの情報源3人は、この件について直接の知識を持っていると主張しています。大規模なGeminiバージョンはまだ内部で開発中です。

顧客向けの最初の外部テストは、Geminiの発売がますます近づいていることを示す兆候かもしれません。Googleは既に今年の予定と発表していました。以前の報告では、秋にリリースされると言われていました。

Geminiは、クラウドアクセスを通じて企業に提供され、Googleの消費者向け製品と統合されます。GoogleはGeminiを、BardといったチャットボットからWorkspaceの新しいAI機能まで、すべてのAIアプリケーションに使用する予定です。

Googleは、Vertex AIサービスを通じてさまざまなモデルサイズを提供する予定です。モデルが小さければ、より低コストで簡単なタスクを実行できる可能性があります。

GoogleのユーザーデータはGeminiに利点をもたらすかもしれません

テスターによれば、大きな利点の1つは、GoogleがGoogle検索などの製品データとWebの公開情報を処理できることです。これにより、Geminiモデルはユーザーの意図をより理解しやすくなる可能性があります。また、情報源によれば、誤った回答が少なくなる可能性もあります。

また、Geminiのコード生成は、MicrosoftのGitHub Copilotと競合できるほど十分に優れているとされています。グラフの解析やデータの解釈、および音声コマンドを使用してブラウザなどのコンピュータで操作するなど、コンピュータ上でのアクションも検討されています。

複数のGeminiモデル

The Informationによると、Geminiは「複数の大規模な言語モデルからなるセット」であり、チャットボット、テキスト要約、コード生成、新しいテキストの生成など、さまざまなタスクを実行できます。GeminiがOpenAIのGPT-4アーキテクチャのようなネットワーク専門家モデルを持っているかどうかは明確ではありません。

Geminiは公式には2023年5月に発表されました。最初の噂では、モデルは少なくとも1兆のパラメータを持つとされています。トレーニングにはGoogleのAI TPUチップ数万台が使用される予定です。

Geminiチーフマネージャーのデミス・ハサビスは、GeminiはAlphaGoシステムの一部の強みと大規模なモデルの言語機能を組み合わせると述べ、これによりAIモデルの新たな進歩がもたらされるでしょう。