グーグルは、顔認識マウス「Gameface」や、メモとチャットできるプライベート言語モデリング・サービス「Tailwind」などの実験的アプリケーションを含め、実質的にすべての製品に人工知能を組み込んでいる。

チャットボット、検索、PaLM 2言語モデルといった主なAIへの取り組みに加え、グーグルは一連の小規模なAIアプリケーションや実験も発表した。そのうちの2つは、ウェブカメラとコンピュータ・ビジョンを使って顔を追跡するProject Gamefaceと、Google Driveの文書から学習するAIノートブックProject Tailwindである。

Project Gamefaceは顔追跡マウス

Project Gamefaceでは、グーグルはウェブカメラを使って顔を追跡し、コンピュータとマウスのようなインタラクションを行う。リードAIアドボケイトのローレンス・モロニーによると、グーグルは、顔の合計468のトラッキング・ポイントを設計し、トラッキングする複数の異なるAIモデルを使用している。

これらのトラッキングポイントの動きは、ネイティブのWindowsアプリケーションを介してマウス操作に変換される。これにより、ユーザーは顔の動きでコンピューターを操作することができる。

例えば、右の口角を右に引っ張ると、ゲームのキャラクターは右に歩く。どのように顔でコンピューターを操作するかは、豊富なオプションメニューで調整できる。

現在のところ、このソフトウェアは6つの顔の動きをサポートしているが、これはまだかなり限られており、複雑なゲームには適していない。Gamefaceは主に障害者向けに設計されている。ソフトウェアはオープンソースで、インストール方法とともにGithubで公開されている。

Tailwind:私的言語モデルに基づくAIノートブック

GoogleはTailwindを “AI notebook first “と呼んでいる。Googleドライブに保存された文書やメモをもとに学習されたプライベート言語モデルを使用する。そして、チャット・インターフェースを介してコンテンツと対話し、特定の情報やインスピレーション、要約を要求することができる。ChatGPTを想像してほしいが、それは我々の特定のトピックについてすべてを知っている。グーグルはTailwindに独自のPaLM 2 APIを使用している。

グーグルによると、このプロトタイプはまだ初期段階にあり、当初は学生向けに設計されテストされたものだという。しかし、Tailwindの原理は、著者から金融アナリストや弁護士まで、チャット・インターフェースを介してコンテンツと対話したい多くのオーディエンスに関連している(デモは1:05:00から)。

グーグルは、Tailwindをグーグルの専門家5人が「ここ数週間かけて」開発した実験だと説明している。米国では、GoogleLabsの 実験に承認されると、アクセス待ちリストに載ることができる。