グーグル、Google I/Oで新たなAI統合と製品を発表。その概要を紹介する。
Gmailの “Help me write”
グーグルは、Workspaceのアップデートの一環として、Gmailに生成テキストAIを統合しており、詳細な返信候補を生成することができる。グーグルは、航空会社への払い戻し依頼を例に、全額払い戻しの可能性を高めるために設計された、手の込んだ詳細なメールでこれを実演している。

グーグルマップの没入型視覚化ルート
グーグルは昨年、世界中の有名な観光スポットをAIが3Dで視覚化する「イマーシブ・ビジュアライゼーション」を発表した。そして今、グーグルはこのビジュアライゼーションを都市内の3Dルートにより広く導入しようとしている。このサービスは年末までに、アムステルダム、ベルリン、ダブリン、フィレンツェ、ラスベガス、ロンドン、ロサンゼルス、ニューヨーク、マイアミ、パリ、シアトル、サンフランシスコ、サンノゼ、東京、ベニスで利用可能になる予定だ。
Googleフォト用マジックエディター
Magic Editorは、あなたの写真のためのジェネレーティブ画像AIです。画像内の要素を移動させたり、欠けている情報を補ったりすることができる。Googleは、画像の端で切り取られた風船を持つ子供の写真を使ってこれを実演している。子供を中央にドラッグすると、風船が自動的に端に挿入される。この新しいエディタは、今年後半に一部のPixelスマートフォン向けにリリースされる予定だが、グーグルは、常に期待通りの結果が得られるとは限らないことを認識している。

BardがPaLM-2対応と新機能を追加
Googleは、画像、コーディング、アプリケーションの統合機能、グローバルアクセスの拡大など、Bardチャットボットの改良を発表した。Bardは今後、数学、論理、プログラミングの機能を強化した包括的な言語モデルであるPaLM 2を使用する。グーグルによると、PaLM 2は2022年4月に発表されたPaLMモデルよりも大幅に改良されているという。
このAIツールはこれまで米国と英国でしか利用できなかったが、今後は180以上の国と地域で提供される。日本語と韓国語のサポートが追加され、まもなく40言語に対応する。
Bardは、Google LensのBardへの統合によって可能になった、画像を使った回答やプロンプトをまもなくサポートします。

新しいコードの更新とエクスポート機能には、より正確なフォントの引用、ダークなデザイン、開発者がPythonを始めとするReplitでコードをエクスポートして実行できる「エクスポート」ボタンが含まれます。ユーザーはGmailやDocsで直接メールやドキュメントを作成することもできる。
Bardの今後の計画には、Docs、Drive、Gmail、Mapsといったグーグルのアプリケーションやサービスのほか、アドビの生成AIモデルであるFireflyや、Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academyといった他のパートナーなど、ウェブ全体のサービスとの統合が含まれている。
「AIスナップショット」:グーグル検索のAI回答
すでに発表されているように、グーグルはAIが生成した回答を直接グーグル検索に統合している。実験的な回答は、グーグルの従来の検索結果の前に表示される。新しい検索インターフェイスでは、AIの提案に基づくフォローアップ質問やチャットボットによる会話が可能になり、出版社や企業、ソーシャルメディアからのリンクが統合される。
グーグルの検索責任者であるキャシー・エドワーズは、「私たちは、人々が他の人々の意見を重視していることを知っています」と述べた。しかし、新しいAI検索の視覚化は画面スペースを大きく取り、パブリッシャーのトラフィックに影響を与えそうだ。

ジェネレーティブAI機能は、Googleショッピング検索にも拡張されている。このAIは、350億以上の商品リストがあるGoogle Shopping Graphに基づいて、関連する要素、評価、価格、商品画像など、商品の包括的な概要を提供する。
AIによる回答は、グーグルのアルゴリズムが適切と判断した場合にのみ提供される。今のところ、システムは健康や金融といったデリケートなトピックを避けている。
AIスナップショットへのアクセスは、サーチラボの新機能の一部であるサーチ・ジェネレーティブ・エクスペリエンス・プログラムに参加することで可能となる。このプログラムへのアクセスは数週間以内に可能になるはずで、Search Labsは現在利用可能である。
ユニバーサル翻訳者
グーグルによると、ユニバーサル・トランスレーターは最新のAI翻訳モデルに基づいたオーディオビジュアル翻訳ツールである。ビデオで話されている言語を翻訳し、話している人の唇の動きを同期させて音声に変換することができる。ディープフェイクのリスクがあるため、グーグルは当初、このツールを特定のパートナーにのみ提供している。


アンドロイド向けジェネレーティブAI:メッセージと壁紙
グーグルはアンドロイド向けに、メッセージ用の精巧なオートコンプリートの一種である「Magic Compose」を発表した。この人工知能は会話の文脈を利用し、ビジネスライク、シェイクスピア風、特にリラックスしたコミュニケーションなど、特定のスタイルを採用することもできる。
さらにグーグルは、既存の写真やパターンから背景パターンを生成する、壁紙作成用の人工知能ツールを導入する。このツールは次のアンドロイドのアップデートで利用可能になる。

絵文字壁紙は、ユーザーが好きな絵文字、パターン、色の組み合わせでデバイスの背景をパーソナライズできる。Cinematic Wallpaperは、ユーザーが選択した写真を、デバイスのローカルAIを使用して、デバイスのロックが解除されたり傾いたりしたときに動き出す画像に変換します。
また、新機能として「ジェネレーティブAI壁紙」がある。ユーザーがクリエイティブなビジョンを記述すると、グーグルのテキスト画像拡散モデルを使用して、携帯電話がユニークな壁紙を生成する。提案はあらかじめ構造化されているため、提案エンジニアを雇うことなく美しい壁紙を作成できる。

これらの新しい壁紙は来月、Pixel端末から利用可能になる。これらの壁紙はGoogleのデザインフレームワーク「Material You」に基づいており、選択された壁紙に合わせてデバイスのカラーパレットを自動的に調整する。
MusicLMの発表
グーグルは1月、AIテストキッチンでウェブ、アンドロイド、iOS向けに提供を開始したMusicLMテキスト・トゥ・ソング・テンプレートを発表した。MusicLMは、特定の音楽スタイルに関する歌詞の記述に応答して、2つの曲を生成します。
