グーグルはAIが生成した検索コンテンツを取り締まることができない、あるいは取り締まる気がないため、コンテンツ・スパマーがそれを利用している。そしてグーグルはそこから利益を得ている。

ウェブ上のニュースや情報の質を評価する技術企業Newsguardの調査によると、141のブランドが、「人間の監視がほとんどない」低品質なAI生成サイトにプログラマティック広告を掲載しているようだ。

Newsguardはこれらのサイトを「信頼性の低い人工知能が生成したニュース」(UAIN)に分類している。調査によると、過去1カ月だけでも、このカテゴリーは追跡対象サイトが49から217に増加している。この調査では、1週間に約25の新しいUAINサイトが発見されている。

サイトの特定には、ChatGPTのようなAIモデルからのエラーメッセージを使用する。これは本質的に不正確な方法であるため、Newsguardは未検出のサイトが多数存在すると想定している。

これらのサイトは、ChatGPTのようなチャットボットを使って記事を生成したり、大手出版社の既存記事を書き換えたりしている。その品質は、広告テクノロジー企業のスパム対策システムによる検出を回避するのに十分なようだ。調査対象となったサイトの1つでは、1日に1,200以上の記事を掲載していると報告されている。各記事は広告スペースとして利用されている。

グーグルはAIが生成したスパムから利益を得ている

UAINが評価した55のサイトでは、141の有名ブランドが合計393のプログラマティック広告を掲載した。広告は米国、ドイツ、フランス、イタリアで表示された。

この393の広告のうち、356、つまり90%以上がグーグル広告(ウェブサイトに広告を表示するためのグーグル独自のサービス)によるものだった。グーグルは、表示される各広告から収入を得ている。

広告主は、特定のウェブサイトに広告を表示しないこともできる。しかし、これには広範な調査が必要で、維持に時間がかかる。

広告とAdSenseでは、Googleは広告主の入札と広告主の広告が表示されるサイト上の表示を制御する。

また、グーグル検索やニュース、ディスカバーなどのサービスを通じて、グーグルは自社の広告が表示されるページのビジビリティにも影響を及ぼしている。

特に欧米のパブリッシャーにとって、グーグルはほとんどの場合、最も重要なトラフィック源である。グーグルからペナルティを受けたり無視されたりすることは、廃業に等しい。

グーグルのAIコンテンツのジレンマ

グーグルは、AIコンテンツに関してジレンマに直面している。一方では、オープンなインターネットがますます混雑し、その結果コントロールが難しくなるため、膨大な量の自動生成コンテンツが中核となる検索ビジネスを脅かすことになる。

しかし、グーグルが他者のAI生成コンテンツを完全に拒絶する一方で、サーチ・ジェネレイティブ・エクスペリエンスによってAI生成テキストを大規模に検索体験に統合するのは、矛盾した姿勢である。グーグルがAIコンテンツの価値を下げたいとしても、それが技術的に可能かどうかは不明だ。

グーグルは最近、AIコンテンツが有用であれば、それに対して全面的な措置を取ることはないと表明していた。しかし、それは変わったようだ。2022年4月、グーグルの検索エンジンスポークスマンのジョン・ミューラーは、AIコンテンツはウェブマスターガイドラインに違反する自動生成コンテンツであると述べた。「つまり、スパムとみなす」とミューラーは述べた。

真実の一部は、ビジネスや社会の大きなセグメントがテキストジェネレーターを使用しているときに、グーグルがAIコンテンツをスパムと分類することは解決策にならないこと、そしてAIが生成したコンテンツの確実な検出は高価であるか不可能であることかもしれない。Bardでは、Googleは独自のテキストジェネレーターさえ提供している。

スパムの問題は新しいものではない。GPT-3でも、初期のユーザーは、人生相談や自己変革に関する一般的な内容の偽ブログを作成し、簡単に何千人もの読者を集め、人間が相手だと信じてコメントまでしていた。

しかし、Newsguardの研究は、この分野での大規模な成長が、ますます強力でアクセスしやすくなった言語モデルによってもたらされていることを初めて示している。