AIチャットボットは英語以外の言語にはあまり流暢ではなく、世界貿易やイノベーションにおける既存の偏りを増幅させる恐れがある。

コンピュータ科学者のパスケール・ファンは、ChatGPTのようなポリグロットAIアシスタントが言語の壁を乗り越える明るい未来を想像することができる。その世界では、現地の方言にしか堪能でないインドネシアの商店主が、英語でオンラインに商品を掲載することで、新たな買い物客を獲得することができる。”これはチャンスを開くかもしれない “とファンは言う。なぜなら、わざわざAI翻訳を使ってインドネシア語で広告された商品を探すアメリカ人はほとんどいないからだ。「アメリカ人は他の言語を学ぶ意欲がありません」と彼女は言う。

5人に1人が自宅で他の言語を話しているのですから、すべてのアメリカ人がそのような状況に当てはまるわけではありません。香港科学技術大学のAI研究センター長で、自身も7カ国語を話すフォン氏は、自身の専門分野でもこのような偏りが見られるという。「英語で論文を発表しないなら、あなたは関係ありません」と彼女は言う。「英語を母国語としない人は、職業的に罰せられる傾向があります」。

フォンは、AIが英語の優位性をさらに強化するのではなく、それを変えてくれることを望んでいる。彼女は、ChatGPTとその競合チャットボットの言語能力をテストし、英語以外の言語では著しく能力が低いという証拠に警鐘を鳴らすAI研究者のグローバル・コミュニティの一員である。

研究者たちはいくつかの解決策を見出したが、英語を主に話すチャットボットは広がり続けている。「オレゴン大学のコンピューターサイエンティストであるティエン・フー・グエンは、偏ったチャットボットを警戒している。「人々は規範に従い、自分自身のアイデンティティや文化について考えなくなります。それでは多様性が失われます。イノベーションを殺すことになる」。

arXiv.orgの公開前サーバーで今年発表された少なくとも15の研究論文(グエンと ファンの共著を含む)は、ChatGPTのような実験を後押しするAIソフトウェアの一種である大規模言語モデルの多言語性について調査している。方法論は様々だが、結果は一貫している。AIシステムは他の言語を英語に翻訳するのは得意だが、英語を他の言語、特に韓国語のようにラテン文字以外の文字に書き換えるのは苦手なのだ。

最近、AIが超人的な存在になるという話がよく聞かれるが、ChatGPTのようなシステムもまた、同じ文の中で流暢に言語を混在させることが難しい。例えば、世界中の何十億もの人々が毎日何気なく使っているような、英語とタミル語などである。グエンの研究によると、3月に行われたChatGPTのテストでは、英語以外の言語で事実関係の質問に答えたり、複雑な文章を要約したりする際のパフォーマンスが著しく悪く、情報を捏造する可能性が高かったという。「これは英語の文章なので、ベトナム語に翻訳する方法はありません」とボットはある質問に不正確に答えた。

このテクノロジーには限界があるにもかかわらず、世界中の労働者が、ビジネスアイディアの創出、企業メールの作成、ソフトウェアコードの改良のためにチャットボットを利用している。もしツールが英語で最もうまく機能し続けるのであれば、グローバル経済への足がかりを得たいと願う人々から、英語を学ばなければならないというプレッシャーが高まる可能性がある。そうなれば、大英帝国から始まった英語の押しつけと影響力のスパイラルをさらに強めることになりかねない。

心配しているのはAI学者だけではない。今月開かれた米議会の公聴会で、カリフォルニア州のアレックス・パディラ上院議員は、ChatGPTを開発したオープンエーアイのCEO、サム・アルトマン氏に、言語ギャップを埋めるために同社が行っていることを尋ねた。カリフォルニア州民の約44人が英語以外の言語を話している。アルトマンは、政府や他の組織と提携し、ChatGPTの言語能力を強化するデータセットを取得し、その恩恵を「できるだけ多くの人々」に広げたいと語った。

スペイン語も話すパディーリャは、開発者の戦略を大きく変えない限り、システムが公平な言語学習結果をもたらすことには懐疑的だ。「これらの新しいテクノロジーは、情報へのアクセス、教育、コミュニケーションの強化に大きな可能性を秘めています。

OpenAIは、自社のシステムに偏りがあることを隠していない。ChatGPTの有料ユーザーが利用できる同社の最新言語モデルGPT-4に関する ニュースレターには、基礎となるデータのほとんどが英語から提供されており、モデルのパフォーマンスを調整し研究するための同社の取り組みは、主に「米国中心の視点で」英語に焦点を当ててきたと記載されている。あるいは、あるスタッフが昨年12月に同社のサポートフォーラムで、OpenAIがChatGPTにスペイン語のサポートを追加するかどうかユーザーから質問された後、”スペイン語での良い結果はボーナスです “と書いている。OpenAIはこの件に関するコメントを拒否した。

ブラウン大学のコンピューターサイエンスの博士課程に在籍するジェシカ・フォードは、GPT-4を発表する前に、他の言語でのGPT-4の能力を徹底的に評価しなかったとして、OpenAIを批判した。彼女は、企業がトレーニングデータを公開し、多言語サポートの進捗状況を追跡することを望む研究者の一人である。「英語がこれほど統合されたのは、これが英語で弁護士として、あるいは英語で医者として行動できるのか?英語でコメディを作れるか?しかし、他の言語については、同じような質問をしていないのです」と彼女は言う。ワイアードより