グーグル・ディープマインドが提供するAlphaDevは、より優れたコンピューター・アルゴリズムを見つけるために設計されている。あるテストでは、AIシステムは最大70%効率的なソートアルゴリズムを発見した。

グーグル・ディープマインドは、AlphaZeroやMuZeroを含むいくつかの影響力のあるAIモデルを開発してきた。これらのアルゴリズムは、グーグルがデータセンターの管理改善や動画の圧縮に使用している。おそらくこれまでで最も影響力があるのはAlphaFoldで、世界中の研究者がタンパク質の研究開発に役立てているアルゴリズムだ。

現在、グーグル・ディープマインドは、強化学習を利用して新しいコンピューター・アルゴリズムを見つけるAIシステム、AlphaDevを導入している。

AlphaDevは、1日に何兆回も実行されるアルゴリズムを改善する。

「デジタル社会は、コンピューティングとエネルギー消費の需要を増大させている。過去50年間、私たちはハードウェアの改良に頼ってきました。しかし、マイクロチップが物理的な限界に近づいている今、コンピューティングをより強力で持続可能なものにするためには、マイクロチップ上で実行されるコードを改善することが不可欠です」と、Google DeepMindは研究の中で説明している。「これは、1日に何兆回も実行されるコードを構成するアルゴリズムにとって特に重要です」。

AlphaDevによって、同社は今回、人間が何十年もかけて開発したアルゴリズムを凌駕する、新しく高速なソートアルゴリズムを発見した。オープンソースであるこれらのアルゴリズムは、オンライン検索結果の並べ替えからソーシャルメッセージング、コンピューターやスマートフォンのコンピューティングまで、あらゆるものを支えている。

この新しいアルゴリズムは、libc LLVMソート・ライブラリの改良につながり、短い配列では最大70%高速化され、25万要素以上の配列では約1.7%高速化された。AlphaDevはまた、データの保存と検索のための基本的な処理であるハッシュの高速化アルゴリズムも発見した。この新しいハッシュアルゴリズムは、9~16バイトのデータセンターのハッシュ関数の効率を30%向上させる。

AlphaDevはアセンブリ命令のAlphaZero

AlphaDevはAlphaZeroをベースにしていますが、囲碁、チェス、将棋の代わりに、AlphaDevはコンピュータのアセンブリ命令で対戦します。アセンブリ命令とは、コンピューターのCPUが理解して実行できる低レベルの命令である。新しいアルゴリズムを発見するために、チームはソートをシングルプレーヤーの「アセンブリゲーム」に変えた。一手ごとに、アルファデブは作成したアルゴリズムとCPUに含まれる情報に注目する。一手ごとに、システムはアルゴリズムに新しい命令を追加する。

グーグル・ディープマインドによると、アセンブリーゲームは、アルファデヴがより良いアルゴリズムを見つけるために、膨大な数の可能な命令の組み合わせを効率的に調べていく必要があるため、とてつもなく難しいという。

AlphaDevはアルゴリズムを構築する際、アルゴリズムの出力を期待される結果と比較することで、アルゴリズムが正しいかどうかをチェックする。並べ替えアルゴリズムの場合、これは入力として順序付けされていない数字を提供し、出力として正しく並べ替えられた数字を得ることを意味する。AlphaDevはトレーニング中、数字を正しくソートし、そのスピードと効率によって報酬を得る。最終的な目標は、正しく、より速いプログラムを見つけることである。

AlphaDevがこれらのアルゴリズムを見つけたら、チームはそれを解読し、C言語に翻訳する。

AlphaDevは将来Cコードで遊ぶ

低レベルのアセンブリ命令での最適化は非常に効率的だったが、アルゴリズムのサイズが大きくなるにつれて限界に達した。チームは現在、C言語などでアルゴリズムを直接最適化するAlphaDevの能力を調査している。

“AlphaDevは、コンピューティング・エコシステム全体を最適化し、社会に利益をもたらす他の問題を解決するのに役立つ汎用AIツールの開発に向けた一歩だと考えています。”

詳細はAlphaDevのブログ記事を参照。コンテンツはThe Decoderより