オンラインツール, 人工知能

オートGPTとBabyAGIが台頭しているが、実は今かなり悪い

更新しました 25/09/2023

コミュニティの一員になる

メーリングリストに参加して限定コンテンツを受け取りましょう

ChatGPT、Bard、Bing Chatは忘れてください！これらのボットはあまりに時代遅れで、「危険だ、ウィル・ロビンソン！」と叫んでいるか、カセットテープからプログラムを読み上げているかのようだ。少なくとも今週は、AIの次の大物は自律型エージェントである。自律型エージェントは、1つまたは一連の目標を受け取り、それに従う独自のタスクリストを作成するプログラムである。

エージェントがコンピューター・プログラムを書いたり、仕事用のプレゼンテーションを作成したりするのを頼むのを想像してみてほしい。あなたは数分間その場を離れ、戻ってくると、ボットはあなたが頼んだものを、たとえそこにたどり着くまでに何十ものステップを踏まなければならないとしても、届けてくれる。それは信じられないように聞こえるし、いつかそうなるかもしれない。しかし今のところ、これらのツールは便利なユーティリティというよりは、コンセプトの証明に過ぎない。

ここ数週間、私は2つの主要な自律型エージェントで遊ぶことができた：Auto-GPTとBabyAGIだ。どちらも可能性を秘めているが、今のところ、実用的なユースケースをひとつも見つけることができない。

公平を期すために、これらのエージェントは同じラージ言語モデル（LLM）、GPT3.5とGPT4を使っているだけで、プロンプトを入力するときに多くの間違いを犯す。これらの間違いは、エナジャイザーバニーのように、エージェントが間違った方向に進み続けるという事実によって増幅されます。

自動GPT：大げさな表現はやめてください

Meaningful Gravisという会社によって設計され、Githubに投稿されたAuto-GPTは、あなたに最初の目標セットを与えた後、独自のタスクを考え出す作業を行うPythonアプリケーションである。アプリケーションのインストールはとても簡単だ。

Auto-GPTを使うには、OpenAIのAPIキーを取得する必要がある。取得は無料だが、エージェントがタスクを実行するたびにお金がかかり、OpenAIのサーバーに到達しなければならない。

最初にアカウントにサインアップすると、数ドルの無料クレジットを手に入れることができる（私はあるアカウントに18ドル、別のアカウントに5ドル持っている）。

Windows、Linux、macOSを問わず、コマンドラインからAuto-GPTを実行する。そして、エージェントに名前を付け、大まかな目的と目標のセットである役割を与えるよう求める。

Auto-GPTがゲームチェンジャーであると自慢する開発者が、現状のボットでは実現できないユースケースを明かしたり、漠然としていてかわいらしいが、理論的なスタートアップの事業計画を立てるのと同じくらい役に立たないユースケースを明かしたりする例を、私はツイッターでたくさん見てきた。

私が最も成功したAuto-GPTセッションは、WebSiteGPTというエージェントを作成し、私が考案した架空のウェブ開発会社Geek-in-Chief Designsの3ページのウェブサイトをデザインするという役割を与えたときに行われた。

私は、会社を説明するホームページの作成とデザイン、問い合わせページの作成、そしてGeek-in-Chief Designsがユーザーデータを収集・販売しないことを明記したプライバシーポリシーページの作成を目標に設定した。

また、3つのページすべてをHTMLファイルとして制作し、その後停止するよう依頼した。停止をゴールに設定するべきではありませんでしたが、このスクリプトがどれほど長く続くかを考えると、最終的に終了することを確認したかったのです。

全工程に約45分、数十ステップを要した。デフォルトでは、Auto-GPTは各タスクを実行する前にあなたの承認を求める。

しかし、y -[N]とタイプすることで、次のN個のステップにイエスと言うこともできる。つまり、y -100と入力すると、次の100ステップに進むことができる。

各ステップについて、Auto-GPTは一連の説明テキストを表示します：思考、推論、計画、WebsiteGPT批評。

Reasoningセクションは、エージェントが次に何をしたいかを示しています。例えば、最初のステップの前に、「Geek-in-Chief Designsのホームページをデザインすることから始めるべきだと思います。グーグル検索を使って、サイトのデザインと構造のインスピレーションを見つけることができます。

Rationaleのステップでは、なぜ彼がやりたいことをやりたいのかを説明する（例えば、「競合他社のウェブサイトを見ることで、彼らが使っている戦術や実践のいくつかを推測することができる」）。Planセクションでは、ボットが何をする予定なのかを具体的に説明します – 「START_AGENTコマンドを使用して、HTMLファイルの作成を委任します」。

批評」のセクションは、Auto-GPTが神経症的な自己批判や遵守しない品質規則を追加し始めるところである。

たとえば彼は、自分が書いたプライバシー・ポリシーがGDPRに準拠しているかどうか、情報が「絶対に正確」であるかどうかを確認しなければならないと書いている。

Windowsのチュートリアルを書いてもらった別のセッションでは、「チュートリアルを編集して洗練させる間は、わかりやすさとシンプルさを目指すべきだ」と言い、自分の仕事を見直すことにこだわった。

Auto-GPTがサイト構築作業を終えた後、私は実際にサイトの3つのページを表すHTMLファイルを持っていたが、それらのページのデザインもコピーもあまり良くなく、会社を説明するコピーやプライバシー・ポリシーは単なるでっち上げだった。

例えば、私はボットに、私の会社はユーザーデータを収集したり販売したりしないと明確に伝えたにもかかわらず、プライバシー・ポリシーには「当社は、お問い合わせフォーム、アンケート、ユーザー・アカウントを通じて、さまざまな種類の個人情報を収集、保存、使用することがあります」と書かれていた。

名前、住所、閲覧行動など、収集する情報の名前まで書いてあった。

また、このホームページには、Geek-in-Chief Designsという会社について多くのことが書かれていた。Geek-in-Chief Designsは、ウェブサイトやウェブアプリケーションの開発、ウェブサイトのメンテナンス、ウェブサイトの最適化、カスタムウェブデザインなどを提供しています。

“経験豊富な開発者のチームが、どんな複雑なプロジェクトにも対応し、高い品質を保ちながら納期通りに納品します。”

しかし、Auto-GPTボットはGeek-in-Chief Designsの意味を知る由もなかった。私が言ったのはウェブ・デザイン会社ということだけだったからだ。

この会社にはデジタル・フットプリントがないので、ボットはその詳細をすべてでっち上げただけなのだ。包括的で堅牢なeコマース・ソリューション」を提供する「経験豊富な開発者」のチームも存在しない。

ボットに公平を期すために、私はこのウェブサイトを書くのに十分な詳細を与えなかった。もし私が自分の会社のウェブサイトを作るために人間を雇ったとしたら、その人は間違いなくもっと詳細な情報を求めて私のところに戻ってきただろう。

その代わり、Auto-GPTは、次のステップを実行する許可を求める以外に、フォローアップの質問をすることができないので、事実を欠いた、可能な限り一般的なことを書いただけだった。

私は、人間が何を望んでいるかを判断するためにフォローアップの質問をするチャットボットを見たことがありません。

もし私がChatGPTを使用していて、Geek-in-Chief Designsのホームページを書くように依頼し、このような曖昧ででっち上げのコピーを受け取ったとしたら、私はもっと多くの情報を提供する新しいプロンプトを書くでしょう。

しかし、自律型エージェントの場合、長いタスクリストがすべて完了するまで、介入するチャンスはない。

Auto-GPTは情報を構成するだけでなく、持っていないリソースを作り出し、それを使って行動しようとすることもできる。

私がAuto-GPTにウィンドウズ・チュートリアルの作成を依頼したとき、Auto-GPTは最初の草稿を書き、それから “考え “のセクションでこう言った。”チュートリアルが使いやすく、分かりやすいものであることを保証するために、サンプル・グループのユーザーでテストし、フィードバックを集める必要があります。”

Auto-GPTからこの返事を受け取ったとき、いったいどうやってユーザーからのフィードバックを集めようかとすぐに考えた。電子メールを送るのか？

メッセージを送る秘密のフォーカス・グループがあるのか？

私は「はい」と答えて許可を与え、何が起こるかを待った。コピーはほとんど変更されておらず、Auto-GPTがフィードバックを求めた唯一のユーザーが彼自身であることは間違いない。

チュートリアルの記事のコピーは、Auto-GPTが特定のPC Magの記事を使って調査したことを認めたが、まったくひどいものだった。

Windows 11のスタートメニューをパーソナライズする方法についてのチュートリアルのはずだったが、非常に簡潔なステップのセットはスタートメニューとスタート11（サードパーティのユーティリティ）を混同し、Windows 11のスタートメニューは左下にあると仮定し（デフォルトでは中央にある）、メニュー上で右クリックすることでタイルを移動できると誤って記載されていた。

以下がその結果だ。

ステップ1：スタートボタンをクリックする。

スタートボタンは画面の左下にあります。クリックすると、新しいスタートメニューが開きます。

ステップ2：スタートメニューのどこかを右クリックします。

オプションメニューが表示されます。ショートカットの削除や名前の変更、特定のフォルダへのショートカットの移動など、スタートメニューを変更できます。

ステップ3：スタート11の設定に戻ります。

タスクバーを右クリックし、[スタート11の設定]を選択します。そこから、必要なオプションを変更できます。例えば、スタートメニューに表示されるタイルや、メニューの構成方法などを選択できます。

これで完了です！これでWindows 11のスタートメニューのカスタマイズは完了です。ご質問や問題がありましたら、下のコメント欄でお知らせください。
AutoGPT

サイト構築タスクの間、Auto-GPTはHTMLファイルをウェブサーバーにアップロードすることも話していましたが、（私が知る限り）FTP機能はありませんし、ウェブサーバーへのログイン情報も与えていません。

ファイルをFTPにアップロードしなかった後、彼が次に考えたのは、「自分たちの行動を見直し、妥当な正確さで計画に従ったことを確認する必要がある」ということだった。FTP(S)転送で成功したことに集中する必要がある…”。

要するに、ボットは自分が持っていない力を持っていると思い込み、持っていない情報を捏造し、あなたが言うことと真っ向から矛盾しているのだ。

しかし、Auto-GPTが行っているのは、GPT3.5とGPT4からの返答をつなげているだけだ。しかし、今はまだ信用できない。

BabyAGIは前進を止められない

BabyAGIは、GPT 3.5とGPT 4を使って継続的にタスクを実行する、もう一つのPython自律エージェントアプリケーションだ。

Auto-GPTとよく似ており、コマンドプロンプトで実行されるが、ゴールと開始タスクを与えるだけで、そこから進むようになっている。

設定ファイルにゴールとタスクを入力し、Pythonでアプリケーションを起動すると、おそらく永遠に続くだろう。ステップごとに許可を求めることもなく、私の経験では、CTRL Cを押して停止させるまでステップを繰り返し続ける。もしあなたがその場から立ち去れば、それは実行され続け、あなたのOpenAPIアカウントから永遠にクレジットを流出させ続けるでしょう。

しかし、Auto-GPTと同様、BabyAGIから得られた結果はあまり良くなかった。さらに悪いことに、タスクのリストに従うことができず、2番目のタスクに進まずに1番目のタスクを変更し続けた。

例えば、私は彼に5つのWindows 11のハウツーを特定して書くように頼みました。彼は書こうとしているハウツーのリストを提供し、リストの最初のものをやってから、2つ目のタスクをやる代わりに、リスト全体を変更し、チュートリアル番号1からやり直しました。

彼は、自分が約束したことや、ほんの少し前にやったことの記憶がないようだった。

チュートリアル自体は、Auto-GPTから取ったものよりは少し詳細で正確だったが、それでもディテールは非常に薄かった。

困ったことに、5つのチュートリアルを要求したにもかかわらず、BabyAGIは追加のWindows 11トピックを見つけ、タスクリストを変更し続けた。もし私がCTRL Cを押さなかったら、おそらく私のOpenAIのアカウントのクレジットがなくなるまでやめなかっただろう。

BabyAGIのデフォルトの目的は「世界の飢餓を解決する」であり、自律型エージェントの最大の問題の1つを示している。

例えば、最初の6つのタスクリストには、世界政府と協力して食料生産を評価すること、フードバンクを設立すること、人々が自分で食料を栽培することを学ぶのを助けること、貧困、不平等、気候変動に対処する政策を提唱することなどが含まれていた。

私のPC上で動いているチャットボットが、一体どうやってこれらのことができるのだろうか？私がCTRL Cをクリックした瞬間に即座に動作を停止するこのボットは、国連総会で演説し、世界の指導者たちに不平等への取り組みを訴えるつもりなのだろうか？

コンピューターから飛び出して、ビルを借り、チームを雇い、フードバンクを運営するのだろうか？

しかし、フードバンクや不平等の解決、自給自足のためのトレーニングが世界飢餓の潜在的な解決策であることを、AIが教えてくれる必要はない。

これらはすべて明らかで、よく知られていることだ。

自律型エージェントは自律的すぎて役に立たないかもしれない

アイデアは安いが、優れた実行力は貴重だ。今のところ、自律型エージェントはLLMのようにアイデア以上のものを提供しない。

FTPクライアントを使わずにFTPでファイルを送信したり、存在しないユーザーを検索したり、世界の飢餓を終わらせたりと、できないことを約束している。

自律型エージェントの最大の問題は、彼らはあなたからもっと詳細を聞くためにフォローアップの質問をしないし、途中で調整する機会も与えないことです。

このため、エージェントは、そこにたどり着くまでの長く曲がりくねった道のりを旅している間に、悪い出口を与えてしまいがちだ。

しかし、Auto-GPTやBabyAGIのような自律型エージェントは、その背後にあるコンセプトがしっかりしているため、大きな可能性を秘めている。

どちらも非常に活発に開発が進められているため、間違いなくすぐに便利なものになるだろう。そして、コードを修正したり、独自のPythonスクリプトを追加したりする人は、私がこれまで使ってきた以上のものを得ることができるだろう。Tom's Hardwareからの内容のニュース。

André Lug

Iglu Online の創設者であり、ブログのライターである André Lug。人工知能とコンテンツ作成のスペシャリストとして、彼は AI、生産性、起業家精神に関するコンテンツを提供しています。

オートGPTとBabyAGIが台頭しているが、実は今かなり悪い

メーリングリストに参加して限定コンテンツを受け取りましょう

自動GPT：大げさな表現はやめてください

BabyAGIは前進を止められない

自律型エージェントは自律的すぎて役に立たないかもしれない

André Lug

コメントを残すコメントをキャンセル

ニュースレターを購読する

どこに行こうか

オートGPTとBabyAGIが台頭しているが、実は今かなり悪い

メーリングリストに参加して限定コンテンツを受け取りましょう

自動GPT：大げさな表現はやめてください

BabyAGIは前進を止められない

自律型エージェントは自律的すぎて役に立たないかもしれない

André Lug

コメントを残す コメントをキャンセル

ニュースレターを購読する

どこに行こうか

コメントを残すコメントをキャンセル