OpenAssistantは、OpenAIのChatGPTに代わる真のオープンソースになりそうだ。最初のモデル、トレーニングデータ、コードが利用可能になった。

OpenAssistantプロジェクトは、OpenAIがChatGPTを立ち上げた直後の12月に始まった。目的は、同じ機能を持つオープンソースのAIアシスタントを作ることだ。この目的のために、チームは13,500人以上のボランティアの協力を得て、「人間が生成し、人間が注釈を付けたアシスタントスタイルの会話コーパス(35の異なる言語で、66,497の会話ツリーに分散された161,443のメッセージで構成され、461,292の品質評価で注釈が付けられた)」を数ヶ月かけて収集した。

OpenAssistantのモデル、トレーニングデータ、コードが利用可能になりました。

OpenAssistant、最大300億のパラメータを持つモデルを発表

OpenAssistantチームは、収集した学習データを使用して、MetaのLLaMAモデルやEleutherAIのPyhtiaモデルの亜種を含むいくつかの言語モデルを改良した。最大のバリエーションは、300億のパラメータを持つLLaMAモデルに基づいている。Alpacaや Vicunaのように、これらのモデルは「指示によって調整される」ものであり、人間のフィードバックによる強化学習(RLHF)によって改善されたものではない。

しかし、ボランティアとの比較研究によれば、チャットボットが生成する結果は、ChatGPTのgpt-3.5-turboモデルに近いはずだ。グーグル検索などのプラグインを使った初期実験もすでに進行中だ。また、将来的にはRLHFでLLaMA-30Bモデルを訓練し、ローンチする予定である。

Pythiaモデルはすでに利用可能であり、LLaMAモデルは間もなくローンチされる。LLaMAモデルはMetaライセンスのため商業利用はできないが、Pythiaモデルは商業利用のライセンスがある。

モデルに加えて、チームはコードとOpenAssistant Conversationsで収集したデータも公開している。さらに、すべてのモデルはウェブインターフェースを介してテストすることができ、会話を評価し、モデルをさらに改善するために使用することもできる。

OpenAssistantは現在の限界についてオープンに語る

添付の記事によると、モデルには幻覚など、大規模言語モデルのよく知られた問題が見られる。また、収集された学習データは主に男性のアノテーターによって提供されたもので、平均年齢は26歳だという。「この人口統計学的プロフィールは、データセットに不注意にバイアスをもたらす可能性がある。

チームはまた、データセット内の有害なメッセージを検出し、削除するための措置を講じたが、システムは完全ではない。「上述した限界を考慮し、われわれは学術研究の文脈でのみLLMを使用することを推奨する。「我々は、研究者が下流のタスクに使用する前に、モデルの安全性と偏りを徹底的に調査することを強く推奨する。リリースされたモデルは、安全でない挙動を示す可能性があり、ラピッドインジェクション攻撃を受けやすいことを認識することが重要である。

OpenAssistantプロジェクトは、アライメント研究の民主化を目指しています。

AI研究、特に大規模な言語モデルとそのアライメント、つまり人間の価値観への適応の分野では、トレーニングやデータ収集のためのリソースを持つ一握りの研究所にほぼ限定されてきた、と研究チームは述べている。高品質のデータへのアクセスを独占することは、包括的で多様な研究の可能性を危うくする。

公開されたモデルと自由に利用可能なデータセットを持つオープンアシスタントは、それゆえ、この研究を民主化する試みである、と論文は言う。そうすることで、独自の言語モデルの開発とデータ供給をますます不透明なものにし、少数の選ばれた専門家グループとアライメント研究を行うというOpenAIのアプローチに、著者たちは明確に反対している。

モデルを試したい人は、OpenAssistantのウェブ・インターフェイスから試すことができる。コードと詳細はGitHubで公開されている。モデルはHugging Faceで公開されている。

OpenAssistantは、Andreas Köpf、Yannic Kilcher、Huu Nguyen、Christoph Schumannによって設立され、20人以上の開発者、データとセキュリティの専門家、モデレーションとドキュメンテーションのチームで構成されている。このプロジェクトは、Redmond AI社、Hugging Face社、Weights & Biases社、Stabilty AI社、LAION社からの計算リソース、ツール、その他の支援によって支えられている。