AnthropicはClaude 2で、ChatGPTの直接の競合を開始した。このチャットボットはOpenAIのチャットボット、Google BardやBing Chatと同様の機能を提供する。
Anthropicは、元OpenAIの研究者によって2021年に設立され、約15億ドルの資金を提供し、OpenAIの直接の競合と見られている。後者はもちろん、非常に成功しているChatGPTと、マイクロソフトからの数十億ドルという資金的な後ろ盾で大きなアドバンテージを持っている。しかし、Anthropicの最初のモデルは、少なくともベンチマークではかなり優れていた。
現在、AnthropicはClaude 2で前進している。スタートアップによると、改良点には、会話スキルの強化、推論の明確な説明、より無難な結果、より長いメモリ、プログラミング、数学、思考スキルの向上が含まれる。
このテンプレートは、文書、メモ、手紙、物語、技術文書、書籍の作成に使用できる。クロード2の特筆すべき点は、一度に75,000ワード(100,000トークン)まで処理できることで、これはChatGPTのデフォルト制限である3,000ワードを大幅に上回っています。
これにより、チャットボットは応答においてより多くのコンテキストを考慮できるようになり、応答の質とタスクの多様性が向上する。Anthropicはすでに5月に、最初のモデルであるClaudeについて、特別に大きなコンテキストウィンドウを発表している。
米国司法試験の多肢選択式セクションにおいて、クロード2はGPT-4と同様のパフォーマンスを示し、76.5パーセントであった。GPT-3.5、フリーのChatGPTは平均50%程度です。Codex HumanEval Pythonプログラミングテストでは、Claude 2は71.2%(Claude 1.3は56.0%)を達成し、GSM8k小学校の算数問題では88.0%(Claude 1.3は85.2%)を達成しています。
Anthropic社によれば、今後数ヶ月の間に徐々に追加機能が提供される予定である。
クロード2は英国と米国で最初にローンチ
新しいチャットボットの開発には約2ヶ月を要した。約35人がAIモデルに直接携わり、さらに150人がサポート業務に従事した。クロード2を開発する際、Anthropicはセキュリティに特に注意を払ったとしている。
OpenAIとは異なり、Anthropicはモデルを最適化するためにAIが生成したコンテンツの評価に人間を関与させるのではなく、AIベースのフィードバックメカニズムに依存しており、アップルの利用規約やその他のガイドラインに基づく一種の憲法を通じてルールを設定している。
Anthropic社によると、チャットボットが意図的にミスを犯すよう挑発するレッドチームテストにおいて、Claude 2は前作よりも2倍快適なユーザー体験を達成したという。しかし、クロード2にも幻覚や誤報がないわけではない。克服すべきハードルはまだたくさんあるとAnthropic社は主張している。
Anthropic社は、マーケティング・コピーライティングのためのジェネレーティブAIプラットフォームであるJasper社や、Claudeの強化された推論能力とより大きなコンテキスト・ウィンドウを利用して開発者のコード作成、修正、保守を支援するコードAIプラットフォームであるSourcegraph社などのパートナーを含め、何千もの企業がすでにClaude 2 APIを使用していると主張している。
企業顧客はClaude 1.3と同じ価格でClaude 2 APIを入手でき、ウェブチャットボットは米国と英国で無料ベータ版として利用できる。