OpenAIは、最新のテキストジェネレータテンプレートであるGPT-4のAPI経由での一般提供を発表した。
今日の午後の時点で、「支払いに成功した履歴を持つ」すべての既存のOpenAI API開発者はGPT-4にアクセスできます。同社は、今月末までに新しい開発者にアクセスを開放し、その後「計算機の利用可能性に応じて」利用可能な制限を増やし始める予定です。
「3月以来、何百万人もの開発者がGPT-4 APIへのアクセスを要求しており、GPT-4を活用した革新的な製品の種類は日々増えています」とOpenAIはブログ投稿に書いている。「我々は、チャットベースのモデルがあらゆるユースケースをサポートできる未来を想像している。
GPT-4は、テキスト(コードを含む)を生成し、画像とテキスト入力を受け入れることができ、テキストしか受け入れなかったその前身GPT-3.5よりも改善され、いくつかの専門的および学術的ベンチマークで「人間レベル」のパフォーマンスを持っています。OpenAIの以前のGPTモデルと同様に、GPT-4は、OpenAIによってライセンスされたデータだけでなく、公開されたウェブページを含む一般に利用可能なデータを使用して訓練されました。
この画像理解機能は、まだすべてのOpenAIの顧客が利用できるわけではありません。OpenAIはまず、1つのパートナーであるBe My Eyesとこの機能を試している。しかし、より多くの顧客に開放する時期については明らかにしていない。
現在最高の生成AIモデルと同様に、GPT-4も完璧ではないことは注目に値する。GPT-4は事実を「幻覚」し、時には確信を持って推論の誤りを犯す。また、経験から学ぶこともなく、生成するコードにセキュリティの脆弱性を導入するような難しい問題では失敗する。
将来的には、OpenAIの他のテキストジェネレーターモデルですでに可能であったように、GPT-4とGPT-3.5 Turboを開発者自身のデータでチューニングできるようにするとOpenAIは言っている。OpenAIによると、この機能は今年後半に登場する予定です。
3月のGPT-4の発表以来、生成AIの競争は激しくなっている。Anthropic社は最近、同社の代表的なテキスト生成AIモデルであるClaudeのコンテキストウィンドウを9,000トークンから100,000トークンに拡張した(コンテキストウィンドウとは、モデルが追加のテキストを生成する前に考慮するテキストのことで、トークンは生のテキストを表す。)
GPT-4は、最大32,000個のトークンを持つコンテキスト・ウィンドウという点で、以前の記録を保持していた。一般的に、コンテキストウィンドウが小さいモデルは、最近の会話の内容を「忘れて」しまい、トピックから外れてしまう傾向がある。
DALL-E2はOpenAIの画像生成モデルで、”Whisper “は同社の音声テキスト変換モデルを指す。DALL-E2はOpenAIの画像生成モデルで、”Whisper “はOpenAIの音声テキストモデルを指す。同社はまた、「計算能力を最適化する」ために、APIを通じて利用可能な古いモデルを廃止する予定であると述べている。(ここ数ヶ月、ChatGPTの人気の高まりが主な原因で、OpenAIはその生成モデルの需要を満たすのに苦労している)。
2024年1月4日をもって、特定の古いOpenAIテンプレート(特にGPT-3とその派生)は利用できなくなり、より処理効率が高いと推定される新しい「ベースGPT-3」テンプレートに置き換えられます。旧テンプレートを使用している開発者は、1月4日までに統合を手動で更新する必要があり、それ以降も調整済みの旧テンプレートを使用したい開発者は、新しいGPT-3ベーステンプレートに基づいて置き換えを調整する必要があります。
「OpenAIは、「この移行をできるだけスムーズに行うため、以前にテンプレートを調整したユーザーにはサポートを提供する予定です。「今後数週間のうちに、これらの古いテンプレートを最近使用した開発者に連絡を取り、新しい完了テンプレートが初期テストの準備が整い次第、より詳しい情報を提供する予定だ。TechCrunchからの内容です。