Avec Claude 2, Anthropic lance un concurrent direct pour ChatGPT. Ce chatbot offre des fonctionnalités similaires à celles du chatbot d’OpenAI, de Google Bard ou de Bing Chat.
Anthropic a été fondée en 2021 par d’anciens chercheurs d’OpenAI, elle est financée à hauteur d’environ 1,5 milliard de dollars américains et est considérée comme un concurrent direct d’OpenAI. Cette dernière a bien sûr un avantage considérable avec son ChatGPT extrêmement réussi et le soutien financier de plusieurs milliards de dollars de Microsoft. Cependant, le premier modèle d’Anthropic a réussi à se démarquer assez bien, du moins dans les benchmarks.
Maintenant, Anthropic avance avec Claude 2. Selon la startup, les améliorations comprennent des compétences conversationnelles améliorées, une explication plus claire de son raisonnement, des résultats plus inoffensifs, une mémoire plus longue et des compétences améliorées en programmation, en mathématiques et en réflexion.
Le modèle peut être utilisé pour rédiger des documents, des mémos, des lettres, des histoires, de la documentation technique ou des livres. Un point fort de Claude 2 est qu’il peut traiter jusqu’à 75 000 mots (100 000 tokens) à la fois, ce qui est considérablement plus élevé que la limite standard de 3 000 mots de ChatGPT.
Cela permet au chatbot de prendre en compte un contexte plus large dans ses réponses, améliorant ainsi la qualité des réponses et la variété des tâches. La fenêtre de contexte extra-large a déjà été annoncée par Anthropic en mai pour le premier modèle, Claude.
Dans la section des questions à choix multiples de l’examen du Barreau des États-Unis, Claude 2 obtient des performances similaires à celles du GPT-4, avec un score de 76,5%. Le GPT-3.5, le ChatGPT gratuit, a quant à lui une moyenne d’environ 50%. Dans le test de programmation Python Codex HumanEval, Claude 2 obtient un score de 71,2% (contre 56,0% pour Claude 1.3), et dans les problèmes mathématiques de l’enseignement primaire du GSM8k, il atteint 88,0% (contre 85,2% pour Claude 1.3).
Des capacités supplémentaires sont prévues et seront mises en œuvre progressivement au cours des prochains mois, selon Anthropic.
Claude 2 est d’abord lancé au Royaume-Uni et aux États-Unis
Le nouveau chatbot a pris environ deux mois pour être développé. Environ 35 personnes ont travaillé directement sur le modèle d’IA, avec 150 autres dans des rôles de soutien. Lors du développement de Claude 2, Anthropic affirme avoir accordé une attention particulière à la sécurité.
Contrairement à OpenAI, Anthropic utilise un mécanisme de rétroaction basé sur l’IA au lieu de faire intervenir des êtres humains pour évaluer le contenu généré par l’IA afin d’optimiser le modèle, et établit des règles à travers une sorte de constitution basée sur les conditions générales d’Apple, entre autres directives.
Lors des tests de l’équipe rouge, où le chatbot est intentionnellement poussé à commettre des erreurs, Claude 2 a offert une expérience utilisateur deux fois plus agréable que son prédécesseur, selon Anthropic. Cependant, Claude 2 n’est pas exempt d’hallucinations ou d’informations incorrectes. Anthropic affirme qu’il reste encore de nombreux obstacles à surmonter.
Anthropic affirme que des milliers d’entreprises utilisent déjà l’API de Claude 2, notamment des partenaires tels que Jasper, une plateforme d’IA générative pour la rédaction marketing, et Sourcegraph, une plateforme d’IA de code qui utilise les capacités de raisonnement améliorées et les fenêtres de contexte plus grandes de Claude pour aider les développeurs à écrire, corriger et maintenir du code.
Les clients professionnels peuvent obtenir l’API de Claude 2 au même prix que Claude 1.3, et le chatbot web est disponible en version bêta gratuite aux États-Unis et au Royaume-Uni.