Con el Claude 2, Anthropic lanza un competidor directo para el ChatGPT. El chatbot ofrece características similares al chatbot de OpenAI, Google Bard o Bing Chat.
Anthropic fue fundada en 2021 por ex investigadores de OpenAI, está financiada con alrededor de 1.5 mil millones de dólares estadounidenses y se considera un competidor directo de OpenAI. Esta última, por supuesto, tiene una gran ventaja con su exitoso ChatGPT y el respaldo financiero de miles de millones de dólares de Microsoft. Sin embargo, el primer modelo de Anthropic pudo destacarse bastante bien, al menos en las pruebas de referencia.
Ahora, Anthropic avanza con el Claude 2. Según la startup, las mejoras incluyen habilidades de conversación mejoradas, una explicación más clara de su razonamiento, resultados más seguros, una memoria más larga y habilidades de programación, matemáticas y pensamiento mejoradas.
El modelo puede utilizarse para escribir documentos, memorandos, cartas, historias, documentación técnica o libros. Un aspecto destacado del Claude 2 es que puede procesar hasta 75,000 palabras (100,000 tokens) a la vez, lo cual es significativamente mayor que el límite estándar de 3,000 palabras del ChatGPT.
Esta capacidad permite que el chatbot considere más contexto en sus respuestas, mejorando la calidad de las respuestas y la variedad de tareas. La ventana de contexto extra grande ya fue anunciada por Anthropic en mayo para su primer modelo, Claude.
En la sección de preguntas de opción múltiple del Examen de la Barra de Abogados de los Estados Unidos, el Claude 2 tiene un rendimiento similar al del GPT-4, con un 76.5%. El GPT-3.5, el ChatGPT gratuito, tiene un promedio de alrededor del 50%. En la prueba de programación en Python Codex HumanEval, el Claude 2 alcanza el 71.2% (en comparación con el 56.0% del Claude 1.3), y en los problemas de matemáticas de la escuela primaria del GSM8k, alcanza el 88.0% (en comparación con el 85.2% del Claude 1.3).
Se espera que se implementen capacidades adicionales gradualmente en los próximos meses, según Anthropic.
El Claude 2 se lanza primero en el Reino Unido y en los Estados Unidos
El nuevo chatbot tomó alrededor de dos meses para ser desarrollado. Unas 35 personas trabajaron directamente en el modelo de IA, con otras 150 en funciones de apoyo. Al desarrollar el Claude 2, Anthropic afirma haber prestado especial atención a la seguridad.
A diferencia de OpenAI, Anthropic cuenta con un mecanismo de retroalimentación basado en IA en lugar de involucrar a humanos en la evaluación del contenido generado por la IA para optimizar el modelo, y establece reglas a través de una especie de constitución basada en los términos y condiciones de Apple, entre otras directrices.
En las pruebas de equipo rojo, donde el chatbot es provocado intencionalmente para cometer errores, el Claude 2 proporcionó una experiencia de usuario dos veces más agradable que su predecesor, según Anthropic. Sin embargo, el Claude 2 no está libre de alucinaciones o información incorrecta. Anthropic afirma que todavía hay muchos obstáculos por superar.
Anthropic afirma que miles de empresas ya están utilizando la API del Claude 2, incluyendo socios como Jasper, una plataforma de IA generativa para redacción de marketing, y Sourcegraph, una plataforma de IA de código que utiliza las capacidades de razonamiento mejoradas y las ventanas de contexto más grandes de Claude para ayudar a los desarrolladores a escribir, corregir y mantener código.
Los clientes empresariales pueden obtener la API del Claude 2 al mismo precio que el Claude 1.3, y el chatbot web está disponible como una versión beta gratuita en los Estados Unidos y el Reino Unido.