Com o Claude 2, a Anthropic lança um concorrente direto para o ChatGPT. O chatbot oferece recursos semelhantes ao chatbot da OpenAI, Google Bard ou Bing Chat.
A Anthropic foi fundada em 2021 por ex-pesquisadores da OpenAI, é financiada com cerca de 1,5 bilhão de dólares americanos e é vista como uma concorrente direta da OpenAI. Esta última, é claro, tem uma grande vantagem com o seu ChatGPT extremamente bem-sucedido e o apoio financeiro de bilhões de dólares da Microsoft. No entanto, o primeiro modelo da Anthropic foi capaz de se destacar bastante bem, pelo menos nos benchmarks.
Agora, a Anthropic está seguindo em frente com o Claude 2. De acordo com a startup, as melhorias incluem habilidades de conversação aprimoradas, uma explicação mais clara de seu raciocínio, resultados mais inofensivos, uma memória mais longa e habilidades de programação, matemática e pensamento aprimoradas.
O modelo pode ser usado para escrever documentos, memorandos, cartas, histórias, documentação técnica ou livros. Um destaque do Claude 2 é que ele pode processar até 75.000 palavras (100.000 tokens) de uma vez, o que é significativamente maior do que o limite padrão de 3.000 palavras do ChatGPT.
Isso permite que o chatbot considere mais contexto em suas respostas, melhorando a qualidade das respostas e a variedade de tarefas. A janela de contexto extra grande já foi anunciada pela Anthropic em maio para o primeiro modelo, o Claude.
Na seção de múltipla escolha do Exame da Ordem dos Advogados dos Estados Unidos, o Claude 2 tem um desempenho semelhante ao do GPT-4, com 76,5%. O GPT-3.5, o ChatGPT gratuito, tem uma média de apenas cerca de 50%. No teste de programação em Python Codex HumanEval, o Claude 2 alcança 71,2% (em comparação com 56,0% do Claude 1.3), e nos problemas de matemática do ensino fundamental do GSM8k, ele alcança 88,0% (em comparação com 85,2% do Claude 1.3).
Capacidades adicionais estão no horizonte e serão implementadas gradualmente nos próximos meses, de acordo com a Anthropic.
O Claude 2 é lançado primeiro no Reino Unido e nos Estados Unidos
O novo chatbot levou cerca de dois meses para ser desenvolvido. Cerca de 35 pessoas trabalharam diretamente no modelo de IA, com outras 150 em funções de apoio. Ao desenvolver o Claude 2, a Anthropic diz ter prestado atenção especial à segurança.
Ao contrário da OpenAI, a Anthropic conta com um mecanismo de feedback baseado em IA, em vez de envolver seres humanos na avaliação do conteúdo gerado pela IA para otimizar o modelo, e estabelece regras através de uma espécie de constituição baseada nos termos e condições da Apple, entre outras diretrizes.
Nos testes de equipe vermelha, onde o chatbot é provocado intencionalmente para cometer erros, o Claude 2 obteve uma experiência do usuário duas vezes mais agradável do que seu antecessor, de acordo com a Anthropic. No entanto, o Claude 2 não está livre de alucinações ou informações incorretas. A Anthropic afirma que ainda há muitos obstáculos a serem superados.
A Anthropic afirma que milhares de empresas já estão utilizando a API do Claude 2, incluindo parceiros como Jasper, uma plataforma de IA generativa para redação de marketing, e Sourcegraph, uma plataforma de IA de código que utiliza as capacidades de raciocínio aprimoradas e janelas de contexto maiores do Claude para ajudar desenvolvedores a escrever, corrigir e manter código.
Clientes empresariais podem obter a API do Claude 2 pelo mesmo preço do Claude 1.3, e o chatbot web está disponível como um beta gratuito nos EUA e no Reino Unido.