O competidor do ChatGPT da Anthropic, Claude, agora pode processar centenas de páginas de texto, ultrapassando o GPT-4.
A janela de contexto de um chatbot como o ChatGPT determina a quantidade de texto que o modelo de IA pode processar por vez. No GPT-4 disponível da OpenAI, a janela é de pouco menos de 8.000 tokens e uma variante com pouco menos de 32.000 tokens está em testes fechados.
A startup de IA Anthropic está agora expandindo a janela de contexto de seu competidor ChatGPT Claude de pouco menos de 9.000 tokens para 100.000 tokens. De acordo com a empresa, isso é equivalente a cerca de 75.000 palavras, ou centenas de páginas de texto.
Claude é capaz de processar essa quantidade em menos de um minuto
Em um exemplo, a empresa mudou uma frase no clássico “The Great Gatsby” e perguntou a Claude se algo havia mudado. Claude encontrou a frase alterada em 22 segundos.
Com o grande janela de contexto, Claude deve ser capaz de combinar conhecimento de múltiplos documentos ou de um livro inteiro para negócios, por exemplo. “Para questões complexas, isso provavelmente funcionará substancialmente melhor do que abordagens baseadas em pesquisa vetorial”, diz Anthropic.
As empresas já estão usando bancos de dados vetoriais de fornecedores como Pinecone para armazenar grandes quantidades de texto e torná-lo processável para o ChatGPT ou outros modelos de linguagem. Se a janela de contexto realmente oferece vantagens sobre esses bancos de dados vetoriais ainda precisa ser visto.
Anthropic vê numerosas aplicações que poderiam se beneficiar da janela de contexto
Claude poderia criar resumos de podcasts transcritos – 100.000 tokens equivalem a cerca de seis horas de áudio – ou tornar centenas de páginas de documentação de API pesquisáveis, de acordo com Anthropic.
Outros casos de uso incluem:
- Digestão, resumo e explicação de documentos densos como demonstrações financeiras ou trabalhos de pesquisa
- Análise de riscos e oportunidades estratégicas para uma empresa com base em seus relatórios anuais
- Avaliação dos prós e contras de um projeto de lei
- Identificação de riscos, temas e diferentes formas de argumento em documentos legais
- Leitura de centenas de páginas de documentação de desenvolvedor e destaque de respostas para questões técnicas
- Prototipagem rápida, jogando um código inteiro dentro do contexto e construindo ou modificando-o de forma inteligente
A janela de contexto de 100.000 tokens agora está disponível através da API do Claude.