Atualização
- A nova atualização de navegação garante que o ChatGPT não acessará mais sites que colocaram um bloqueio, mesmo que não haja paywall na frente dele.
- Por exemplo, não é mais possível acessar ou ler as últimas notícias do New York Times.
O ChatGPT agora pode acessar a internet novamente. De acordo com a OpenAI, o chatbot agora é melhor em seguir instruções de rastreamento de páginas da web.
Para clientes pagantes do ChatGPT Plus e Enterprise, a navegação na web está ativa novamente hoje. O recurso será lançado para todos os usuários “em breve”.
A OpenAI continua a usar o algoritmo do motor de busca da Microsoft para navegação na web. Para ativá-lo, você precisa selecionar “Navegar com o Bing” no menu suspenso em GPT-4.
De acordo com a OpenAI, a navegação no chatbot é particularmente útil para trabalhar com conteúdo recente que ocorreu após setembro de 2021, quando os dados de treinamento do ChatGPT terminam.
A OpenAI diz que a navegação do ChatGPT agora segue instruções de sites sobre qual conteúdo, se houver, o ChatGPT tem permissão para acessar. Isso é feito por meio de robôs.txt ou agentes de usuários, uma opção que alguns editores estão tomando. O ChatGPT também inclui links em suas respostas geradas para as fontes da web das quais tirou conteúdo.
ChatGPT can now browse the internet to provide you with current and authoritative information, complete with direct links to sources. It is no longer limited to data before September 2021. pic.twitter.com/pyj8a9HWkB
— OpenAI (@OpenAI) September 27, 2023
OpenAI melhora a higiene da web do ChatGPT
A OpenAI retirou o recurso de navegação no início de julho, depois de lançá-lo em versão beta em maio. Os usuários descobriram que o modelo de linguagem poderia contornar os paywalls dos editores. Um recurso que foi inadvertidamente incorporado, de acordo com a OpenAI, que o desabilitou, alegando que queria “fazer o certo pelos proprietários de conteúdo”.
No entanto, a OpenAI não menciona violações de paywall em seu anúncio da nova versão do Browsing, embora tenha sido citada como o principal motivo para a remoção do recurso. A referência a melhores robôs.txt e conformidade de agentes do usuário é provavelmente um reconhecimento de que a OpenAI considera o problema resolvido, ou pelo menos melhorado, sem ter que dizer isso explicitamente, uma vez que já está envolvido em processos judiciais suficientes por enquanto.
De qualquer forma, o raciocínio por trás de tirar o recurso do ar em julho parecia pretensioso e não bem pensado: o conteúdo paywall é uma pequena parte da receita da maioria das editoras. O que conta é o tráfego para o site como um todo.
O ChatGPT potencialmente prejudica todo o ecossistema de texto da Web baseado em tráfego se processar o texto atual da Web que ele extrai de sites gratuitamente, mas envia apenas uma pequena fração de seus usuários para a fonte do texto.
A mesma crítica se aplica ao Bing Chat da Microsoft e ao Search Generative Experience do Google. Embora todos os principais provedores de chatbots reconheçam o dilema, eles ainda não ofereceram soluções.