Atualização
- A nova atualização de navegação garante que o ChatGPT não acessará mais sites que colocaram um bloqueio, mesmo que não haja paywall na frente dele.
- Por exemplo, não é mais possível acessar ou ler as últimas notícias do New York Times.
O ChatGPT agora pode acessar a internet novamente. De acordo com a OpenAI, o chatbot agora é melhor em seguir instruções de rastreamento de páginas da web.
Para clientes pagantes do ChatGPT Plus e Enterprise, a navegação na web está ativa novamente hoje. O recurso será lançado para todos os usuários “em breve”.
A OpenAI continua a usar o algoritmo do motor de busca da Microsoft para navegação na web. Para ativá-lo, você precisa selecionar “Navegar com o Bing” no menu suspenso em GPT-4.
De acordo com a OpenAI, a navegação no chatbot é particularmente útil para trabalhar com conteúdo recente que ocorreu após setembro de 2021, quando os dados de treinamento do ChatGPT terminam.
A OpenAI diz que a navegação do ChatGPT agora segue instruções de sites sobre qual conteúdo, se houver, o ChatGPT tem permissão para acessar. Isso é feito por meio de robôs.txt ou agentes de usuários, uma opção que alguns editores estão tomando. O ChatGPT também inclui links em suas respostas geradas para as fontes da web das quais tirou conteúdo.
OpenAI melhora a higiene da web do ChatGPT
A OpenAI retirou o recurso de navegação no início de julho, depois de lançá-lo em versão beta em maio. Os usuários descobriram que o modelo de linguagem poderia contornar os paywalls dos editores. Um recurso que foi inadvertidamente incorporado, de acordo com a OpenAI, que o desabilitou, alegando que queria “fazer o certo pelos proprietários de conteúdo”.
No entanto, a OpenAI não menciona violações de paywall em seu anúncio da nova versão do Browsing, embora tenha sido citada como o principal motivo para a remoção do recurso. A referência a melhores robôs.txt e conformidade de agentes do usuário é provavelmente um reconhecimento de que a OpenAI considera o problema resolvido, ou pelo menos melhorado, sem ter que dizer isso explicitamente, uma vez que já está envolvido em processos judiciais suficientes por enquanto.
De qualquer forma, o raciocínio por trás de tirar o recurso do ar em julho parecia pretensioso e não bem pensado: o conteúdo paywall é uma pequena parte da receita da maioria das editoras. O que conta é o tráfego para o site como um todo.
O ChatGPT potencialmente prejudica todo o ecossistema de texto da Web baseado em tráfego se processar o texto atual da Web que ele extrai de sites gratuitamente, mas envia apenas uma pequena fração de seus usuários para a fonte do texto.
A mesma crítica se aplica ao Bing Chat da Microsoft e ao Search Generative Experience do Google. Embora todos os principais provedores de chatbots reconheçam o dilema, eles ainda não ofereceram soluções.