Inteligência Artificial, Notícias

O Google diz que vai coletar tudo o que você posta online para a IA

Atualizado em 04/07/2023

Faça parte da comunidade

Entre para nossa lista e receba conteúdos exclusivos

Uma atualização na política de privacidade do Google sugere que todo o conteúdo público da internet está disponível para seus projetos de IA.

O Google atualizou sua política de privacidade no fim de semana, dizendo explicitamente que a empresa reserva o direito de coletar praticamente tudo o que você posta online para construir suas ferramentas de IA. Se o Google pode ler suas palavras, assuma que elas agora pertencem à empresa e espere que estejam armazenadas em algum lugar nas entranhas de um chatbot.

“O Google usa informações para melhorar nossos serviços e desenvolver novos produtos, recursos e tecnologias que beneficiam nossos usuários e o público”, diz a nova política do Google. “Por exemplo, usamos informações disponíveis publicamente para ajudar a treinar os modelos de IA do Google e construir produtos e recursos como o Google Tradutor, Bard e recursos de IA na nuvem.”

Felizmente para os fãs de história, o Google mantém um histórico de alterações em seus termos de serviço. A nova linguagem altera uma política existente, especificando novas formas como seus pensamentos online podem ser usados nas ferramentas de IA da gigante da tecnologia.

Anteriormente, o Google afirmava que os dados seriam usados “para modelos de linguagem”, em vez de “modelos de IA”, e a política anterior mencionava apenas o Google Tradutor, enquanto Bard e recursos de IA na nuvem agora também são mencionados.

Essa é uma cláusula incomum em uma política de privacidade. Normalmente, essas políticas descrevem maneiras pelas quais uma empresa usa as informações que você posta nos próprios serviços da empresa. Aqui, parece que o Google reserva o direito de coletar e usar dados postados em qualquer parte da web pública, como se toda a internet fosse o playground de IA da empresa. O Google não respondeu imediatamente a um pedido de comentário.

Essa prática levanta novas e interessantes questões de privacidade. As pessoas geralmente entendem que as postagens públicas são públicas. Mas hoje em dia, é preciso ter um novo modelo mental do que significa escrever algo online. Não se trata mais apenas de quem pode ver as informações, mas de como elas podem ser usadas. Existe uma boa chance de que Bard e ChatGPT tenham absorvido suas postagens esquecidas de blogs ou avaliações de restaurantes de 15 anos atrás. Enquanto você lê isso, os chatbots podem estar regurgitando uma versão humoncóide das suas palavras de maneiras imprevisíveis e difíceis de entender.

Uma das complicações menos óbvias do mundo pós-ChatGPT é a questão de onde os chatbots ávidos por dados obtiveram suas informações. Empresas como Google e OpenAI coletaram grandes partes da internet para alimentar seus hábitos robóticos. Não está claro se isso é legal, e nos próximos anos os tribunais lidarão com questões de direitos autorais que teriam parecido ficção científica alguns anos atrás. Enquanto isso, o fenômeno já afeta os consumidores de maneiras inesperadas.

Os chefões do Twitter e do Reddit se sentem particularmente prejudicados com a questão da IA e fizeram mudanças controversas para restringir suas plataformas. Ambas as empresas desativaram o acesso gratuito às suas APIs, o que permitia que qualquer pessoa baixasse grandes quantidades de postagens. Isso supostamente é para proteger os sites de mídia social de outras empresas que coletam sua propriedade intelectual, mas isso teve outras consequências.

As mudanças nas APIs do Twitter e do Reddit quebraram ferramentas de terceiros que muitas pessoas usavam para acessar esses sites. Por um momento, até parecia que o Twitter ia exigir que entidades públicas como serviços meteorológicos, de transporte e de emergência pagassem para fazer um tweet, uma medida que a empresa recuou após uma enxurrada de críticas.

Ultimamente, a raspagem de dados da web é o bicho-papão favorito de Elon Musk. Musk atribuiu diversos desastres recentes no Twitter à necessidade da empresa de impedir que outros coletem dados do seu site, mesmo quando os problemas parecem não estar relacionados. No fim de semana, o Twitter limitou o número de tweets que os usuários podem ver por dia, tornando o serviço quase inutilizável. Musk disse que foi uma resposta necessária à “raspagem de dados” e à “manipulação do sistema”. No entanto, a maioria dos especialistas em TI concordou que a limitação de taxa provavelmente foi uma resposta de crise a problemas técnicos decorrentes de má gestão, incompetência ou ambos. O Twitter não respondeu às perguntas do Gizmodo sobre o assunto.

No Reddit, o efeito das mudanças nas APIs foi especialmente barulhento. O Reddit é essencialmente administrado por moderadores não remunerados que mantêm os fóruns saudáveis. Os moderadores de subreddits grandes costumam depender de ferramentas de terceiros para o seu trabalho, ferramentas que são construídas em cima de APIs que agora não estão mais acessíveis. Isso provocou um protesto em massa, no qual os moderadores basicamente fecharam o Reddit. Embora a controvérsia ainda esteja em curso, é provável que tenha consequências permanentes, à medida que os moderadores rejeitados abandonam suas funções.

Com conteúdo da Gizmodo.

André Lug

Fundador da Iglu Online e escritor do blog André Lug. Como especialista em Inteligência Artificial e criação de conteúdo, traz conteúdos sobre IA, produtividade e empreendedorismo.

O Google diz que vai coletar tudo o que você posta online para a IA

Entre para nossa lista e receba conteúdos exclusivos

André Lug

Deixe um comentário Cancelar resposta

Inscreva-se em nossa newsletter

por onde andamos