Ação judicial da Ziff Davis contra a OpenAI
A empresa de mídia Ziff Davis entrou com um processo contra a OpenAI no Tribunal Distrital dos EUA em Delaware, alegando extensas violações de direitos autorais, infrações da Lei dos Direitos Autorais do Milênio Digital (DMCA), enriquecimento ilícito e diluição de marca.
Detalhes da queixa sobre web scraping e remoção de direitos autorais
A ação descreve como o rastreador web GPTBot da OpenAI supostamente ignorou os arquivos robots.txt que proíbem a coleta de conteúdo. Documentos judiciais indicam que a atividade do rastreador aumentou após a Ziff Davis enviar uma carta de cessar e desistir em maio de 2024.
A queixa alega que a OpenAI utilizou um software especializado para remover as informações de direitos autorais dos artigos. Como evidência, é apontado o conjunto de dados público “WebText”, que contém conteúdo da Ziff Davis sem a devida atribuição. Análises demonstram que o material da Ziff Davis aparece milhões de vezes nos dados de treinamento, em taxas que superam sua presença normal na web.
Reprodução de conteúdo e problemas de atribuição
Testes realizados pela Ziff Davis demonstram que os modelos da OpenAI podem reproduzir trechos exatos de seus artigos, mesmo quando offline, o que sugere a cópia direta dos dados de treinamento. Com o acesso à internet habilitado, os modelos recuperam ativamente o conteúdo da Ziff Davis.
O processo também detalha como os produtos da OpenAI podem deturpar o material da Ziff Davis, gerando resumos incorretos, atribuindo citações equivocadas, criando links falsos para artigos ou “alucinando” fatos – que são atribuídos erroneamente às publicações do grupo. Tais práticas, segundo a empresa, diluem a marca e prejudicam sua reputação como fonte confiável de informações.
O processo ainda demonstra que o ChatGPT cita artigos desatualizados e ignora conteúdos recentes e mais relevantes da mesma fonte, o que, de acordo com a Ziff Davis, prejudica suas marcas. Estudos independentes também identificaram que os chatbots podem deturpar conteúdos jornalísticos ou citar fontes incorretas.
A empresa considera o conteúdo gerado por inteligência artificial uma ameaça fundamental ao seu negócio, argumentando que ele compete diretamente com os artigos originais e desvia o tráfego dos usuários, prejudicando investimentos em publicidade e receitas oriundas de comissões. Alega-se que a OpenAI lucra com o investimento e o trabalho da Ziff Davis sem a devida compensação, enquanto firma acordos de licenciamento com outros veículos de mídia.
O processo busca indenizações, honorários advocatícios e uma liminar permanente, além de solicitar a destruição de todos os conjuntos de dados e modelos de IA da OpenAI que contenham ou derivem de obras da Ziff Davis. Segundo os documentos, a OpenAI rejeitou tentativas anteriores de negociação de um acordo de licenciamento.
Recentemente, a OpenAI e outras empresas de IA firmaram acordos de licenciamento pouco transparentes com determinadas organizações de mídia, muitas vezes de forma retroativa, com o intuito de evitar litígios futuros quanto ao uso de conteúdo em treinamentos de IA. Essas práticas posicionam as empresas de IA como verdadeiras guardiãs, com a discricionariedade para determinar quais publicações se beneficiarão financeiramente. A concentração desse poder pode representar uma ameaça ainda maior à diversidade na mídia do que a atual dependência dos mecanismos de busca, uma vez que os usuários raramente deixam as plataformas dos chatbots.
O caso da Ziff Davis é apenas um dos muitos (um dos muitos) processos em andamento entre provedores de conteúdo e empresas de inteligência artificial. A OpenAI enfrenta atualmente mais de 15 disputas judiciais nesse contexto, e o litígio envolvendo The New York Times e a OpenAI é considerado um caso emblemático quanto ao uso de textos protegidos por direitos autorais em treinamentos de IA.