A OpenAI, a empresa por trás da popular ferramenta de IA generativa ChatGPT, pode ser obrigada a apagar completamente seu chatbot e começar do zero, de acordo com um novo relatório da NPR (via Ars Technica). A limpeza pode ocorrer como parte de uma possível ação judicial que também poderia resultar em uma multa de até US$ 150.000 por cada material protegido por direitos autorais usado para treinar o modelo de linguagem.

O ChatGPT tem causado bastante alvoroço nos últimos meses, especialmente à medida que os usuários encontraram várias maneiras de usar a ferramenta de IA generativa. Um dos nossos próprios colaboradores, Chris Smith, até usou o ChatGPT para treinar para uma meia maratona, e agora também estamos vendo sua utilização para criar avaliações geradas por IA. No entanto, o sucesso do modelo de linguagem por trás da IA generativa pode ter tido um custo muito alto.

Veja, modelos de linguagem como o GPT-3.5 e o GPT-4 – que fazem o ChatGPT funcionar – são treinados usando dados de terceiros. E a OpenAI até criou um bot de raspagem da web que pode extrair informações de sites para treinar o modelo GPT. O problema aqui, no entanto, é que a OpenAI não está apenas se baseando em materiais gratuitamente disponíveis e não protegidos por direitos autorais. Ela também está usando materiais protegidos por direitos autorais para treinar seus modelos de IA, e está fazendo isso sem permissão.

ChatGPT homepage

De acordo com um novo relatório de Ashley Belanger, da Ars Technica, o New York Times está atualmente discutindo a possibilidade de processar a OpenAI após atualizar seus termos de serviço para proibir que IA raspe seus artigos e imagens para treinar modelos de linguagem. A natureza exata das possíveis consequências legais para a OpenAI não está clara, mas especialistas disseram à Ars que isso poderia resultar na OpenAI pagando até $150.000 por cada conteúdo infrator.

Além disso, o processo judicial poderia forçar a OpenAI a apagar o ChatGPT e começar completamente do zero no treinamento de seu modelo de linguagem, algo que essencialmente invalidaria todo o trabalho que a empresa realizou no modelo até agora. Esta não é a primeira vez que vemos a OpenAI enfrentando processos judiciais. Autores conhecidos, como Sarah Silverman, se uniram para processar a empresa por preocupações semelhantes, todos buscando proteger os direitos autorais do material que criaram.

É uma situação realmente complicada. Se a OpenAI for processada pelo New York Times, isso poderia levar outras empresas e sites a tomar medidas semelhantes para proteger seu trabalho. Também é possível, como observa a NPR, que o NYT e a OpenAI cheguem a algum tipo de acordo de licenciamento, permitindo que a empresa pague ao NYT pelo acesso ao seu conteúdo, que então estaria legalmente disponível para treinar seu modelo GPT.

Se o Times seguir adiante com sua ação judicial ou se a OpenAI terá que apagar o ChatGPT ainda está por ser visto. No entanto, isso continua a alimentar a crítica de que esses modelos de linguagem sempre pareceram depender muito do trabalho que outros já realizaram, o que é uma das razões pelas quais muitas pessoas têm problemas com eles.