OpenAI, Google e Microsoft se reúnem com principais editoras para discutir o jornalismo na era da IA generativa. O maior desafio é o direito autoral.

As principais empresas de tecnologia estão conversando com grandes editoras sobre o uso de conteúdo jornalístico para treinar modelos de IA e utilizar o conteúdo em chatbots. News Corp, Axel Springer, The New York Times e The Guardian, por exemplo, teriam conversado com pelo menos uma das principais empresas de IA.

Diz-se que as empresas de tecnologia estão dispostas a pagar milhões e estão interessadas em relacionamentos de longo prazo. Além disso, algumas empresas de tecnologia estão em negociações sobre como as editoras podem usar a IA para aumentar suas receitas.

Negociações em estágio inicial

As negociações estão em estágio inicial. Em discussão está uma espécie de assinatura de conteúdo das empresas de IA para as editoras, que, por sua vez, teriam permissão para usar o conteúdo em sua tecnologia.

As estimativas atuais para o uso de conteúdo jornalístico compatível com os direitos autorais no treinamento de IA variam de US$ 5 milhões a US$ 20 milhões por ano. O Financial Times também está envolvido nas negociações e relata sobre elas.

De acordo com o Financial Times, o CEO da Axel Springer, Mathias Döpfner, está propondo um modelo quantitativo semelhante ao streaming de música. No entanto, isso exigiria que as empresas de IA fossem transparentes sobre o conteúdo utilizado para treinar seus modelos. A OpenAI, por exemplo, não divulga os dados de treinamento para o GPT-4, citando o ambiente competitivo.

Döpfner vê uma assinatura anual como uma segunda opção, pois isso colocaria em desvantagem os provedores de notícias menores e regionais. Ele defende uma solução colaborativa para toda a indústria.

“Se não houver incentivo para criar propriedade intelectual, não haverá nada a ser rastreado. E a inteligência artificial se tornará uma estupidez artificial”, disse Döpfner.

O Google supostamente concordou em licenciar conteúdo jornalístico para treinamento de IA e apresentou um modelo ao The Guardian e ao NewsUK. O Google confirma as negociações, mas não comenta sobre o conteúdo. A empresa está conversando com editoras de notícias nos EUA, Reino Unido e Europa, e já treinou a IA em conteúdos disponíveis publicamente, inclusive de editoras. Outra opção é dar às editoras mais controle sobre o uso de seu próprio conteúdo, por exemplo, oferecendo uma opção de exclusão voluntária.

O CEO da OpenAI, Sam Altman, teria conversado com a News Corp e o The New York Times. Ao introduzir o ChatGPT com acesso à internet, a OpenAI reconheceu que essa é uma “nova forma” de interagir com a internet. A empresa afirmou que aguarda sugestões sobre como direcionar o tráfego de volta para suas fontes e contribuir para a saúde do ecossistema.

Os chatbots de IA minam os ecossistemas de conteúdo estabelecidos

Existem dois problemas relacionados aos direitos autorais no contexto da inteligência artificial e da publicação. Primeiro, o conteúdo jornalístico faz parte dos dados de treinamento. Segundo, os chatbots conectados à internet acessam o conteúdo jornalístico em tempo real e o usam como modelo para gerar respostas, como um resumo curto.

O problema é que o criador do conteúdo original, ou seja, o editor, não recebe nada. Os usuários do chatbot não geram receita porque não acessam o site. No pior dos casos, o chatbot nem mesmo cita corretamente a fonte. A identidade da marca é perdida.

Além dos editores, esse desenvolvimento afeta de forma geral todos os provedores de conteúdo. Até mesmo o conteúdo de vídeo e podcasts de serviços como YouTube ou Spotify pode acabar sendo usado pelos chatbots na forma de resumos de texto curtos, trechos de áudio ou vídeos encurtados. Notícias, análises e conteúdos instrutivos provavelmente serão os mais afetados.