«Según Sam Altman, los creadores de contenido que contribuyen a las capacidades de un modelo de IA se beneficiarán de él en el futuro. Cómo exactamente aún no está claro.
Durante una cumbre de IA en la Casa Blanca, el CEO de OpenAI, Sam Altman, dijo que su empresa está trabajando en modelos de IA que respeten los derechos de autor. El objetivo, dijo, es que los creadores de contenido sean compensados cuando su contenido, o en el caso de las imágenes, su estilo, sea utilizado. Los detalles técnicos aún no se conocen.
Cuando OpenAI presentó los complementos de ChatGPT, mostró una comprensión del impacto potencial de un gran modelo de lenguaje con herramientas en el ecosistema de contenido. Cuanta más interacción haya en el ecosistema de chatbots, menos atención, y por lo tanto menos dinero, recibirán los creadores de contenido por sus productos fuera del chatbot.
«Apreciamos que esta sea una nueva forma de interactuar con la web y agradecemos los comentarios sobre formas adicionales de dirigir el tráfico de regreso a las fuentes y contribuir a la salud general del ecosistema», escribe OpenAI.
Posibles opciones para la generación de texto podrían incluir una solución de transmisión similar a Spotify, basada en los tokens utilizados si la generación se puede atribuir de manera exclusiva a las fuentes, o una tarifa fija basada en la cantidad de datos proporcionados a OpenAI. Actualmente, los sitios web pueden indicar técnicamente si desean o no ser rastreados por ChatGPT, similar al índice de Google.
Modelos de IA y derechos de autor: es complicado
El uso de imágenes y texto para entrenar grandes modelos de IA sin el consentimiento explícito ya es controvertido desde el punto de vista de los derechos de autor. Además, los modelos generativos de IA son capaces de producir texto o imágenes muy similares al original. Hay casos judiciales internacionales pendientes. Uno de los más grandes es el de Getty Images vs. Stability AI (Stable Diffusion).
OpenAI y otras empresas de IA podrían abordar esto utilizando solo datos para entrenar grandes modelos de IA cuando esté claro que esto está permitido. La pregunta es si es económicamente viable recopilar la cantidad necesaria de datos con permiso.
Mientras que los modelos de lenguaje preentrenados son relativamente estáticos y actualmente solo se actualizan cada pocos meses o incluso años, ChatGPT, por ejemplo, puede utilizar un complemento de navegador para consumir información en tiempo real de la web y combinarla con el conocimiento de los datos de entrenamiento. Esta capacidad en tiempo real de los grandes modelos de lenguaje con herramientas (complementos) lleva el debate sobre los derechos de autor a un nuevo nivel.
El chatbot de Bing de Microsoft funciona de manera similar. El CEO de Microsoft, Satya Nadella, prometió a los editores que el tráfico de salida del chatbot se considerará un factor de éxito para el producto y que los editores compartirán su éxito.
Todavía no está claro cómo y si funcionará. Incluso si los chatbots pueden nombrar fuentes, es probable que el número de visitas al sitio web en la era del chatbot disminuya drásticamente a medida que más y más tareas web se realicen a través de una interfaz de chatbot.»