OpenAI, la empresa detrás de la popular herramienta de IA generativa ChatGPT, podría verse obligada a borrar por completo su chatbot y comenzar desde cero, según un nuevo informe de NPR (a través de Ars Technica). Esta medida podría ocurrir como parte de una posible acción legal que también podría resultar en una multa de hasta $150,000 por cada material protegido por derechos de autor utilizado para entrenar el modelo de lenguaje.
El ChatGPT ha causado bastante revuelo en los últimos meses, especialmente a medida que los usuarios han encontrado diversas formas de utilizar la herramienta de IA generativa. Uno de nuestros propios colaboradores, Chris Smith, incluso utilizó el ChatGPT para entrenarse para una media maratón, y ahora también estamos viendo su uso para crear reseñas generadas por IA. Sin embargo, el éxito del modelo de lenguaje detrás de la IA generativa podría haber tenido un costo muy alto.
Resulta que los modelos de lenguaje como GPT-3.5 y GPT-4, que hacen funcionar al ChatGPT, se entrenan utilizando datos de terceros. OpenAI incluso creó un bot de raspado web que puede extraer información de sitios web para entrenar al modelo GPT. Sin embargo, el problema aquí es que OpenAI no solo está utilizando materiales disponibles de manera gratuita y sin derechos de autor. También está empleando materiales protegidos por derechos de autor para entrenar sus modelos de IA, y está haciendo esto sin permiso.
Según un nuevo informe de Ashley Belanger, de Ars Technica, The New York Times está actualmente considerando la posibilidad de demandar a OpenAI después de actualizar sus términos de servicio para prohibir que la IA raspe sus artículos e imágenes para entrenar modelos de lenguaje. La naturaleza exacta de las posibles consecuencias legales para OpenAI no está clara, pero los expertos han dicho a Ars que esto podría resultar en que OpenAI pague hasta $150,000 por cada contenido infractor.
Además, el proceso legal podría obligar a OpenAI a borrar por completo el ChatGPT y comenzar desde cero en el entrenamiento de su modelo de lenguaje, lo que esencialmente invalidaría todo el trabajo que la empresa ha realizado en el modelo hasta ahora. No es la primera vez que vemos a OpenAI enfrentando procesos legales. Autores conocidos, como Sarah Silverman, se han unido para demandar a la empresa por preocupaciones similares, todos buscando proteger los derechos de autor del material que han creado.
Es una situación realmente complicada. Si OpenAI es demandada por The New York Times, esto podría llevar a otras empresas y sitios web a tomar medidas similares para proteger su trabajo. También es posible, como señala NPR, que The New York Times y OpenAI lleguen a algún tipo de acuerdo de licencia, permitiendo que la empresa pague a The New York Times por el acceso a su contenido, que luego estaría disponible legalmente para entrenar su modelo GPT.
Si The New York Times sigue adelante con su demanda o si OpenAI tendrá que borrar el ChatGPT aún está por verse. Sin embargo, esto continúa alimentando la crítica de que estos modelos de lenguaje siempre parecen depender en gran medida del trabajo que otros ya han realizado, lo que es una de las razones por las que muchas personas tienen problemas con ellos.