Una actualización en la política de privacidad de Google sugiere que todo el contenido público de internet está disponible para sus proyectos de IA.
Google actualizó su política de privacidad durante el fin de semana, afirmando explícitamente que la empresa se reserva el derecho de recopilar prácticamente todo lo que publiques en línea para construir sus herramientas de IA. Si Google puede leer tus palabras, asume que ahora pertenecen a la empresa y espera que estén almacenadas en algún lugar en las entrañas de un chatbot.
«Google utiliza la información para mejorar nuestros servicios y desarrollar nuevos productos, características y tecnologías que beneficien a nuestros usuarios y al público en general», dice la nueva política de Google. «Por ejemplo, utilizamos información disponible públicamente para ayudar a entrenar los modelos de IA de Google y construir productos y características como Google Traductor, Bard y funciones de IA en la nube».
Afortunadamente para los aficionados a la historia, Google mantiene un historial de cambios en sus términos de servicio. El nuevo lenguaje modifica una política existente, especificando nuevas formas en las que tus pensamientos en línea pueden ser utilizados en las herramientas de IA del gigante tecnológico.
Anteriormente, Google afirmaba que los datos se utilizarían «para modelos de lenguaje» en lugar de «modelos de IA», y la política anterior solo mencionaba a Google Traductor, mientras que ahora también se mencionan Bard y las funciones de IA en la nube.
Esta es una cláusula inusual en una política de privacidad. Normalmente, estas políticas describen cómo una empresa utiliza la información que publicas en sus propios servicios. Aquí, parece que Google se reserva el derecho de recopilar y utilizar datos publicados en cualquier parte de la web pública, como si toda la internet fuera el patio de recreo de IA de la empresa. Google no respondió de inmediato a una solicitud de comentarios.
Esta práctica plantea nuevas e interesantes cuestiones de privacidad. Las personas generalmente entienden que las publicaciones públicas son públicas. Pero hoy en día, se necesita un nuevo modelo mental sobre lo que significa escribir algo en línea. Ya no se trata solo de quién puede ver la información, sino de cómo puede ser utilizada. Existe una buena posibilidad de que Bard y ChatGPT hayan absorbido tus publicaciones olvidadas de blogs o reseñas de restaurantes de hace 15 años. Mientras lees esto, los chatbots podrían estar regurgitando una versión humanoide de tus palabras de manera impredecible y difícil de entender.
Una de las complicaciones menos evidentes del mundo posterior a ChatGPT es la cuestión de dónde obtuvieron su información los chatbots ávidos de datos. Empresas como Google y OpenAI han recopilado grandes partes de internet para alimentar sus hábitos robóticos. No está claro si esto es legal, y en los próximos años los tribunales se ocuparán de cuestiones de derechos de autor que hubieran parecido ciencia ficción hace algunos años. Mientras tanto, el fenómeno ya está afectando a los consumidores de maneras inesperadas.
Los jefes de Twitter y Reddit se sienten particularmente perjudicados por la cuestión de la IA y han realizado cambios controvertidos para restringir sus plataformas. Ambas empresas han desactivado el acceso gratuito a sus APIs, lo que permitía que cualquier persona descargara grandes cantidades de publicaciones. Se supone que esto es para proteger a los sitios de redes sociales de otras empresas que recopilan su propiedad intelectual, pero ha tenido otras consecuencias.
Los cambios en las APIs de Twitter y Reddit han afectado especialmente a las herramientas de terceros que muchas personas usaban para acceder a estos sitios. Por un momento, incluso parecía que Twitter iba a exigir que entidades públicas como servicios meteorológicos, de transporte y de emergencia pagaran para hacer un tweet, medida que la empresa revocó después de recibir una avalancha de críticas.
Recientemente, la extracción de datos web se ha convertido en el coco favorito de Elon Musk. Musk atribuyó varios desastres recientes en Twitter a la necesidad de la empresa de evitar que otros recopilen datos de su sitio, incluso cuando los problemas parecen no estar relacionados. Durante el fin de semana, Twitter limitó el número de tweets que los usuarios pueden ver al día, lo que hizo que el servicio fuera casi inutilizable. Musk dijo que fue una respuesta necesaria a la «extracción de datos» y a la «manipulación del sistema». Sin embargo, la mayoría de los expertos en TI estuvieron de acuerdo en que la limitación de la tasa probablemente fue una respuesta de crisis a problemas técnicos derivados de una mala gestión, incompetencia o ambos. Twitter no respondió a las preguntas de Gizmodo sobre el asunto.
En Reddit, el efecto de los cambios en las APIs fue especialmente notorio. Reddit es administrado esencialmente por moderadores no remunerados que mantienen los foros saludables. Los moderadores de subreddits grandes a menudo dependen de herramientas de terceros para su trabajo, herramientas que se basan en APIs que ahora ya no están disponibles. Esto provocó una protesta masiva en la que los moderadores básicamente cerraron Reddit. Aunque la controversia aún está en curso, es probable que tenga consecuencias permanentes a medida que los moderadores rechazados abandonen sus funciones.
Con contenido de Gizmodo.