Reddit demanda a Anthropic por el robo de datos de IA

¿Te imaginas que cada comentario que escribiste alguna vez en Reddit –ese desahogo nocturno, esa discusión absurda sobre dragones o ese consejo honesto que diste en un hilo de ansiedad– termine alimentando a una inteligencia artificial sin que tú lo sepas? Reddit asegura que eso es exactamente lo que hizo Anthropic.

La acusación es seria. Según la demanda presentada, Anthropic habría utilizado su bot de rastreo para extraer millones de publicaciones y comentarios de Reddit, sin permiso y, por supuesto, sin pagar ni un centavo. Con ese material, entrenaron su modelo Claude, uno de los principales competidores en la carrera de IA generativa. ¿El problema? Que todo esto va directamente en contra de los términos de uso del sitio.

Porque sí, incluso los bots tienen reglas. Y Reddit, como muchas plataformas, deja claro en su acuerdo de usuario que no puedes utilizar contenido del sitio con fines comerciales sin un contrato formal. Aun así, los registros –dice Reddit– muestran que los bots de Anthropic no solo estaban activos, sino que siguieron intentando acceder al sitio incluso después de que la empresa dijera públicamente lo contrario.

La caída del «caballero blanco»

Lo que vuelve este caso especialmente delicado no es solo el posible uso indebido de datos, sino el golpe directo a la reputación de Anthropic. Durante meses, la compañía ha tratado de venderse como el actor ético del mundo de la IA: responsable, respetuoso, distinto. Pero la demanda los pinta con otro rostro. Uno bastante menos heroico.

Reddit expone, por ejemplo, que en julio de 2024, Anthropic aseguró haber bloqueado el acceso de sus bots al sitio. ¿La verdad? Según Reddit, los intentos de rastreo se contaron por cientos de miles en los meses siguientes. Es decir, alguien no dijo toda la verdad. O directamente mintió.

Y eso, en una industria que vive de la confianza, es dinamita.

El usuario en el centro: la ilusión de la privacidad

Más allá de las corporaciones, hay una dimensión profundamente humana en este conflicto: la expectativa de privacidad del usuario. Cuando borras algo en Reddit, quieres creer que desaparece. Que se esfuma, que deja de existir.

Reddit, al menos, ha firmado acuerdos con empresas como Google y OpenAI para que eso ocurra también en los modelos entrenados. Es decir, si borras tu comentario, ellos se aseguran de que sus sistemas de IA también lo olviden. Pero Anthropic, según la demanda, se ha negado a firmar cualquier acuerdo parecido.

La consecuencia es inquietante: Claude podría haber sido entrenado con datos que los usuarios ya eliminaron. Y no habría forma de saberlo. La demanda incluye incluso una captura donde Claude admite que no tiene manera de rastrear si lo que aprendió de Reddit fue borrado después.

Eso, para muchos usuarios, no solo es preocupante. Es una traición.

¿Qué busca Reddit? Y por qué Claude podría desaparecer

El objetivo de Reddit no se limita al dinero. Sí, piden compensación por daños, por el uso indebido, por el gasto en servidores. Pero van más allá.

Quieren que se prohíba a Anthropic seguir usando sus datos. Y aún más: piden que se les impida vender o licenciar cualquier tecnología basada en ellos. En otras palabras: podrían estar pidiendo la retirada de Claude del mercado.

¿Te imaginas? Una IA entera silenciada por la forma en que fue entrenada. Sería histórico.

¿Contenido público = contenido libre?

Este juicio abre una caja de Pandora legal y filosófica: ¿todo lo que está públicamente disponible en internet es automáticamente libre para que lo use quien quiera? Reddit grita que no. Que público no es igual a gratuito. Que la intención del autor, del usuario, debe respetarse.

Y lo que está en juego no es menor. Si Reddit gana, el entrenamiento de modelos de IA podría verse limitado como nunca antes. Las empresas tendrían que pagar, pedir permiso, negociar. La era del «rastréo libre» podría estar llegando a su fin.

No sabemos aún cómo terminará este capítulo. Pero algo está claro: el desarrollo de la inteligencia artificial está dejando de ser un juego técnico para convertirse en un conflicto humano, ético y legal.

Y esta vez, la magia no está del lado de los que piensan que todo lo que flota en la red es suyo por derecho.

Deja un comentario