Reddit se encuentra actualmente bajo la lente de la Comisión Federal de Comercio (FTC) por sus prácticas de concesión de licencias de datos de IA, que se revelaron antes de una oferta pública inicial planificada.
La investigación de la FTC se centra en la “venta, concesión de licencias o intercambio de contenido generado por usuarios con terceros por parte de Reddit para entrenar modelos de IA”.
Se produce cuando Reddit se está preparando para salir a bolsa, con planes de fijar el precio de sus acciones entre 31 y 34 dólares, valorando potencialmente a la empresa en aproximadamente 6.500 millones de dólares.
Reddit se encuentra en una de las minas de oro más grandes en la historia del contenido de Internet. Su intención de vender publicaciones y comentarios ha provocado un intenso debate entre sus 850 millones de usuarios mensuales promedio.
Una publicación de Reddit se titula “Dado que Reddit ahora vende datos de usuarios oficialmente, ¿están seguras sus historias?” Los encuestados aceptaron “comenzar a arrojar datos basura inútiles en Reddit todos los días durante los próximos sesenta días”.
Ese es un punto interesante: los datos de Reddit son muy sensibles a las aportaciones de los usuarios y, con comunidades tan fuertes, la empresa no debería ser demasiado complaciente con su derecho al contenido generado por los usuarios.
Sin embargo, Reddit sostiene que vender datos permanece en armonía con sus principios y afirma: “La oportunidad no entra en conflicto con nuestros valores y los derechos de nuestros Redditors”.
Las perspectivas financieras de Reddit parecen sólidas, con un aumento del 20 % en los ingresos el año pasado, que ascendieron a 804 millones de dólares, impulsado en gran medida por la publicidad.
Hasta ahora, la divulgación de Reddit incluye la celebración de acuerdos de licencia de datos valorados en 203 millones de dólares. Espera generar al menos 66,4 millones de dólares con estos acuerdos en 2024. Es una parte modesta de su flujo total de ingresos, pero podría crecer exponencialmente.
Reddit ya se ha asociado con Google para entrenar modelos de IA, entre otros objetivos. Esto resalta la importancia de sus datos en un mundo donde las empresas tecnológicas están cada vez más dispuestas a pagar por sus datos en lugar de simplemente eliminar fuentes dudosas de “uso público”.
Reflexionando sobre los comentarios de la FTC, Reddit afirmó: “No nos sorprende que la FTC haya expresado interés” en sus prácticas de concesión de licencias de datos, atribuyendo el escrutinio a “la naturaleza novedosa de estas tecnologías y acuerdos comerciales”.
Además, Reddit afirma su creencia en la legalidad de sus prácticas y enfatiza: “No creemos que hayamos participado en ninguna práctica comercial desleal o engañosa”.
La compañía también compartió ideas sobre el diálogo en curso con la FTC, señalando: “La carta indicaba que el personal de la FTC estaba interesado en reunirse con nosotros para aprender más sobre nuestros planes y que la FTC tenía la intención de solicitarnos información y documentos como parte de su investigación. continúa”.
La FTC ha estado adoptando una línea más dura en los acuerdos tecnológicos en los últimos tiempos, con la autorización de la agencia de nuevos poderes de investigación sobre las empresas de inteligencia artificial en noviembre pasado.
La nueva fiebre de los datos pagos
Los datos han llegado a bajo costo a las empresas de IA generativa, con bases de datos creadas por entidades web como Common Crawl y LAION que constituyen el pilar de los datos de entrenamiento.
Sin embargo, eso está cambiando, con las demandas por derechos de autor acumulándose y la Ley de IA de la UE que intenta imponer prácticas de datos más estrictas para la industria.
Además, muchos sitios web bloquean activamente los rastreadores web de IA. La era del Salvaje Oeste de datos de entrenamiento gratuitos podría estar llegando a su fin.
Reddit no es la única empresa que conoce el valor de su contenido. Automattic, la empresa matriz de WordPress y Tumblr, es supuestamente en conversaciones con MidJourney y OpenAI para un acuerdo de contenido y datos.
Mientras Reddit se prepara para su IPO, tanto los reguladores como los Redditors seguirán de cerca la trayectoria de la empresa.