La Open Source Initiative (OSI) ha publicado un borrador actualizado de la definición de lo que constituye IA de código abierto y dice que los modelos de Meta no califican a pesar de las afirmaciones de la compañía.
Mark Zuckerberg ha expresado abiertamente el compromiso de Meta con lo que él dice es IA de código abierto. Sin embargo, si bien modelos como Llama 3.1 son menos opacos que los modelos propietarios de OpenAI o Google, las discusiones en la comunidad OSI sugieren que Meta está usando el término de manera vaga.
En un evento público en línea el viernes, la OSI discutió los criterios que cree que debería cumplir un modelo de IA verdaderamente de código abierto. La OSI se refiere a estos criterios como “4 libertades” y dice que una IA de código abierto “es un sistema de IA disponible bajo términos y de una manera que otorga las libertades para:
- Utiliza el sistema para cualquier fin y sin tener que pedir permiso.
- Estudiar cómo funciona el sistema e inspeccionar sus componentes.
- Modificar el sistema para cualquier propósito, incluido cambiar su salida.
- Compartir el sistema para que otros lo utilicen con o sin modificaciones, para cualquier propósito”.
Para poder modificar un modelo de IA, la definición de IA abierta de OSI dice que los pesos y el código fuente deben estar abiertos, y el conjunto de datos de entrenamiento debe estar disponible.
La licencia de Meta impone algunas restricciones sobre cómo se pueden utilizar sus modelos y se ha negado a publicar los datos de entrenamiento que utilizó para entrenar sus modelos. Si se acepta que OSI es el custodio de lo que significa “fuente abierta”, entonces la implicación es que Meta distorsiona la verdad cuando llama a sus modelos “abiertos”.
La OSI es una corporación de beneficio público de California que depende de los aportes de la comunidad para desarrollar estándares de código abierto. Algunos en esa comunidad han acusado a Mark Zuckerberg de “lavar abiertamente” los modelos de Meta y de intimidar a la industria para que acepte su versión en lugar de la definición de OSI.
El presidente de Open Source Group Japan, Shuji Sado, dijo: “Es posible que Zuckerberg tenga una definición de código abierto diferente a la nuestra” y sugirió que el panorama legal poco claro en torno a los datos de entrenamiento de IA y los derechos de autor podría ser la razón de esto.
Definición de IA de código abierto: actualización semanal del 23 de septiembre https://t.co/flbb3yGCmx
— Iniciativa de código abierto @(correo electrónico protegido) (@OpenSourceOrg) 23 de septiembre de 2024
las palabras importan
Todo esto puede parecer una discusión sobre semántica pero, dependiendo de la definición que adopte la industria de la IA, podría haber graves consecuencias legales.
Meta ha tenido dificultades para navegar por las leyes GDPR de la UE debido a su insaciable hambre de datos de las redes sociales de los usuarios. Algunas personas afirman que la definición vaga de Meta de “IA de código abierto” es un intento de eludir nuevas leyes como la TENGO actuar.
La Ley proporciona una excepción limitada para los modelos de IA de uso general (GPAIM) publicados bajo licencias de código abierto. Estos modelos están exentos de ciertas obligaciones de transparencia, aunque aún deben proporcionar un resumen del contenido utilizado para entrenar el modelo.
Por otro lado, el proyecto de ley de seguridad de la IA de California SB 1047 desincentiva a empresas como Meta a alinear sus modelos con la definición OSI. El proyecto de ley exige protocolos de seguridad complejos para modelos “abiertos” y responsabiliza a los desarrolladores por modificaciones dañinas y uso indebido por parte de malos actores.
La SB 1047 define las herramientas de inteligencia artificial de código abierto como “modelos de inteligencia artificial que están disponibles gratuitamente y que pueden modificarse y redistribuirse libremente”. ¿Eso significa que un modelo de IA que un usuario puede ajustar es “abierto” o la definición solo se aplicaría si el modelo cumple todos los requisitos de OSI?
Por ahora, la vaguedad le permite a Meta obtener beneficios de marketing y espacio para negociar alguna legislación. En algún momento, la industria deberá comprometerse con una definición. ¿Será definido por una gran empresa tecnológica como Meta o por una organización impulsada por la comunidad como OSI?