¿Habrías permitido que Meta utilizara tus publicaciones de Facebook e Instagram para entrenar sus modelos de inteligencia artificial? La realidad es que no tenías elección.
Meta confirmó su uso de datos de Facebook e Instagram para entrenar a su nuevo asistente de IA.
Ya en agosto, un portavoz dijo que Llama 2 no se había entrenado con datos de Meta, afirmando que el modelo "no se entrenó con datos de usuarios de Meta, y aún no hemos lanzado ninguna función de consumo de IA Generativa en nuestros sistemas."
Esta postura cambió con la nueva multiplataforma de la empresa asistente generativo de IAque utiliza los datos de Meta procedentes de las publicaciones y comentarios públicos de los usuarios. Sin embargo, Meta afirma haber evitado conscientemente el uso de publicaciones privadas compartidas entre familiares y amigos.
Nick Clegg, Presidente de Asuntos Globales de Meta, señaló durante la conferencia anual Connect de la empresa: "Hemos intentado excluir los conjuntos de datos que tienen una gran preponderancia de información personal", y añadió además que la "gran mayoría" de los datos utilizados por Meta para la formación estaban a disposición del público.
Clegg puso un ejemplo, citando LinkedIn como una plataforma cuyo contenido Meta decidió deliberadamente no utilizar por motivos de privacidad.
Gigantes tecnológicos como Meta, OpenAI y Google han sido criticados recientemente por utilizar datos de Internet sin consentimiento para entrenar sus modelos de IA.
Estas empresas tienen que tomar decisiones sobre el uso de contenidos privados o protegidos por derechos de autor en sus sistemas de IA y se enfrentan a demandas legales de autores que les acusan de violar los derechos de autor. Varios autores de renombre, entre ellos el creador de Juego de Tronos, George R.R. Martin, han denunciado recientemente a la IA por violación de los derechos de autor. se unió a un diluvio de demandas presentadas contra OpenAI y Meta.
En el evento Connect de Meta, su Consejero Delegado, Mark Zuckerberg, presentó Meta AI. Esta herramienta se destacó como una de las principales ofertas de IA de la empresa orientadas al consumidor. A diferencia de eventos anteriores, este año la atención se centró principalmente en la IA, alejándose del proyecto metaverso de realidad aumentada y virtual, en gran medida desaparecido.
La base del asistente de inteligencia artificial de Meta es un modelo personalizado inspirado en el modelo lingüístico Llama 2, que presentaron para uso público y comercial en julio. Además, han desarrollado Emu, un modelo innovador diseñado para crear imágenes a partir de texto.
Clegg destacó que este proceso de entrenamiento de IA utilizó texto e imágenes de publicaciones públicas de Facebook e Instagram.
Un representante de Meta declaró que el modelo Emu se entrenó específicamente para la generación de imágenes utilizando estos mensajes públicos.
Las funcionalidades de chat, por su parte, se basaron en el modelo Llama 2, que se complementó con algunos conjuntos de datos anotados y de acceso público.
Desde el punto de vista de la seguridad, Clegg indicó que se habían tomado medidas específicas, como prohibir que la herramienta de IA genere imágenes hiperrealistas de personalidades públicas. Al abordar el polémico tema de los contenidos protegidos por derechos de autor, Clegg expresó: "Creemos que sí, pero sospecho firmemente que eso va a jugar en los litigios."
Cuando se le preguntó por las precauciones de Meta contra la reproducción de imágenes protegidas por derechos de autor, un representante de la empresa señaló sus condiciones de servicio actualizadas, que prohíben estrictamente a los usuarios crear contenidos que infrinjan las normas de privacidad y propiedad intelectual.