Meta está construyendo un modelo avanzado para enfrentarse a GPT-4

13 de septiembre de 2023

El LLaMa de Meta es un gran modelo lingüístico (LLM) fundacional de 65.000 millones de parámetros.

Al parecer, Meta está construyendo un modelo de IA avanzado que se espera que compita con el rendimiento del GPT-4 de OpenAI.

El Wall Street Journal informó que Meta ha estado trabajando en secreto en el más avanzado de sus LLM y se espera que salga a la venta en 2024.

A principios de este año, Meta lanzó Llama 2, que está disponible gratuitamente para uso comercial y de investigación. Se espera que su nuevo modelo también sea de libre acceso, en línea con el enfoque de código abierto que Meta sigue aplicando a sus productos de IA.

Se rumorea que el nuevo modelo de Meta es varias veces más potente que Llama 2que ya ocupa los primeros puestos en las tablas de referencia de modelos de acceso abierto.

Llama 2 se lanzó en colaboración con Microsoft en su plataforma Azure, pero parece que Meta se está preparando para utilizar su propia infraestructura informática en el futuro.

Meta ha estado comprando GPU Nvidia H100 y utilizará su propia plataforma para entrenar su nuevo modelo, en lugar de recurrir a la computación en nube Azure de Microsoft.

Meta fue lenta en la carrera de la IA, pero ahora está invirtiendo muchos recursos en sus proyectos de IA. Según el informe, un equipo formado a principios de este año está construyendo este nuevo modelo con el objetivo de acelerar las ambiciones de IA de Meta.

Es de esperar que Mark Zuckerberg ofrezca más detalles sobre el nuevo modelo en el evento Meta Connect que se celebrará a finales de mes.

Es probable que también oigamos hablar del proyecto AI Personas de Meta. Zuckerberg prevé interacciones más comprometidas con la IA que puedan "producir expresiones similares a las humanas", algo con lo que irónicamente parece tener dificultades.

Si el informe del WSJ es exacto, el nuevo modelo de Meta revolucionará el panorama de la IA cuando se publique el año que viene. Un LLM gratuito y de código abierto tan potente como el GPT-4 hará mucha mella en OpenAI esperanzas de rentabilidad.

Sin embargo, la estrategia de Meta de hacer que sus modelos sean de código abierto preocupa un poco a sus equipos jurídicos. Si malos actores modifican el modelo para eliminar las barreras de seguridad, crear desinformación o violar los derechos de autor, no está claro a qué riesgos legales podría enfrentarse Meta.

Tampoco está claro qué conjuntos de datos se están utilizando para entrenar su nuevo modelo, pero es casi seguro que incluye tus interacciones en Facebook e Instagram.

Únete al futuro


SUSCRÍBETE HOY

Claro, conciso y completo. Conozca los avances de la IA con DailyAI

Eugene van der Watt

Eugene es ingeniero electrónico y le encanta todo lo relacionado con la tecnología. Cuando descansa de consumir noticias sobre IA, lo encontrará jugando al billar.

×

PDF GRATUITO EXCLUSIVO
Adelántese con DailyAI

Suscríbase a nuestro boletín semanal y reciba acceso exclusivo al último eBook de DailyAI: 'Mastering AI Tools: Su guía 2024 para mejorar la productividad'.

*Al suscribirse a nuestro boletín de noticias, acepta nuestra política de privacidad. Política de privacidad y nuestro Condiciones generales