En la carrera mundial por la inteligencia artificial, ha surgido un improbable contrincante para enfrentarse a los titanes de las grandes tecnológicas con su visión radical de los modelos lingüísticos de código abierto.
Durante gran parte de 2022, la empresa emergente francesa Mistral AI presentó la semana pasada un innovador software de generación de texto que se equipara a los principales sistemas patentados de Meta y OpenAI.
Fundada por antiguos empleados de Google y Facebook, Mistral irrumpió en escena en mayo con una ronda de financiación de $120 millones que la valoraba en $250 millones antes de su lanzamiento. La empresa prometió seguir un camino divergente en el desarrollo de la IA, centrado en la transparencia, la colaboración académica y el intercambio público de código, en lugar del enfoque de código cerrado de sus homólogos de Silicon Valley.
En ese sentido, están mucho más alineados con Meta que los desarrolladores "cerrados" como OpenAI, aunque superan a Meta en la "apertura" de sus enfoques de investigación.
Al principio, muchos expertos del sector descartaron las posibilidades de Mistral frente a los multimillonarios presupuestos de investigación de gigantes tecnológicos estadounidenses como Amazon, Google y Microsoft. Pero un torrente de demostraciones de las rápidas innovaciones de la empresa con sede en París empezó a cambiar las percepciones.
Su última creación, un modelo de IA de 8.000 millones de parámetros denominado Mixtraldemuestra una creatividad, un razonamiento y un sentido común a la altura del modelo LLaMA de Meta y, en algunos casos, supera al estimado GPT-3.5 de OpenAI. Más información sobre Mixtral aquí.
La velocidad de Mixtral 8x7b (Q5_0.gguf) en M2 es INSANA
Todavía estoy averiguando cómo hacer escritura creativa con él, pero sinceramente es alucinante para un modelo bruto con capacidades GPT 3.5. https://t.co/BkrqsxuFHu pic.twitter.com/D1oQIaSP53
- Denis Shiryaev 💙💛 (@literallydenis) 11 de diciembre de 2023
Según las pruebas de referencia, Mixtral iguala o supera a estos sistemas en pruebas estandarizadas de traducción, comprensión lectora y otras métricas de inteligencia generativa.
Mistral se ha ganado el respeto por su enfoque desenfadado y realista de los lanzamientos de IA en comparación con Google, que recientemente ha sido criticado por su falsa demostración de Geminiy OpenAI, que ha sido criticada por sus comunicaciones, a veces edulcoradas, en las redes sociales tras el lanzamiento de sus productos.
Cómo anuncian sus nuevos modelos de LLM:
Mistral AI Vs Resto de ellos 😅 pic.twitter.com/sawXdEunL6
- Ramsri Goutham Golla (@ramsri_goutham) 10 de diciembre de 2023
Entonces, ¿cómo ha conseguido una empresa emergente y sigilosa superar a algunos de los nombres más valiosos del mundo de la IA con una fracción de sus recursos?
Los observadores dan crédito a la innovadora metodología de entrenamiento de Mistral, que utiliza conjuntos de datos más pequeños y una codificación eficiente. Mientras Meta y OpenAI siguen protegiendo sus enfoques, Mistral publica sus modelos para que la comunidad los examine y mejore libremente con licencias de código abierto.
La meteórica ascensión de Mistral es evidente: la empresa consiguió $450 millones en nuevos fondos a una valoración de $2.000 millones, astronómica para una empresa tecnológica de la UE y prometedora para la incursión del bloque de la región en la IA generativa. Entre sus actuales inversores figuran Andreessen Horowitz, BNP Paribas y Salesforce.
Mixtral está considerado como el modelo lingüístico de código abierto más potente que existe en la actualidad, por lo que los usuarios son cada vez más numerosos y se ha ganado un gran número de seguidores entre la comunidad investigadora por abrazar la verdadera esencia del código abierto.
En este sentido, Arthur Mensch, Consejero Delegado de Mistral, ha eliminado algunas condiciones de la política de usuarios de Mistral que prohibían utilizar sus modelos para entrenar o mejorar otros modelos o competir con ellos, lo que ilustra el enfoque de código abierto de la empresa.
Eliminado, ¡disfrute! https://t.co/jbSJ87YvZf
- Arthur Mensch (@arthurmensch) 12 de diciembre de 2023
¿Obstaculizará la Ley de Inteligencia Artificial de la UE a Mistral y otras empresas europeas del sector?
Pero, ¿podría la Ley de Inteligencia Artificial de la UE impedir el crecimiento de Mistral y otros desarrolladores europeos de IA, como la alemana Aleph Alpha?
Desde el acuerdo político sobre la AI Act la semana pasada, el presidente Emmanuel Macron ha expresado sus dudas sobre la legislación, advirtiendo de que las normas podrían perjudicar a las empresas tecnológicas europeas frente a rivales menos regulados de otros países.
En su discurso en Toulouse, Macron citó específicamente la normativa sobre modelos fundacionales, es decir, los sistemas de IA subyacentes a chatbots como ChatGPT, capaces de generar montones de texto similar al humano. Argumenta que las estrictas restricciones propuestas en la La Ley de IA podría obstaculizar la competitividad de los líderes europeos en IA.
Macron señaló a la empresa parisina de rápido crecimiento Mistral como ejemplo del "genio francés" en la innovación de la IA y expresó su preocupación por que la normativa pudiera inhibir a este tipo de empresas emergentes.
El grupo industrial DigitalEurope se hizo eco de la preocupación de que los amplios requisitos de cumplimiento pudieran desviar recursos de la investigación y el desarrollo, situando a las empresas europeas por detrás de las potencias líderes en IA. A principios de año, 150 empresas europeas advertidas a principios de año sobre el impacto de la Ley en la innovación.
Aunque la Presidenta de la Comisión, Ursula von der Leyen, ha elogiado el acto por codificar los valores europeos, sigue siendo posible introducir modificaciones mientras los Estados miembros revisan la normativa antes de su ratificación definitiva.
Como siempre, las empresas de IA se enfrentan a obstáculos normativos si quieren continuar su endiablado ritmo de crecimiento.