Google a annoncé trois nouveaux modèles dans sa famille Gemini, les mettant à disposition en tant que version expérimentale afin de recueillir les commentaires des développeurs.
Cette version s'inscrit dans la continuité de l'approche itérative de Google, au lieu de passer directement à Gemini 2.0. Les modèles expérimentaux sont des versions améliorées de Gemini 1.5 Pro et Gemini 1.5 Flash ainsi qu'un nouveau modèle plus petit, Gemini 1.5 Flash-8B.
Logan Kilpatrick, chef de produit chez Google, a déclaré que les modèles expérimentaux sont lancés par Google "pour recueillir des commentaires et mettre nos dernières mises à jour à la disposition des développeurs. Les enseignements que nous tirons de ces lancements expérimentaux nous éclairent sur la manière dont nous diffusons les modèles à plus grande échelle".
Google affirme que la version améliorée de Gemini 1.5 Pro représente une amélioration significative par rapport à la version précédente, avec des capacités de codage améliorées et une gestion complexe des invites. Les modèles Gemini 1.5 sont conçus pour gérer des contextes extrêmement longs et peuvent se souvenir et raisonner sur des informations fines pouvant aller jusqu'à au moins 10 millions d'éléments. Les modèles expérimentaux ont cependant une limite de 1M de jetons.
Gemini 1.5 Flash est le modèle le moins cher, à faible latence, conçu pour traiter les tâches à fort volume et la synthèse de longs contextes d'entrées multimodales. Lors des premiers tests des versions expérimentales, les modèles Pro et Flash améliorés ont grimpé dans le classement LMSYS.
Chatbot Arena update⚡ !
Les dernières Gemini (Pro/Flash/Flash-9b) sont maintenant en ligne, avec plus de 20 000 votes de la communauté !
Faits marquants :
- Nouveau Gemini-1.5-Flash (0827) fait un bond énorme, passant de #23 à #6 au total !
- Nouveau GeminiLe programme -1.5-Pro (0827) progresse fortement en codage et en... https://t.co/6j6EiSyy41 pic.twitter.com/D3XpU0Xiw2- lmsys.org (@lmsysorg) 27 août 2024
Gemini Flash 8B
Lorsque Google a publié le Gemini 1.5 rapport technique au début du mois, elle a présenté certains des premiers travaux de l'équipe Google DeepMind sur une variante encore plus petite de 8 milliards de paramètres du modèle Gemini 1.5 Flash.
Le modèle expérimental multimodal Gemini 1.5 Flash-8B est désormais disponible à l'essai. Les tests d'évaluation montrent qu'il bat le modèle léger Gemma 2-9B de Google et le modèle Llama 3-70B de Meta, qui est nettement plus grand.
L'idée derrière Gemini 1.5 Flash-8B est d'avoir un modèle extrêmement rapide et très bon marché tout en ayant des capacités multimodales. Google affirme qu'il "peut alimenter des agents intelligents déployés à grande échelle, facilitant les interactions en temps réel avec une large base d'utilisateurs". Flash-8B est "destiné à tout, des cas d'utilisation multimodale à haut volume aux tâches de résumé de contexte de longue durée".
Les développeurs à la recherche d'un modèle multimodal léger, bon marché et rapide avec un contexte de 1 million de jetons seront probablement plus enthousiasmés par Gemini Flash-8B que par les modèles Flash et Pro améliorés. Ceux qui recherchent des modèles plus avancés se demanderont quand Google publiera Gemini 1.5 Ultra.