Google tillkännagav tre nya modeller i sin Gemini-familj och gjorde dem tillgängliga som en experimentell version för att samla in feedback från utvecklare.
Lanseringen är en fortsättning på Googles iterativa strategi istället för att hoppa direkt till Gemini 2.0. De experimentella modellerna är förbättrade versioner av Gemini 1,5 Pro och Gemini 1.5 Flash samt en ny mindre Gemini 1.5 Flash-8B.
Googles produktchef Logan Kilpatrick sa att Google släpper experimentella modeller "för att samla in feedback och få våra senaste uppdateringar i händerna på utvecklare. Det vi lär oss av experimentella lanseringar informerar om hur vi släpper modeller mer allmänt."
Google säger att den uppgraderade Gemini 1.5 Pro är en betydande förbättring jämfört med den tidigare versionen, med förbättrade kodningsfunktioner och komplex prompthantering. Gemini 1.5-modellerna är byggda för att hantera extremt långa kontexter och kan återkalla och resonera över finkornig information från upp till minst 10 miljoner tokens. De experimentella modellerna har dock en gräns på 1 miljon tokens.
Gemini 1.5 Flash är den billigare modellen med låg latens som är utformad för att hantera uppgifter med stora volymer och sammanfattning av multimodala indata i långa sammanhang. I de inledande testerna av de experimentella versionerna klättrade de förbättrade Pro- och Flash-modellerna på LMSYS topplista.
Uppdatering av Chatbot Arena⚡!
Den senaste Gemini (Pro/Flash/Flash-9b) resultaten är nu live, med över 20 000 röster från allmänheten!
Höjdpunkter:
- Nya Gemini-1,5-Flash (0827) tar ett stort kliv och klättrar från #23 till #6 totalt!
- Nya Gemini-1.5-Pro (0827) visar starka framsteg i kodning, matematik över... https://t.co/6j6EiSyy41 pic.twitter.com/D3XpU0Xiw2- lmsys.org (@lmsysorg) 27 augusti 2024
Gemini Flash 8B
När Google lanserade Gemini 1.5 teknisk rapport tidigare denna månad, visade det upp en del av Google DeepMind-teamets tidiga arbete med en ännu mindre 8 miljarder parametervariant av Gemini 1.5 Flash-modellen.
Den multimodala experimentmodellen Gemini 1.5 Flash-8B är nu tillgänglig för testning. Benchmarktester visar att den slår Googles lättviktiga Gemma 2-9B-modell och Metas betydligt större Llama 3-70B.
Tanken bakom Gemini 1.5 Flash-8B är att ha en extremt snabb och mycket billig modell som fortfarande har multimodala förmågor. Google säger att den "kan driva intelligenta agenter som distribueras i stor skala, vilket underlättar realtidsinteraktioner med en stor användarbas." Flash-8B är "avsedd för allt från multimodala användningsfall med hög volym till sammanfattningsuppgifter med långa sammanhang."
Utvecklare som letar efter en lätt, billig och snabb multimodal modell med en 1M token-kontext kommer sannolikt att vara mer upphetsade av Gemini Flash-8B än de förbättrade Flash- och Pro-modellerna. De som letar efter mer avancerade modeller kommer att undra när vi kan förvänta oss att Google släpper Gemini 1.5 Ultra.