Google kunngjorde tre nye modeller i Gemini-familien, og gjorde dem tilgjengelige som en eksperimentell utgivelse for å samle tilbakemeldinger fra utviklere.
Utgivelsen er en fortsettelse av Googles iterative tilnærming i stedet for å hoppe rett til Gemini 2.0. De eksperimentelle modellene er forbedrede versjoner av Gemini 1,5 Pro og Gemini 1.5 Flash samt en ny, mindre Gemini 1.5 Flash-8B.
Googles produktsjef, Logan Kilpatrick, sa at Googles utgivelse av eksperimentelle modeller "for å samle tilbakemeldinger og få de siste oppdateringene våre i hendene på utviklere. Det vi lærer fra eksperimentelle lanseringer, informerer hvordan vi lanserer modeller mer bredt."
Google sier at den oppgraderte Gemini 1.5 Pro er en betydelig forbedring av den forrige versjonen, med forbedrede kodingsfunksjoner og kompleks prompt-håndtering. Gemini 1.5-modellene er bygget for å håndtere ekstremt lange kontekster og kan gjenkalle og resonnere over finkornet informasjon fra opptil minst 10 millioner tokens. De eksperimentelle modellene har imidlertid en grense på 1 million token.
Gemini 1.5 Flash er den billigere modellen med lav latenstid som er utviklet for å håndtere oppgaver med store volumer og oppsummering av multimodale inndata i lange kontekster. De første testene av de eksperimentelle versjonene viste at de forbedrede Pro- og Flash-modellene klatret på topplistene i LMSYS.
Oppdatering av Chatbot Arena⚡!
Den siste Gemini (Pro/Flash/Flash-9b) er nå live, med over 20 000 stemmer fra fellesskapet!
Høydepunkter:
- Ny Gemini-1,5-Flash (0827) gjør et stort sprang, og klatrer fra #23 til #6 totalt!
- Ny Gemini-1.5-Pro (0827) viser sterk fremgang i koding og matematikk i løpet av... https://t.co/6j6EiSyy41 pic.twitter.com/D3XpU0Xiw2- lmsys.org (@lmsysorg) 27. august 2024
Gemini Flash 8B
Da Google lanserte Gemini 1.5 teknisk rapport tidligere denne måneden, ble det vist frem noe av Google DeepMind-teamets tidlige arbeid med en enda mindre variant med 8 milliarder parametere av Gemini 1.5 Flash-modellen.
Den multimodale Gemini 1.5 Flash-8B eksperimentelle modellen er nå tilgjengelig for testing. Benchmark-tester viser at den slår Googles lette Gemma 2-9B-modell og Metas betydelig større Llama 3-70B.
Tanken bak Gemini 1.5 Flash-8B er å ha en ekstremt rask og svært billig modell som fortsatt har multimodale evner. Google sier at den "kan drive intelligente agenter som distribueres i stor skala, og legge til rette for sanntidsinteraksjoner med en stor brukerbase". Flash-8B er "beregnet på alt fra multimodale brukstilfeller med høyt volum til lange kontekstoppsummeringsoppgaver."
Utviklere som leter etter en lett, billig og rask multimodal modell med en 1M token-kontekst, vil sannsynligvis være mer begeistret for Gemini Flash-8B enn de forbedrede Flash- og Pro-modellene. De som leter etter mer avanserte modeller vil lure på når vi kan forvente at Google slipper Gemini 1.5 Ultra.