OpenAI lanserer "o1"-serien, som flytter grensene for kunstig intelligens

12. september 2024

  • OpenAI lanserer to nye avanserte modeller: o1-preview og o1-mini
  • De er i stand til å resonnere i flere trinn, noe som gjør dem ideelle for komplekse spørsmål
  • o1-preview har allerede vist seg å være bedre enn GPT-4o for visse oppgaver
o1

OpenAI har lansert nye avanserte resonneringsmodeller kalt "o1"-serien. 

o1 finnes i dag i to versjoner - o1-preview og o1-mini - og er utviklet for å utføre komplekse resonneringsoppgaver, noe som markerer det OpenAI beskriver som "et nytt paradigme" innen AI-utvikling.

"Dette er det vi anser som det nye paradigmet i disse modellene", forklarte Mira Murati, teknologidirektør i OpenAI, i en uttalelse til Kablet. "Den er mye bedre til å takle svært komplekse resonneringsoppgaver."

I motsetning til tidligere iterasjoner, som først og fremst utmerker seg ved å være storskala, f.eks. ved å kaste regnekraft på et problem, har o1 som mål å gjenskape den menneskelignende tankeprosessen det er å "resonnere seg gjennom" problemer. 

I stedet for å generere ett enkelt svar, arbeider modellen trinnvis, vurderer flere tilnærminger og reviderer seg selv etter behov, en metode som kalles "tankekjede". 

Dette gjør at den kan løse komplekse problemer innen matematikk, koding og andre fagområder med en presisjon som eksisterende modeller, inkludert GPT-4o, sliter med å oppnå.

Mark Chen, OpenAIs visepresident for forskning, utdypet o1s læringsprosess og hvordan den skiller seg fra typisk språkmodellresonnering. "Modellen skjerper tenkningen sin og finjusterer strategiene den bruker for å komme frem til svaret", sier Chen. 

Han demonstrerte modellen med flere matematiske gåter og avanserte kjemispørsmål som GPT-4o tidligere ikke har klart å løse. 

En gåte som forvirret tidligere modeller, lød slik "En prinsesse er like gammel som prinsen blir når prinsessen er dobbelt så gammel som prinsen var da prinsessens alder var halvparten av summen av deres nåværende alder. Hva er alderen til prinsen og prinsessen?" 

o1-modellen ga det riktige svaret: prinsen er 30, og prinsessen er 40.

Slik får du tilgang til o1

ChatGPT Plus-brukere kan allerede få tilgang til o1 fra ChatGPT.

Det er en overraskelse, ettersom GPT-4os stemmefunksjon fortsatt ruller ut flere måneder etter demoen. Få forventet at o1 skulle lanseres så brått, uten den vanlige oppbyggingen.

o1

o1 ser ut til å være relatert til OpenAIs prosjekt med kodenavnet "Strawberry". Her er en morsom ting: De fleste AI-modeller vet ikke hvor mange R-er det er i "jordbær". Det setter deres resonneringsevner ut av spill.

Jeg testet dette i o1. Og se, den fikk rett. Det er tydelig at o1s tilnærming til resonnering bidrar til å løse slike spørsmål på en effektiv måte.

Sam Altmans nylige bølge av jordbærrelatert snakk i sosiale medier kan være knyttet til dette berømte AI-problemet med jordbærsmak og o1s kodenavn "Project Strawberry". Hvis ikke, er det et merkelig sammentreff.

En trinnvis endring i problemløsning

o1-modellens evne til å "resonnere" seg gjennom problemer representerer et fremskritt innen kunstig intelligens - noe som kan vise seg å være ganske banebrytende hvis modellens ytelse i den virkelige verden blir bevist "ute i naturen".

De nye modellene har allerede vist gode resultater i tester som American Invitational Mathematics Examination (AIME). 

Ifølge OpenAI løste den nye modellen 83% av problemene som ble presentert i AIME, sammenlignet med bare 12% for GPT-4o.

Selv om o1 har sine styrker, har den også sine ulemper.

Modellen bruker lengre tid på å generere svar på grunn av den mer gjennomtenkte metodikken. Tiden vil vise hvor stor innvirkning dette har på den generelle brukervennligheten. 

o1s merkelige opprinnelse

o1 kommer på bakgrunn av samtaler rundt et OpenAI-prosjekt med kodenavnet "Strawberry". som dukket opp i slutten av 2023.

Det ryktes opprinnelig at det dreier seg om en AI-modell som er i stand til å utforske nettet på egen hånd, og som er designet for å drive "dyp forskning".

Snakket rundt Strawberry intensiverte for ikke lenge siden da The Information lekket litt informasjon om OpenAIs interne prosjekter. OpenAI utvikler nemlig angivelig to former for Strawberry.

  1. Den ene er en mindre, forenklet versjon beregnet for integrering i ChatGPT. Den har som mål å forbedre resonneringsevnen i scenarier der brukerne trenger mer gjennomtenkte, detaljerte svar i stedet for raske svar. Dette høres ut som om det kan være o1.
  2. En annen er en større og kraftigere versjon som brukes til å generere "syntetiske" treningsdata av høy kvalitet for OpenAIs neste flaggskip av en språkmodell, som har kodenavnet "Orion". Denne kan være eller ikke være knyttet til o1.

OpenAI har ikke gitt noen direkte avklaring på hva Strawberry egentlig er. Det har imidlertid vært allment antatt at o1 er Strawberry.

Et supplement, ikke en erstatning

Murati understreket at o1 ikke er utviklet for å erstatte GPT-4o, men for å utfylle den. 

"Det finnes to paradigmer", sier hun. "Skaleringsparadigmet og dette nye paradigmet. Vi forventer at vi kommer til å bringe dem sammen." 

Mens OpenAI fortsetter å utvikle GPT-5, som sannsynligvis vil bli enda større og kraftigere enn GPT-4o, kan fremtidige modeller innlemme resonneringsfunksjonene i o1. 

Denne fusjonen kan løse de vedvarende begrensningene ved store språkmodeller (LLM-er), for eksempel at de sliter med tilsynelatende enkle problemer som krever logisk deduksjon, som for eksempel jordbærproblemet ovenfor. 

Anthropic og Google kappes angivelig om å integrere lignende funksjoner i modellene sine. Googles AlphaProof-prosjekt kombinerer for eksempel også språkmodeller med forsterkningslæring for å takle vanskelige matematiske problemer. 

Chen mener imidlertid at OpenAI har et forsprang. "Jeg tror vi har gjort noen gjennombrudd på dette området", sier han. "Jeg tror det er en del av fordelen vår. Den er faktisk ganske god til å resonnere på tvers av alle domener."

Yoshua Bengio, en ledende AI-forsker og mottaker av den prestisjetunge Turing-prisen, lovpriste fremskrittene, men manet samtidig til forsiktighet.

 "Hvis AI-systemer skulle vise ekte resonnering, ville det muliggjøre konsistens i fakta, argumenter og konklusjoner fra AI-en." sa han til FT.

Sikkerhet og etiske hensyn

Som en del av sin forpliktelse til ansvarlig AI har OpenAI styrket o1s sikkerhetsfunksjoner, inkludert "on-by-default"-verktøy for innholdssikkerhet. 

Disse verktøyene bidrar til å forhindre at modellen produserer skadelige eller usikre resultater.

"Vi er glade for å kunngjøre at Prompt Shields og Protected Materials for Text nå er generelt tilgjengelige i Azure OpenAI Service", sier OpenAI i en Blogginnlegg fra Microsoft

o1-serien er tilgjengelig for tidlig tilgang i Microsofts Azure AI Studio og GitHub Models, og en bredere lansering er planlagt snart. 

OpenAI håper at o1 vil gjøre det mulig for utviklere og bedrifter å innovere på en mer kostnadseffektiv måte, noe som er i tråd med deres bredere mål om å gjøre AI mer tilgjengelig for bedriftsbrukere. 

"Vi tror at det vil gjøre det mulig for oss å levere etterretning billigere", konkluderer Chen. "Og jeg tror det virkelig er kjerneoppgaven til selskapet vårt."

Alt i alt en spennende utgivelse. Det blir veldig interessant å se hvilke spørsmål, problemer og oppgaver o1 trives med.

Bli med i fremtiden


ABONNER I DAG

Tydelig, kortfattet og omfattende. Få et grep om AI-utviklingen med DagligAI

Sam Jeans

Sam er en vitenskaps- og teknologiskribent som har jobbet i ulike oppstartsbedrifter innen kunstig intelligens. Når han ikke skriver, leser han medisinske tidsskrifter eller graver seg gjennom esker med vinylplater.

×

GRATIS PDF EKSKLUSIV
Hold deg i forkant med DailyAI

Meld deg på vårt ukentlige nyhetsbrev og få eksklusiv tilgang til DailyAIs nyeste e-bok: "Mastering AI Tools: Din 2024-guide til økt produktivitet".

*Ved å abonnere på vårt nyhetsbrev aksepterer du vår Retningslinjer for personvern og vår Vilkår og betingelser