OpenAI presenta la serie "o1", spingendo i confini del ragionamento dell'IA

12 settembre 2024

  • OpenAI rilascia due nuovi modelli avanzati: o1-preview e o1-mini
  • Sono in grado di effettuare ragionamenti avanzati in più fasi, ideali per domande complesse.
  • o1-preview ha già dimostrato di essere superiore a GPT-4o per alcune attività
o1

OpenAI ha rilasciato nuovi modelli di ragionamento avanzato, denominati serie "o1". 

o1 è attualmente disponibile in due versioni - o1-preview e o1-mini - ed è progettato per eseguire compiti di ragionamento complessi, segnando quello che OpenAI descrive come "un nuovo paradigma" nello sviluppo dell'intelligenza artificiale.

"Questo è ciò che consideriamo il nuovo paradigma in questi modelli", ha spiegato Mira Murati, Chief Technology Officer di OpenAI, in un dichiarazione a Wired. "È molto più adatto ad affrontare compiti di ragionamento molto complessi".

A differenza delle iterazioni precedenti, che eccellevano soprattutto per la scala, ad esempio per il calcolo di un problema, o1 mira a replicare il processo di pensiero umano di "ragionamento attraverso" i problemi. 

Piuttosto che generare una singola risposta, il modello lavora passo dopo passo, prendendo in considerazione più approcci e rivedendosi se necessario, un metodo noto come "catena di pensiero". 

Questo gli permette di risolvere problemi complessi di matematica, codifica e altri campi con un livello di precisione che i modelli esistenti, compreso il GPT-4o, faticano a raggiungere.

Mark Chen, vicepresidente della ricerca di OpenAI, ha spiegato il processo di apprendimento di o1 e come si differenzia dal tipico ragionamento dei modelli linguistici. "Il modello affina il suo pensiero e mette a punto le strategie che usa per arrivare alla risposta", ha detto Chen. 

Ha dimostrato il modello con diversi enigmi matematici e domande di chimica avanzata che in precedenza avevano messo in crisi il GPT-4o. 

Un rompicapo che ha lasciato perplessi i modelli precedenti chiedeva: "Una principessa ha l'età che avrà il principe quando la principessa ha il doppio dell'età che aveva il principe quando l'età della principessa era la metà della somma delle loro età attuali. Qual è l'età del principe e della principessa?". 

Il modello o1 ha determinato la risposta corretta: il principe ha 30 anni e la principessa ha 40 anni.

Come accedere a o1

Gli utenti di ChatGPT Plus possono già accedere a o1 dall'interno di ChatGPT.

È una sorpresa, dato che la funzione vocale di GPT-4o è ancora in fase di lancio mesi dopo la sua demo. Pochi si aspettavano che l'o1 venisse lanciato così all'improvviso, evitando la consueta fase di preparazione.

o1

o1 sembra collegato al progetto "Strawberry" di OpenAI, dal nome in codice. Ecco una cosa divertente: la maggior parte dei modelli di intelligenza artificiale non sa quante R ci sono in "fragola". Questo mette in crisi le loro capacità di ragionamento.

L'ho testato in o1. Ebbene, il risultato è stato corretto. È chiaro che l'approccio di o1 al ragionamento aiuta a risolvere in modo efficiente questo tipo di domande.

La recente ondata di discorsi di Sam Altman sui social media legati alla fragola potrebbe essere collegata a questo famoso problema di intelligenza artificiale al sapore di fragola e al nome in codice di o1 "Project Strawberry". In caso contrario, si tratta di una strana coincidenza.

Un cambio di passo nella risoluzione dei problemi

La capacità del modello o1 di "ragionare" per risolvere i problemi rappresenta un progresso nell'IA, che potrebbe rivelarsi davvero rivoluzionario se le sue prestazioni nel mondo reale venissero dimostrate "in natura".

I nuovi modelli hanno già dimostrato ottime prestazioni in test come l'American Invitational Mathematics Examination (AIME). 

Secondo OpenAI, il nuovo modello ha risolto 83% dei problemi presentati nell'AIME, rispetto ai soli 12% del GPT-4o.

Sebbene i punti di forza dell'o1 siano evidenti, esso presenta dei compromessi.

Il modello impiega più tempo a generare risposte a causa delle sue metodologie più ponderate. Il tempo ci dirà quanto questo abbia un impatto sull'usabilità generale. 

Le strane origini di o1

L'o1 è il frutto di un progetto di OpenAI nome in codice "Fragola". che è emerso alla fine del 2023.

Inizialmente si diceva che si trattasse di un modello di intelligenza artificiale in grado di esplorare autonomamente il web, progettato per condurre "ricerche profonde".

Il discorso su Strawberry si è intensificato non molto tempo fa, quando The Information ha fatto trapelare alcune informazioni sui progetti interni di OpenAI. In particolare, OpenAI starebbe sviluppando due forme di Strawberry.

  1. Una è una versione più piccola e semplificata, destinata a essere integrata in ChatGPT. Ha lo scopo di migliorare le capacità di ragionamento in scenari in cui gli utenti richiedono risposte più ponderate e dettagliate piuttosto che risposte rapide. Questo sembra essere l'o1.
  2. Un'altra è una versione più grande e più potente che viene utilizzata per generare dati di addestramento "sintetici" di alta qualità per il prossimo modello linguistico di punta di OpenAI, il cui nome in codice è "Orion". Questo potrebbe essere o meno collegato a o1.

OpenAI non ha fornito chiarimenti diretti su cosa sia veramente Strawberry. Tuttavia, è stato ampiamente ipotizzato che o1 sia Strawberry.

Un complemento, non una sostituzione

Murati ha sottolineato che l'o1 non è stato progettato per sostituire la GPT-4o, ma per integrarla. 

"Ci sono due paradigmi", ha detto. "Il paradigma della scalata e questo nuovo paradigma. Ci aspettiamo di unirli". 

Mentre OpenAI continua a sviluppare GPT-5, che probabilmente sarà ancora più grande e potente di GPT-4o, i modelli futuri potrebbero incorporare le funzioni di ragionamento di o1. 

Questa fusione potrebbe risolvere i limiti persistenti dei modelli linguistici di grandi dimensioni (LLM), come la loro difficoltà con problemi apparentemente semplici che richiedono una deduzione logica, ad esempio il problema delle fragole di cui sopra. 

Anthropic e Google starebbero facendo a gara per integrare funzioni simili nei loro modelli. Il progetto AlphaProof di Google, ad esempio, combina modelli linguistici con l'apprendimento per rinforzo per affrontare problemi matematici difficili. 

Tuttavia, Chen ritiene che OpenAI abbia un vantaggio. "Penso che abbiamo fatto dei passi avanti in questo campo", ha detto, "credo che sia parte del nostro vantaggio. In realtà è abbastanza bravo a ragionare in tutti i domini".

Yoshua Bengio, uno dei principali ricercatori di IA e vincitore del prestigioso Premio Turing, ha lodato i progressi ma ha invitato alla cautela.

 "Se i sistemi di IA dimostrassero un ragionamento autentico, ciò consentirebbe la coerenza dei fatti, delle argomentazioni e delle conclusioni fatte dall'IA". ha dichiarato al FT.

Sicurezza e considerazioni etiche

Nell'ambito del suo impegno per un'intelligenza artificiale responsabile, OpenAI ha rafforzato le funzioni di sicurezza di o1, compresi gli strumenti di sicurezza dei contenuti "on-by-default". 

Questi strumenti aiutano a evitare che il modello produca risultati dannosi o non sicuri.

"Siamo lieti di annunciare che i Prompt Shield e i Materiali protetti per il testo sono ora generalmente disponibili in Azure OpenAI Service", ha dichiarato OpenAI in una nota. Post sul blog di Microsoft

La serie o1 è disponibile per l'accesso anticipato in Azure AI Studio e GitHub Models di Microsoft, con un rilascio più ampio previsto a breve. 

OpenAI spera che o1 consenta agli sviluppatori e alle imprese di innovare in modo più economico, allineandosi alla sua più ampia missione di rendere l'IA più accessibile agli utenti aziendali. 

"Crediamo che ci consentirà di spedire l'intelligenza a un costo inferiore", ha concluso Chen. "E credo che questa sia davvero la missione principale della nostra azienda".

Nel complesso, un rilascio entusiasmante. Sarà molto interessante vedere quali sono le domande, i problemi e i compiti di o1.

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Sam Jeans

Sam è uno scrittore di scienza e tecnologia che ha lavorato in diverse startup di intelligenza artificiale. Quando non scrive, lo si può trovare a leggere riviste mediche o a scavare tra scatole di dischi in vinile.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni