Anthropic rilascia Claude Sonnet 3.5 che batte GPT-4o

24 giugno 2024

  • Anthropic ha rilasciato Claude Sonnet 3.5 che è ora il suo modello più potente, superando Claude 3 Opus
  • Claude Sonnet 3.5 offre capacità di visione e codifica migliorate e una finestra di anteprima degli artefatti.
  • Claude Sonnet 3.5 batte GPT-4o e Gemini 1.5 Pro in diversi test di benchmark di MMLU

Anthropic ha rilasciato Claude Sonnet 3.5, più potente, più veloce e più economico del modello più grande Claude 3 Opus.

Quando Anthropic ha rilasciato il suo Claude 3 famiglie di modelli a marzoI modelli erano disponibili in tre varianti, Haiku, Sonnet e Opus, ognuna delle quali aumentava in termini di dimensioni, capacità e costo dei gettoni.

Claude Sonnet 3.5 è significativamente più intelligente del suo predecessore più grande e viene fornito con un grande aggiornamento delle sue capacità di elaborazione della visione e di codifica.

È anche molto più veloce ed economico. Anthropic afferma che l'inferenza con Claude Sonnet 3.5 è due volte più veloce di Claude Opus 3, 5 volte più economica per token, e ha anche una finestra di contesto di 200k.

In soli 3 mesi, Claude Opus 3 è diventato superfluo e Anthropic afferma che possiamo aspettarci versioni aggiornate 3.5 di Haiku e Opus "presto".

Anthropic ha reso disponibile il modello per l'uso gratuito sul suo sito web Claude.ai interfaccia di chat e app iOS. La sottoscrizione di un account a pagamento consente di ottenere limiti di tariffa più elevati e l'accesso all'API.

Risultati del benchmark di Claude Sonnet 3.5

Claude Sonnet 3.5 non è in grado di effettuare ricerche su Internet o di generare immagini, ma le sue capacità di elaborazione della visione, matematica, ragionamento e codifica hanno battuto i leader del settore GPT-4o e Gemini Pro 1.5 su una serie di benchmark.

Confronto tra i benchmark di Claude Sonnet 3.5. Fonte: Antropico
Confronto tra i benchmark di Claude Sonnet 3.5. Fonte: Antropico

I punteggi relativi al ragionamento matematico visivo e al coding sono le cifre che spiccano in questo caso, ed è proprio il miglioramento delle abilità di coding che ha entusiasmato gli utenti.

Manufatti

La funzione Artefatti è un'interessante aggiunta all'interfaccia di chat web di Claude. ChatGPT genera il codice per voi, ma poi dovete copiarlo e incollarlo in un ambiente di sviluppo per provarlo.

Claude dispone ora di una finestra aggiuntiva che si apre accanto all'interfaccia di chat, dove è possibile vedere un'anteprima in tempo reale del codice. Le modifiche si riflettono immediatamente nella finestra degli artefatti.

Anthropic afferma che Artifacts supporterà presto i team e consentirà di lavorare in collaborazione sui progetti. Speriamo che ChatGPT riceva presto la sua versione di Artifacts.

Anthropic ha dichiarato di aver sottoposto Claude 3.5 Sonnet a rigorosi test di sicurezza e di averlo consegnato all'Artificial Intelligence Safety Institute (AISI) del Regno Unito per la valutazione della sicurezza prima dell'impiego.

La sua valutazione di sicurezza interna, pubblicato nella scheda modelloha classificato "Claude 3.5 Sonnet come modello AI Safety Level 2 (ASL-2), indicando che non presenta rischi di danni catastrofici".

Anthropic afferma che, oltre alle versioni aggiornate dei modelli Haiku e Opus, aggiungerà presto modalità, capacità di memoria e altre funzioni di integrazione aziendale.

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Eugene van der Watt

Eugene proviene da un background di ingegneria elettronica e ama tutto ciò che è tecnologico. Quando si prende una pausa dal consumo di notizie sull'intelligenza artificiale, lo si può trovare al tavolo da biliardo.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni