IA sottoposta a test sulla Teoria della Mente e sulla generalizzazione sistematica
I ricercatori hanno presentato FANToM, un nuovo benchmark progettato per testare e valutare rigorosamente la comprensione e l'applicazione dei modelli linguistici di grandi dimensioni (LLM)...