L'IA soumise à des tests sur la théorie de l'esprit et la généralisation systématique
Des chercheurs ont présenté FANToM, un nouveau benchmark conçu pour tester et évaluer rigoureusement la compréhension et l'application des grands modèles de langage (LLM)...