AI onderworpen aan tests op Theory of Mind en systematische generalisatie
Onderzoekers hebben FANToM geïntroduceerd, een nieuwe benchmark die is ontworpen om het begrip en de toepassing van grote taalmodellen (LLM's) rigoureus te testen en te evalueren...