La difficulté que les grands modèles de langage ont à discerner la croyance du fait Tous les 24 modèles de pointe testés n'ont pas réussi à reconnaître les croyances fausses à la première personne (voir la figure pour le niveau de précision) @NatMachIntell @james_y_zou @suzgunmirac