La difficoltà che i grandi modelli linguistici hanno nel discernere la credenza dal fatto Tutti e 24 i modelli all'avanguardia testati non sono riusciti a riconoscere le false credenze in prima persona (vedi figura per il livello di accuratezza) @NatMachIntell @james_y_zou @suzgunmirac