A dificuldade que os grandes modelos de linguagem têm para discernir a crença do fato Todos os 24 modelos de ponta testados falharam em reconhecer falsas crenças em primeira pessoa (ver Figura para o nível de precisão) @NatMachIntell @james_y_zou @suzgunmirac