Kesulitan yang dimiliki model bahasa besar untuk membedakan kepercayaan dari fakta Semua 24 model mutakhir yang diuji gagal mengakui keyakinan palsu orang pertama (lihat Gambar untuk tingkat akurasi) @NatMachIntell @james_y_zou @suzgunmirac