"大型語言模型的穩健認知評估框架"