"大型语言模型的稳健认知评估框架"