"Ett ramverk för robust kognitiv utvärdering av LLM"