"Ein Rahmen für eine robuste kognitive Bewertung von LLMs"