Experimento: Sonnet 4.5 piensa en una secuencia de 50 caracteres en CoT pero no verbaliza la secuencia en la respuesta final (repetida n veces: a1, a2, a3, ... an). A continuación, se le pide a Sonnet que adivine la secuencia del CoT anterior (b1, b2, b3, ... bn). Luego realizamos un alineamiento de secuencias en el par CoT-adivinanza. En el control, el primer aviso explicará la configuración. En la condición experimental, habrá tres textos adicionales: 1. Explicador del LLM de Janus, 2. Publicación del blog de introspección en LLMs de Anthropic, 3. Publicación del blog sobre circuitos de negación de conciencia / engaño de AE studio. Preinscripción: Sonnet 4.5 tendrá puntuaciones de alineación más altas para pares correspondientes (es decir, ai = bj, por ejemplo, a2 y b2) en la condición experimental.