實驗:Sonnet 4.5 在 CoT 中思考一個 50 字符的序列,但在最終回應中不會口頭表達該序列(重複 n 次:a1, a2, a3, ... an)。接下來,要求 Sonnet 根據之前的 CoT 猜測該序列(b1, b2, b3, ... bn)。然後我們對 CoT-猜測對進行序列比對。在對照組中,第一個提示將解釋設置。在實驗條件下,將有三個額外的文本:1. Janus 的 LLM 解釋,2. Anthropic 在 LLM 中的內省博客文章,3. AE studio 的意識否認/欺騙電路博客文章。 預註冊:在實驗條件下,Sonnet 4.5 對應對的對(即 ai = bj,例如 a2 和 b2)將具有更高的比對分數。