我们的 Aleph 代理,由 @OpenAI 的 GPT‑5.2 驱动,在 @gtsoukal 等人的 PutnamBench(最难的正式数学基准)上得分 668/672,99.4% 的超高效率,这是自然语言自动代码生成的关键一步——将英语作为编程——并且结果没有幻觉。