Đại lý Aleph của chúng tôi, được hỗ trợ bởi GPT‑5.2 của @OpenAI, đã đạt điểm 668/672, 99.4% với hiệu suất siêu cao trên PutnamBench của @gtsoukal và cộng sự (bài kiểm tra toán học chính thức khó nhất) — một bước quan trọng trong việc tự động hóa mã nguồn ngôn ngữ tự nhiên — tiếng Anh như lập trình — với kết quả không có ảo giác.