Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

prinz
Не бійтеся величі
До речі, ви помітили, що автоматизований стажер-дослідник штучного інтелекту OpenAI працюватиме на сотнях тисяч графічних процесорів?
Передбачалося, що до кінця 2025 року OpenAI матиме «понад 1 мільйон» графічних процесорів, тому це щонайменше ~20% від поточної загальної кількості доступних обчислень OpenAI.

30,1K
Юліан Шріттвізер (антропічний):
- Обговорення бульбашки штучного інтелекту на X «дуже відокремлене» від того, що відбувається в прикордонних лабораторіях. «У прикордонних лабораторіях ми не бачимо жодного уповільнення прогресу».
- Штучний інтелект матиме «величезний економічний вплив». Прогнози доходів OpenAI, Anthropic і Google насправді «досить консервативні».
- Екстраполюючи дані METR, наступного року моделі зможуть самостійно працювати над цілим спектром завдань. Тривалість завдання важлива, тому що вона відкриває для людини можливість керувати командою моделей, кожна з яких працює автономно протягом декількох годин (на відміну від необхідності розмовляти з агентом кожні 10 хвилин, щоб надати йому зворотний зв'язок).
- «Надзвичайно ймовірно», що нинішній підхід до навчання моделей штучного інтелекту (попереднє навчання, RL) призведе до створення системи, яка зможе виконувати приблизно на людському рівні практично всі завдання, про які ми дбаємо з точки зору продуктивності.
- On Move 37: «Я думаю, цілком очевидно, що ці моделі можуть робити нові речі». AlphaCode і AlphaTensor "довели, що ви можете відкривати нові програми та алгоритми". Штучний інтелект вже «абсолютно відкриває нові речі», і «ми просто рухаємося вгору по шкалі того, наскільки вражаючі, наскільки цікавими є речі, які він здатний відкрити самостійно».
- "Дуже ймовірно", що десь наступного року ми отримаємо деякі відкриття, з якими люди одностайно погоджуються, що вони надзвичайно вражають.
- Штучний інтелект зможе самостійно зробити прорив, гідний Нобелівської премії у 2027 або 2028 році.
- Про здатність штучного інтелекту прискорювати розвиток штучного інтелекту: Дуже поширена проблема в багатьох наукових галузях полягає в тому, що в міру розвитку галузі стає все важче і важче досягти прогресу (наприклад, 100 років тому один вчений міг відкрити перший антибіотик випадково, тоді як зараз на відкриття нових ліків потрібні мільярди доларів). Те ж саме може статися і з дослідженнями штучного інтелекту - навіть якщо штучний інтелект зробить дослідження нового ШІ більш продуктивними, вибуху може не статися через те, що нові досягнення стає все важче і важче знайти.

Matt Turck24 жовт. 2025 р.
Знову ж таки, не розумієте експоненціального?
Моя розмова з @Mononofu - Джуліаном Шріттвізером (@AnthropicAI, AlphaGo Zero, MuZero) - про Move 37, Scaling RL, Нобелівську премію зі штучного інтелекту та AI frontier:
00:00 - Cold open: «Ми не бачимо ніякого уповільнення».
00:32 - Вступ — Знайомство з Джуліаном
01:09 - "Експоненціал" зсередини прикордонних лабораторій
04:46 - 2026–2027: агенти, які працюють повний день; Широта на рівні експерта
08:58 - Бенчмарки vs реальність: робота на довгостроковому горизонті, ВВП-Вал, цінність користувача
10:26 - Хід 37 - що насправді сталося і чому це мало значення
13:55 - Нова наука: AlphaCode/AlphaTensor → коли штучний інтелект отримає Нобелівську премію?
16:25 - Розрив проти плавного прогресу (і попереджувальні знаки)
19:08 - Чи допоможе нам попередня підготовка + RL? (Дебати AGI в сторону)
20:55 - Саттон "RL з нуля"? Погляд Джуліана
23:03 - Шлях Джуліана: Google → DeepMind → Anthropic
26:45 - AlphaGo (вивчення + пошук) простою англійською мовою
30:16 - AlphaGo Zero (немає даних про людину)
31:00 - AlphaZero (один алгоритм: го, шахи, сьогі)
31:46 - MuZero (планування з вивченою моделлю світу)
33:23 -Уроки для сучасних агентів: пошук + навчання в масштабі
34:57 - Чи є у LLM вже неявні моделі світу?
39:02 - Чому RL на LLM зайняв час (стабільність, петлі зворотного зв'язку)
41:43 - Обчислення та масштабування для RL - що ми бачимо на даний момент
42:35 - Кордон нагород: людські префи, рубрики, RLVR, нагороди за процес
44:36 - Тренувальні дані RL і «маховик» (і чому якість має значення)
48:02 - RL & Agents 101 — чому RL розкриває надійність
50:51 - Чи повинні будівельники використовувати RL-as-a-service? Або просто інструменти + підказки?
52:18 – Чого не вистачає надійним агентам (можливості vs інженерія)
53:51 - Evals & Goodhart - внутрішні vs зовнішні бенчмарки
57:35 - Механістична інтерпретація & "Золоті ворота Клода"
1:00:03 - Безпека та вирівнювання в Anthropic — як це проявляється на практиці
1:03:48 - Вакансії: взаємодоповнюваність людини та штучного інтелекту (порівняльна перевага)
1:06:33 - Нерівність, політика та аргументи на користь 10× продуктивність → достаток
1:09:24 - Висновок
203,19K
Найкращі
Рейтинг
Вибране


