Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tomasz Tunguz
Тепер, коли ми стиснули майже всі людські знання у великі мовні моделі, наступний рубіж – це виклик інструментів. Об'єднання різних інструментів штучного інтелекту забезпечує автоматизацію. Перехід від мислення до дії є справжнім проривом у корисності штучного інтелекту.
Я створив для себе понад 100 інструментів, і вони працюють більшу частину часу, але не завжди. Я не один. Звіт Anthropic's Economic Index показує, що 77% бізнес-використання Claude зосереджено на автоматизації повних завдань, а не на спільному пілотуванні.
Минулого тижня Anthropic опублікувала документацію про ефективність токенів та інструменти перебудови для оптимізації їх використання. Вказівка була нелогічною: замість багатьох простих інструментів з чіткими мітками, створіть менше, більш складних інструментів.
Ось сім інструментів для роботи з електронною поштою, які я створив - скрипти на Ruby, кожен з яких має чітку мету. Сценарій «Безпечне надсилання електронної пошти» був розроблений, щоб штучний інтелект не надсилав електронні листи без схвалення.
Красиво наївно, просто і зрозуміло, хіба мовна модель не повинна бути в змозі прочитати ці слова і точно знати, про що я її просив? Але не все так просто!
Anthropic рекомендує створювати складні інструменти. Їхнє дослідження показує, що «запити економлять у середньому 14% на вихідних токенах, до 70%» при використанні складних, багатих на параметри інструментів замість простих. З чим це пов'язано? Системи штучного інтелекту краще розуміють повний контекст, ніж фрагментарні наміри.
Я провів вихідні, об'єднуючи всі свої інструменти в єдині інструменти, як цей для електронної пошти: (третє зображення)
Вплив на точність був миттєвим. Показник успіху Клода наближається до 100%. Система працює швидше. Як результат, я використовую набагато менше токенів з більш ефективною системою.
Ось моя поточна ментальна модель: (четверте зображення)
Коли я переробив на пізнання штучного інтелекту, а не на людську інтуїцію, все покращилося. Мої операції CRM, керування календарем і робочі процеси з базами даних стали надійнішими, коли їх було об'єднано в комплексні інструменти з великою кількістю параметрів. Точність покращилася, тому підсумкова вартість була значно знижена.
Але не просіть мене користуватися інструментами. Зараз я трохи розгубився серед складнощів. Це неминучий наслідок роботи на більш високих рівнях абстракції, більше не глибокого розуміння машини.
Ми витратили десятиліття на те, щоб зробити програмне забезпечення простим для людей. Зараз ми вчимося робити його складним для штучного інтелекту.



568
Як і сніданок у закусочній, програмне забезпечення дешеве та швидке у приготуванні. Попросіть новий інструмент для управління завданнями, і ви отримаєте першу версію за менший час і за менші гроші, ніж омлет.
Інструменти, створені на основі штучного інтелекту, можуть проіснувати недовго. Деякі виживають лише кілька хвилин, достатньо довго, щоб відповісти: «Який у нас час цього тижня?».
Інші залишаються корисними протягом кількох днів або тижнів, як, наприклад, додаток, який може розкрутити легкий трекер проектів для онбордингу Walmart. Іноді вони зберігаються і понад місяць.
Якщо постійність визначила останні два десятиліття існування програмного забезпечення, то непостійність може визначити наступне.
Тепер ми бачимо, що уздовж континууму формуються три шари:
Міцний SaaS: довгоживучі системи запису, такі як панель приладів трубопроводу.
Ephemeral Apps: недовговічні інструменти на кшталт трекера проектів онбордингу Walmart.
Миттєві запитання: одноразові запити на кшталт «Розкажіть мені про обліковий запис Apple».
На порядки ефемерні додатки та миттєві запитання перевищать кількість SaaS-додатків, можливо, мільйони до одного. Дофаміновий кайф миттєвого вирішення проблем викликає звикання та прискорює кар'єру.
В основі всіх цих додатків буде лежати система запису, часто існуюча платформа, але все частіше нова.
Фінансові та операційні команди залежать від постійних інформаційних панелей для управління та звітності, ніби визначення показника може бути стандартизоване в усій організації. Маркетологи використовують додатки для обробки даних, які працюють кілька місяців, щоб проаналізувати ефективність оплачених витрат, а команди підтримки ставлять швидкі запитання про час виконання, перш ніж рухатися далі.
Надійні моделі, дозволи та бізнес-логіка базової BI-платформи, як-от @omni, дають користувачам впевненість для експериментів з ефемерними програмами та миттєвими запитаннями. Контроль фундаменту забезпечує контроль над шарами вище.
Цей шаблон проектування виходить за рамки штучного інтелекту і поширюється на більшість інших програмних засобів.
Незалежно від того, вип'єте ви каву, омлет або їжу з п'яти страв, наступний великий стартап подасть все це.

5,69K
Найкращі
Рейтинг
Вибране