Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tomasz Tunguz
Sekarang kita telah mengompresi hampir semua pengetahuan manusia ke dalam model bahasa yang besar, batas berikutnya adalah pemanggilan alat. Menyatukan alat AI yang berbeda memungkinkan otomatisasi. Pergeseran dari berpikir ke melakukan mewakili terobosan nyata dalam utilitas AI.
Saya telah membangun lebih dari 100 alat untuk diri saya sendiri, dan mereka bekerja sebagian besar waktu, tetapi tidak sepanjang waktu. Saya tidak sendirian. Laporan Indeks Ekonomi Anthropic mengungkapkan bahwa 77% penggunaan bisnis Claude berpusat pada otomatisasi tugas penuh, bukan co-piloting.
Anthropic menerbitkan dokumentasi minggu lalu tentang efisiensi token & alat arsitektur ulang untuk mengoptimalkan penggunaannya. Panduannya berlawanan dengan intuisi: alih-alih banyak alat sederhana dengan label yang jelas, buat alat yang lebih sedikit dan lebih kompleks.
Berikut adalah tujuh alat email yang saya buat - skrip Ruby, masing-masing dengan tujuan yang jelas. Skrip "Safe Send Email" dirancang untuk mencegah AI mengirim email tanpa persetujuan.
Indah naif, sederhana, & jelas, Bukankah seharusnya model bahasa dapat membaca ini & tahu persis apa yang saya minta untuk dilakukan? Tapi tidak sesederhana ini!
Anthropic merekomendasikan untuk membuat alat yang kompleks. Penelitian mereka menunjukkan bahwa "permintaan menghemat rata-rata 14% dalam token output, hingga 70%" saat menggunakan alat yang canggih dan kaya parameter, bukan yang sederhana. Alasannya? Sistem AI memahami konteks penuh lebih baik daripada niat yang terfragmentasi.
Saya menghabiskan akhir pekan untuk mengkonsolidasikan semua alat saya ke dalam alat terpadu, seperti ini untuk email: (gambar ketiga)
Dampaknya pada akurasi langsung. Tingkat keberhasilan Claude mendekati 100%. Sistemnya lebih cepat. Akibatnya, saya menggunakan token yang jauh lebih sedikit dengan sistem yang lebih efisien.
Inilah model mental saya saat ini: (gambar keempat)
Ketika saya mendesain ulang untuk kognisi AI daripada intuisi manusia, semuanya membaik. Operasi CRM, manajemen kalender, & alur kerja basis data saya semuanya menjadi lebih andal ketika dikonsolidasikan menjadi alat yang komprehensif dan berat parameter. Akurasi meningkat, sehingga total biaya berkurang secara signifikan.
Tapi jangan minta saya untuk menggunakan alat tersebut. Saya sekarang sedikit tersesat di tengah kerumitan. Ini adalah konsekuensi yang tak terelakkan dari bekerja pada tingkat abstraksi yang lebih tinggi, tidak lagi memahami mesin secara mendalam.
Kami menghabiskan beberapa dekade membuat perangkat lunak sederhana bagi orang-orang. Sekarang kami belajar untuk membuatnya rumit untuk AI.



486
Seperti sarapan di restoran, perangkat lunak murah & cepat dibuat. Mintalah alat manajemen tugas baru dan Anda akan memiliki versi pertama dalam waktu yang lebih singkat dan dengan uang yang lebih sedikit daripada telur dadar.
Alat buatan AI mungkin tidak bertahan lama. Beberapa bertahan hanya beberapa menit, cukup lama untuk menjawab "Apa waktu penyelesaian kita minggu ini?"
Yang lain tetap berguna selama beberapa hari atau minggu, seperti aplikasi yang dapat memutar pelacak proyek ringan untuk orientasi Walmart. Terkadang mereka bertahan lebih dari sebulan.
Jika keabadian mendefinisikan dua dekade terakhir perangkat lunak, ketidaktetapan dapat menentukan yang berikutnya.
Kita sekarang melihat tiga lapisan terbentuk di sepanjang kontinum:
SaaS yang Tahan Lama: sistem catatan berumur panjang seperti dasbor pipa.
Aplikasi sementara: alat berumur pendek seperti pelacak proyek orientasi Walmart.
Pertanyaan Instan: kueri satu kali seperti "Beri tahu saya tentang akun Apple".
Dengan urutan besarnya, aplikasi sementara & pertanyaan instan akan melebihi jumlah aplikasi SaaS, mungkin jutaan banding satu. Dopamin yang tinggi dari pemecahan masalah instan membuat ketagihan dan mempercepat karier.
Yang mendasari semua aplikasi ini akan menjadi sistem pencatatan, seringkali platform yang sudah ada tetapi semakin baru.
Tim keuangan & operasi bergantung pada dasbor persisten untuk tata kelola & pelaporan, seolah-olah definisi metrik dapat distandarisasi di seluruh organisasi. Pemasar memutar aplikasi data yang berlangsung beberapa bulan untuk menganalisis kinerja pengeluaran berbayar mereka, & tim pendukung mengajukan pertanyaan cepat tentang waktu penyelesaian sebelum melanjutkan.
Model tepercaya, izin, & logika bisnis dari platform BI yang mendasari seperti @omni memberi pengguna kepercayaan diri untuk bereksperimen dengan aplikasi sementara & pertanyaan instan. Kontrol pondasi memastikan kontrol lapisan di atas.
Pola desain ini melampaui AI ke sebagian besar perangkat lunak lainnya.
Apakah Anda akan minum kopi, telur dadar, atau makanan lima hidangan, startup hebat berikutnya akan menyajikan semuanya.

5,67K
Teratas
Peringkat
Favorit