Viime kuun NeurIPS 2025 -konferenssissa YC:n @agupta haastatteli @krandiash:n, Cartesian perustajan ja toimitusjohtajan, kanssa selittääkseen, miksi nykyiset tekoälyarkkitehtuurit saattavat olla perustavanlaatuisesti rajoitettuja. He keskustelevat siitä, miten muuntajat toimivat enemmän kuin hakujärjestelmät kuin oppimisjärjestelmät, missä uudet mallimenetelmät sopivat ja mitä todellinen multimodaalinen älykkyys saattaa vaatia. He käsittelevät myös, miksi Cartesia sai alkunsa tekoälyn äänestä ja miten tutkimusveteiset tiimit muuttavat syvällisen tutkimuksen todellisiksi tuotteiksi. 00:11 — Esittelyä kartesiasta 00:26 — Arkkitehtuuritutkimuksesta startupiin 01:20 — Mitä "arkkitehtuuritutkimus" todella tarkoittaa 02:18 — Miksi transformerit osuivat kattoon 03:33 — Tilatilamallit selitettynä 04:21 — Älykkyys puristuksena 05:47 — Palautus vs. Abstraktio 06:41 — Hybridiarkkitehtuurit ja tulevaisuus 07:13 — Miksi Cartesia valitsi äänitekoälyn 08:25 — Mitä multimodaalisuus oikeastaan tarkoittaa 09:20 — Ääni reseptinä muille muodoille 10:09 — Merkit, esitykset ja oppimissignaalit 11:37 — Oppimisrepresentaatiot alusta päähän 12:29 — Rakennus "keskivertoihmiselle" 13:54 — Tutkimus vs. tuotteen todellisuus 15:18 — Yksi näky, armottomasti toteutettu 16:28 — Tuote totuusseerumina tutkimusta varten 17:25 — Startup-painovoima pätee myös tutkimukseen