A ElevenLabs acabou de resolver a transcrição de fala. O novo modelo deles, Scribe v2, é SOTA em taxa de erro de palavras. Ele lida com pausas, risadas, palavras complexas com facilidade. É muito bom em segmentar alto-falantes e cometeu ZERO erro no teste final: vozes gêmeas idênticas. Como funciona 👇