ElevenLabs щойно вирішив транскрипцію мовлення. Їхня нова модель, Scribe v2, має SOTA за рівнем помилок у словах. Він легко справляється з паузами, сміхом, складними словами. Він дуже добре сегментує динаміки і не допустив жодної помилки на фінальному тесті: ідентичні голоси близнюків. Як це працює 👇