ElevenLabs właśnie rozwiązał problem transkrypcji mowy. Ich nowy model, Scribe v2, jest SOTA pod względem wskaźnika błędów słownych. Radzi sobie z pauzami, śmiechem, złożonymi słowami z łatwością. Jest tak dobry w segmentowaniu mówców i nie popełnił ZERO błędów w ostatecznym teście: głosy identycznych bliźniaków. Jak to działa 👇