Granite Docling de @IBM este #3 în tendințe pe @huggingface. Acesta este un model multimodal Image-Text-to-Text proiectat pentru conversia eficientă a documentelor. Păstrează caracteristicile de bază ale Docling, menținând în același timp integrarea perfectă cu DoclingDocuments pentru a asigura compatibilitate deplină. Se bazează pe arhitectura IDEFICS3, dar introduce două modificări cheie: înlocuiește codificatorul de viziune cu siglip2-base-patch16-512 și înlocuiește modelul de limbaj cu un LLM Granite 165M. Încercați astăzi demonstrația noastră Granite-Docling-258. Licență: Apache 2.0 Granite-docling-258M este complet integrat în conductele Docling, preluând caracteristicile existente, introducând în același timp o serie de funcții noi puternice, inclusiv: 🔢 Recunoașterea îmbunătățită a ecuațiilor: detectarea și formatarea mai precisă a formulelor matematice 🧩 Moduri de inferență flexibile: Alegeți între inferență pe pagină întreagă, inferență de regiune ghidată de bbox 🧘 Stabilitate îmbunătățită: tinde să evite buclele infinite mai eficient 🧮 Ecuații în linie îmbunătățite: O mai bună recunoaștere matematică în linie 🧾 QA elementelor documentului: Răspundeți la întrebări despre structura unui document, cum ar fi prezența și ordinea elementelor documentului 🌍 Suport pentru japoneză, arabă și chineză (experimental) Pagina HF: Felicitări @ArvindKrishna @BillHiggins și echipa!