Granite Docling od @IBM je #3 trendy na @huggingface. Jedná se o multimodální model převodu obrázku na text navržený pro efektivní převod dokumentů. Zachovává základní funkce Docling a zároveň zachovává bezproblémovou integraci s DoclingDocuments, aby byla zajištěna plná kompatibilita. Vychází z architektury IDEFICS3, ale přináší dvě klíčové úpravy: nahrazuje kodér vidění za siglip2-base-patch16-512 a nahrazuje jazykový model za Granite 165M LLM. Vyzkoušejte naše demo Granite-Docling-258 ještě dnes. Licence: Apache 2.0 Granite-docling-258M je plně integrován do potrubí Docling, přenáší stávající funkce a zároveň zavádí řadu výkonných nových funkcí, včetně: 🔢 Vylepšené rozpoznávání rovnic: Přesnější detekce a formátování matematických vzorců 🧩 Flexibilní režimy odvozování: Vyberte si mezi odvozováním na celou stránku a odvozováním oblastí s vodítkem bboxu 🧘 Vylepšená stabilita: Má tendenci se účinněji vyhýbat nekonečným smyčkám 🧮 Vylepšené vložené rovnice: Lepší rozpoznávání vložených matematických výpočtů 🧾 QA prvků dokumentu: Odpovězte na otázky týkající se struktury dokumentu, jako je přítomnost a pořadí prvků dokumentu 🌍 Podpora japonštiny, arabštiny a čínštiny (experimentální) HF stránka: Gratulujeme @ArvindKrishna @BillHiggins a týme!