Granite Docling från @IBM är #3 trendigt på @huggingface. Detta är en multimodal bild-text-till-text-modell som är konstruerad för effektiv dokumentkonvertering. Det bevarar kärnfunktionerna i Docling samtidigt som den upprätthåller sömlös integration med DoclingDocuments för att säkerställa full kompatibilitet. Den bygger på IDEFICS3-arkitekturen, men introducerar två viktiga ändringar: den ersätter visionskodaren med siglip2-base-patch16-512 och ersätter språkmodellen med en Granite 165M LLM. Prova vår Granite-Docling-258 demo idag. Licens: Apache 2.0 Granite-docling-258M är helt integrerad i Doclings pipelines och överför befintliga funktioner samtidigt som den introducerar ett antal kraftfulla nya funktioner, inklusive: 🔢 Förbättrad ekvationsigenkänning: Mer exakt detektering och formatering av matematiska formler 🧩 Flexibla inferenslägen: Välj mellan helsidesinferens, bbox-guidad regioninferens 🧘 Förbättrad stabilitet: Tenderar att undvika oändliga loopar mer effektivt 🧮 Förbättrade infogade ekvationer: Bättre inbyggd matematisk igenkänning 🧾 Dokumentelement-QA: Svara på frågor om ett dokuments struktur, t.ex. förekomst och ordning på dokumentelement 🌍 Stöd för japanska, arabiska och kinesiska (experimentellt) HF-sida: Grattis @ArvindKrishna @BillHiggins och teamet!