Granite Docling av @IBM er #3 som trender på @huggingface. Dette er en multimodal bilde-tekst-til-tekst-modell utviklet for effektiv dokumentkonvertering. Den bevarer kjernefunksjonene til Docling samtidig som den opprettholder sømløs integrasjon med DoclingDocuments for å sikre full kompatibilitet. Den bygger på den IDEFICS3 arkitekturen, men introduserer to viktige modifikasjoner: den erstatter vision-koderen med siglip2-base-patch16-512 og erstatter språkmodellen med en Granite 165M LLM. Prøv vår Granite-Docling-258-demo i dag. Lisens: Apache 2.0 Granite-docling-258M er fullt integrert i Docling-rørledningene, og overfører eksisterende funksjoner samtidig som den introduserer en rekke kraftige nye funksjoner, inkludert: 🔢 Forbedret ligningsgjenkjenning: Mer nøyaktig gjenkjenning og formatering av matematiske formler 🧩 Fleksible slutningsmoduser: Velg mellom helsides slutning, bbox-veiledet regionslutning 🧘 Forbedret stabilitet: Har en tendens til å unngå uendelige løkker mer effektivt 🧮 Forbedrede innebygde ligninger: Bedre innebygd matematisk gjenkjenning 🧾 Dokumentelement QA: Svar på spørsmål om et dokuments struktur, for eksempel tilstedeværelsen og rekkefølgen på dokumentelementer 🌍 Støtte for japansk, arabisk og kinesisk (eksperimentell) HF-side: Gratulerer @ArvindKrishna @BillHiggins og teamet!