Granite Docling da @IBM é # 3 em alta na @huggingface. Este é um modelo multimodal de imagem de texto em texto projetado para conversão eficiente de documentos. Ele preserva os principais recursos do Docling, mantendo a integração perfeita com o DoclingDocuments para garantir total compatibilidade. Ele se baseia na arquitetura IDEFICS3, mas introduz duas modificações importantes: substitui o codificador de visão por siglip2-base-patch16-512 e substitui o modelo de linguagem por um Granite 165M LLM. Experimente nossa demonstração Granite-Docling-258 hoje. Licença: Apache 2.0 O Granite-docling-258M está totalmente integrado aos pipelines de Docling, transportando recursos existentes e introduzindo uma série de novos recursos poderosos, incluindo: 🔢 Reconhecimento aprimorado de equações: detecção e formatação mais precisas de fórmulas matemáticas 🧩 Modos de inferência flexíveis: escolha entre inferência de página inteira, inferência de região guiada por bbox 🧘 Estabilidade aprimorada: tende a evitar loops infinitos de forma mais eficaz 🧮 Equações em linha aprimoradas: Melhor reconhecimento matemático em linha 🧾 Controle de qualidade do elemento do documento: Responda a perguntas sobre a estrutura de um documento, como a presença e a ordem dos elementos do documento 🌍 Suporte a japonês, árabe e chinês (experimental) Página HF: Parabéns @ArvindKrishna @BillHiggins & equipe!