部落志 >> 软件应用 >> SmolDocling-256M-preview 高效多模态图像-文本到文本模型

SmolDocling-256M-preview 高效多模态图像-文本到文本模型

3月18日发布在软件应用

SmolDocling-256M-preview 是一款多模态图像-文本到文本模型，提供高效文档转换，能够在消费级 GPU 上以低于 500MB 的显存需求，在 0.35 秒内处理一页文档，速度极快，完全兼容 Docling，支持 DoclingDocuments，保留了 Docling 的核心功能。

SmolDocling-256M-preview核心功能

DocTags：采用高效的文档表示方法，清晰分离文本与文档结构，兼容 DoclingDocuments。

OCR：从图像中精准提取文本内容。

布局与定位：保留文档结构及元素边界框。

代码识别：自动检测并格式化代码块，包括缩进。

公式识别：识别并处理数学表达式。

图表识别：提取并解析图表数据。

表格识别：支持列与行标题，实现结构化表格提取。

图像分类：区分不同类型的图形元素。

标题对应：将标题与相关图像、图形关联。

列表分组：正确组织并结构化列表内容。

整页转换：处理页面中的所有元素，包括代码、公式、表格、图表等。

带边界框的 OCR：通过边界框识别 OCR 区域。

通用文档处理：适用于科学与非科学文档。

无缝 Docling 集成：支持导入 Docling 并导出为多种格式（如 MD、HTML）。

快速推理：基于 VLLM 技术，在 A100 GPU 上平均每页处理时间仅 0.35 秒。

SmolDocling-256M-preview 通过多模态能力与高效处理性能，为文档转换提供服务，适用于多种场景需求。

你可能感兴趣的

软件应用

Excel二级下拉菜单智能扩展教程 Excel教程

软件应用

Excel位置查找函数：FIND函数使用指南

软件应用

电脑的面部识别无法使用怎么办？

软件应用

Excel 2021 分段式折线图绘制步骤 Excel教程

软件应用

如何提高PPT可撤销操作数量？三步设置搞定 PPT教程

软件应用

Excel 2021制作双层嵌套柱形图 Excel教程

软件应用

AlDente Pro优化Mac电池，多模式控电校准，延长使用寿命

软件应用

Origin2024图表中怎样加色块区域突出关键内容 Origin教程

软件应用

AutoCAD2024里标注的字体和箭头太小，根本看不清怎么办？ AutoCAD教程

软件应用

Uptime Kuma 开源服务器监控工具，支持HTTP(s)、TCP、Ping、DNS 记录、Steam 游戏服务器、Docker 容器等多种监控方式监控工具

大家在看的

休闲手游《梦幻庄园》攻略游戏攻略

横版国风4V4轻竞技手游《闹闹天宫》攻略游戏攻略

RTX 5070游戏本华硕天选6 Pro锐龙版首发6999元起

RTX 5080游戏本实测DLSS

软件应用

Excel二级下拉菜单智能扩展教程 Excel教程

软件应用

Excel位置查找函数：FIND函数使用指南

夏天上高速，这些准备工作你做了吗？

闯红灯后停在路中间，会不会被扣分

想买混动车，到底应该怎么选

贷款买车，有哪些事需要注意

大家在看的

二次元

优惠折扣

软件应用

RTX 5070游戏本华硕天选6 Pro锐龙版首发6999元起

巴氏刷牙法守护口腔第一步

Steam单机游戏《真·三国无双起源》攻略软件应用

软件应用

Excel 2021多层柱形图制作步骤

全3D类Roguelike 地牢探索游戏《混乱2025/DISORDER 2025》游戏攻略

钠对人到底有多重要

Postcat API：可扩展的API工具平台

AI写作助手，一个基于Next.js的工具，支持多种LLM，可定制写作风格并生成高质量内容

家里用的天然气为什么是臭的？

西柚加速器：加密隧道保护隐私，全球最快连接，无广告干扰

安易加速器：新用户注册送365天，可永久免费使用的加速器

雷神ZERO 18 Pro性能实测

Copyright © 加速部落