PDF Craft – 基于 DeepSeek OCR，实现扫描版 PDF 的高保真电子书转换

AI 精选 2025/12/18 青小蛙 32

先看图1：

PDF Craft - 基于 DeepSeek OCR，实现扫描版 PDF 的高保真电子书转换 1 — 左侧是扫描版 PDF 文件，右侧是转换后的 Markdown 格式

再看图2：

PDF Craft - 基于 DeepSeek OCR，实现扫描版 PDF 的高保真电子书转换 2 — 左侧是带数学公式的 PDF，右侧是转换为 ePUB 格式的电子书（转换为LaTeX）

这两个效果，均是使用基于 DeepSeek OCR 的 PDF Craft 实现，非常的赞。

还有图3

群里的小伙伴推荐：

PDF Craft - 基于 DeepSeek OCR，实现扫描版 PDF 的高保真电子书转换 3

PDF Craft 是什么？

PDF Craft 是工作流 IDE 软件 OOMOL Studio 使用 MIT 授权开源的项目，只做一件事：

将 PDF 文件转换为各种其他格式，并且专注于处理扫描版书籍的 PDF 文件。

由于代码开源，所以你可以使用自己的硬件，完全本地化操作，无需联网。

PDF Craft - 基于 DeepSeek OCR，实现扫描版 PDF 的高保真电子书转换 4

PDF Craft 的工作原理

PDF Craft 使用 DeepSeek OCR 进行 PDF 文档的内容识别，并能准确提取正文内容、脚注、公式、图片、表格等内容，同时过滤页眉、页脚等干扰信息。最终将 PDF 格式转换为 Markdown 或 EPUB 格式，尤其是扫描版 PDF，即保持了原书的内容完整性，又提升了可读性。

PDF Craft 专门针对数学公式做了很多细节处理，对科研人员、学生、常读论文的人群会有很大帮助。

转换为 LaTeX

下图是转换带数学公式的 PDF 到 Markdown 格式后的样子，注意左边的 .md 文件源码，是标准的 LaTeX 语法：

PDF Craft - 基于 DeepSeek OCR，实现扫描版 PDF 的高保真电子书转换 5

基于 DeepSeek OCR

这里就不得不说一下 DeepSeek OCR 了，这是 DeepSeek 在两个月发布一种基于多模态大模型的光学字符识别技术，它能够像人类一样“阅读”并理解图片中的文字、表格和复杂版面，将其转化为可编辑的高质量结构化数据。

如何使用 PDF Craft

有两种方式使用 PDF Craft：

自己部署
直接使用在线演示平台。

自托管安装指南

https://github.com/oomol-lab/pdf-craft/

完整的安装过程非常技术化了，有官方说明书。

青小蛙在这里列一下必备条件吧：

Python >= 3.10, < 3.14（推荐 3.11.16）
Poppler（用于 PDF 解析和渲染）
NVIDIA GPU，支持 CUDA 11.8 或 12.1
显存 16 GB 以上（推荐 24 GB 或更高）

主要流程：配置 CUDA、安装 PyTorch、安装 pdf-craft、安装 Poppler，然后就能使用了。

嫌麻烦的同学，可以直接：

PDF Craft 在线演示平台

https://pdf.oomol.com/

这个就简单易用，直接用浏览器打开上面的网址就行了。（需要注册）

PDF Craft - 基于 DeepSeek OCR，实现扫描版 PDF 的高保真电子书转换 6

我也没有扫描版 PDF 呀，你们快去试试，记得回来告诉我效果如何。

这有几个邀请码可以领：

每个人只能生成5个邀请码。

另外由于是演示目的，所以这个站点会有额度限制，用的多需要付费（也支持 API）。

如果常用，还是推荐自托管（如果你有硬件的话 😂）

原文：https://www.appinn.com/pdf-craft/

32 条社区评论

写留言

Enable Notifications OK No thanks