企业知识库图文混排再升级：可视化前端一键解析【已开源】

原创于 2025-04-25 10:55:49 发布 · 1.1k 阅读

·

14

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

收录于

RAG 企业知识库

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

产品效果

上周我们团队开源了 RAGFlow 知识库支持图文混排后，有同学私信我们能不能做一个前端出来，释放双手。

企业生产环境下知识库管理者通过可视化前端页面完成文档上传解析，并自动支持图文混排，效率将会大幅度提升。

文档上传完成后，在 RAGFlow 进行问答，便可以自动显示文档里的图片：

实现原理

图文混排整体流程如下：

文档 OCR 引擎

在之前发布的「RAGFlow 如何实现图片回答？KnowFlow 的实战方案来了（附源码）」文中，我们是内置了 MinerU 和 PyMuPDF 两种 OCR 引擎，经反复对比后 PyMuPDF 效果很差，几乎不能用。所以 OCR 引擎层面本次升级只支持 MinerU 。少即是多，提供过多的选择未必是一件正确的事，产品层面越简单越好。

图片存储与读取

之前方案中我们采用了 docker 独立容器部署图片服务，虽然安全性上进一步提升。但考虑到图片的存储与读取性能以及部署的复杂度，本次我们统一将图片存储到 RAGFlow 的 Minio。从设计的角度来看，也更加紧凑，复用原有的框架能力，降低复杂度。

上传文档

后台管理系统新上传了文档接口，可以实时显示文档解析的进度。需要注意的是目前文档解析并未存储到文件系统里，上传功能并未做持久化。

未来展望

因近期有不少客户在询问企业微信对接场景，短期的目标会围绕企业微信接入场景，目前功能已开发完毕也已经开源，后续将会回到知识库最核心的两点： RAGFlow 性能（回答速度）和准确率进一步进行挖掘。

需要源码的同学，敬请关注微信公众号「KnowFlow 企业知识库」，回复「源码」关键词即可获取。

期望同行多多交流，共同促进企业知识库和智能客户产品行业的繁荣演进。

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

标签

#RAG #企业知识库 #智能客服 #AIGC #DeepSeek

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。