企业知识库图文混排再升级:可视化前端一键解析【已开源】

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

产品效果

上周我们团队开源了 RAGFlow 知识库支持图文混排后,有同学私信我们能不能做一个前端出来,释放双手。

企业生产环境下知识库管理者通过可视化前端页面完成文档上传解析,并自动支持图文混排,效率将会大幅度提升。

文档上传完成后,在 RAGFlow 进行问答,便可以自动显示文档里的图片

实现原理

图文混排整体流程如下

文档 OCR 引擎

在之前发布的「RAGFlow 如何实现图片回答?KnowFlow 的实战方案来了(附源码)」文中,我们是内置了 MinerU 和 PyMuPDF 两种 OCR 引擎,经反复对比后 PyMuPDF 效果很差,几乎不能用。所以 OCR 引擎层面本次升级只支持 MinerU 。少即是多,提供过多的选择未必是一件正确的事,产品层面越简单越好

图片存储与读取

之前方案中我们采用了 docker 独立容器部署图片服务,虽然安全性上进一步提升。但考虑到图片的存储与读取性能以及部署的复杂度,本次我们统一将图片存储到 RAGFlow 的 Minio。从设计的角度来看,也更加紧凑,复用原有的框架能力,降低复杂度。

上传文档

后台管理系统新上传了文档接口,可以实时显示文档解析的进度。需要注意的是目前文档解析并未存储到文件系统里,上传功能并未做持久化。

未来展望

因近期有不少客户在询问企业微信对接场景,短期的目标会围绕企业微信接入场景,目前功能已开发完毕也已经开源,后续将会回到知识库最核心的两点: RAGFlow 性能(回答速度)和准确率进一步进行挖掘。

需要源码的同学,敬请关注微信公众号「KnowFlow 企业知识库」,回复「源码」关键词即可获取。

期望同行多多交流,共同促进企业知识库和智能客户产品行业的繁荣演进。

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值