Skip to content

Samge0/ragflow-upload

Repository files navigation

上传文档到RagFlow知识库

RagFlow是一个基于 LLM 的问答系统,能够快速构建智能问答平台。然而,RagFlow 默认的知识库上传界面存在一些局限性:每次只能上传有限数量的文件,并且上传后还需手动启动解析流程,当需要上传大量文件时,这样的操作便显得有些繁琐。

为了简化这一过程,我编写了一个脚本,该脚本可以遍历指定目录,自动逐个将文档上传至 RagFlow 知识库,并立即启动解析。当一个文档解析完成后,脚本将自动上传并解析下一个文档。特别是在需要上传大量文件时,这显著减少了人工干预,避免了手动分批上传和解析的等待时间。

(例如,我自己需要将mac中所有备忘录内容导入到知识库中查询)

独立客户端

可以在Releases这里的Assets中下载编译好的最新版本客户端,打开客户端后根据issues#2填写相关配置即可。

如果想要自己构建windows / MAC / linux系统下的可执行程序,可参考scripts/README.md中的说明进行构建。

image

如果需要以源码方式运行,可参考下面几个步骤:

使用miniconda创建env环境

conda create -n ragflow-upload python=3.10.13 -y

激活环境

conda activate ragflow-upload

安装依赖

pip install -r requirements.txt

复制并配置ragflows/configs.py

关于配置文件的说明可参考这个:issues #2

cp ragflows/configs.demo.py ragflows/configs.py

上传文档

python ragflows/main.py

常见问题

执行脚本提示: ModuleNotFoundError: No module named 'ragflows'

一般在vscode/pycharm或者其他IDE中执行时不会遇到这个问题,但如果直接在终端窗口中执行时可能会遇到。

解决方法:

在执行脚本前,配置临时环境变量PYTHONPATH指向当前项目目录(.表示当前所在目录)。

  • Linux/macOS系统:

    export PYTHONPATH=.
    python ragflows/main.py
  • Windows系统 (CMD):

    set PYTHONPATH=.
    python ragflows/main.py
  • Windows系统 (PowerShell):

    $env:PYTHONPATH = "."
    python ragflows/main.py

相关截图

image image

About

自动批量上传并解析文档至 RagFlow 知识库,省去手动操作,提升效率。

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages