随着大模型能力越来越强,越来越多人开始希望拥有一个真正属于自己的“AI第二大脑”。但目前市面上的很多知识库产品,例如腾讯IMA、NotebookLM等,本质上还是依赖联网运行,很多资料都会上传到云端,这也让不少人对隐私和数据安全产生顾虑。
最近我实测了一款叫 DeepLocals 的工具,它最大的特点就是:100%完全离线运行。哪怕你直接拔掉网线,它依然能够正常工作。

这篇文章,我会带大家从零开始,手把手搭建一个真正私有化的本地AI知识库。整个过程并不复杂,小白跟着操作也能成功跑通。
DeepLocals 本质上是一套完全本地化运行的 AI 知识库系统。和传统知识库最大的区别在于:别人的核心能力运行在云端,而它全部运行在你自己的电脑里。

它支持文件学习、OCR识别、向量检索、本地问答以及大模型推理,而且所有流程都在本地闭环完成,不依赖第三方服务器。这意味着,你的文件、资料和知识不会被上传到云端,真正实现“数据只属于自己”。

对于企业内网、高隐私场景、本地资料管理,以及希望搭建个人第二大脑的人来说,这类工具会非常实用。
接下来正式开始安装。
首先需要安装 Ollama。做本地大模型部署的人,对这个工具应该都不陌生。安装完成后,建议直接选择 Qwen3-4B 模型,它目前算是非常优秀的轻量中文模型之一。如果本地没有该模型,Ollama 会自动下载。

这里还有一个很多人容易忽略的重点:一定要安装 Embedding(嵌入)模型。知识库后续的检索效果,很大程度上取决于它。
第二步是安装 Docker Desktop。由于 DeepLocals 使用容器化运行,所以 Docker 环境是必须的。安装过程比较简单,一路下一步即可。
第三步是安装 CUDA。如果你的电脑使用的是 NVIDIA 显卡,建议一定安装 CUDA,因为它能够直接调用 GPU 算力。安装完成后,本地模型的运行速度会明显提升,尤其是在知识库检索和问答时,体验差距非常明显。

接下来就是解压 DeepLocals 镜像包,并按照说明放到对应目录中。整体难度并不高。

启动系统前,有一个关键点需要注意:一定确保 Ollama 已经正常运行。然后直接双击 DeepLocals.exe 即可。
第一次启动时,由于系统需要初始化很多组件,所以时间会稍微久一些,大概需要10到20分钟。后续再次打开速度就会快很多。

进入系统后,可以点击“新建知识库”,然后上传自己的文件。第一次上传时,系统会自动预热重排模型,这是正常现象。如果长时间没有反应,可以尝试点击“重启”。

等所有模型都显示“运行中”之后,就可以正式开始导入文件并提问了。

这里也是最让我惊艳的地方。
我直接把自己过去积累的2870篇公众号文章全部导入到了知识库中。测试下来,它不仅能快速理解问题,还能在大量文章里精准检索到相关内容,整体效果有点像真的给自己训练了一个“AI分身”。
最关键的是:整个过程完全离线。
这一点真的会让人很安心。
我认为,本地化AI知识库未来一定会越来越普及。尤其适合自媒体作者、程序员、企业内部知识管理人员,以及那些非常重视隐私安全的用户。
因为很多云端AI产品,本质上仍然是在“帮平台喂数据”。而本地化方案最大的价值,就是你的知识永远掌握在自己手里。
目前 DeepLocals 已经支持 Windows 版本。官方建议使用 NVIDIA 显卡,并且显存最好在16GB以上。如果当前电脑配置不够,也可以先收藏,后续升级设备后再体验。
过去很多人觉得“本地AI”是一件很复杂的事情,但现在其实已经进入普通人也能轻松部署的阶段了。
而 DeepLocals 最让我认可的一点,就是它真正实现了:离线、私有、安全、可用。
如果你也想搭建一个真正属于自己的 AI 第二大脑,可以去了解一下。
官网地址:deeplocals.com
如果这篇文章对你有帮助,也欢迎点个赞和在看。你们的支持,才是持续更新最大的动力。
1202

被折叠的 条评论
为什么被折叠?



