7.faiss-cpu向量库安装


一:认识faiss-cpu

1. faiss 到底是什么?

faiss 是Facebook AI 团队开源的、专门用于向量相似度检索的高性能向量数据库,你可以把它理解成「RAG 系统的智能向量储物柜 + 超快检索引擎」。

结合你之前的学习内容,一句话讲清它的核心作用:

之前 给每个文本块生成了对应的向量,现在需要把这些「文本 +向量」对存起来,当用户提问时,能在几毫秒内从成千上万的向量里,找到和用户问题向量最像的前几个文本块 ——faiss 就是专门干这个的,是 RAG 系统能实现精准、快速检索的核心底层引擎

2. 为什么要安装 faiss-cpu?和其他向量库有什么区别?

对比项 faiss-cpu其他向量库(milvus/pinecone 等)零基础选型建议零基础选型建议
部署难度极低,一行命令安装,本地直接运行,无需任何服务部署高,需要搭建服务、配置环境、做集群管理,零基础很难上手★★★★★ 首选 faiss-cpu,零基础直接用
性能完全满足个人学习、小项目需求,单台电脑就能轻松处理 100 万 + 向量的检索性能更强,支持分布式、大数据量,适合企业级生产环境学习 / 小项目用 faiss-cpu 完全够用,企业级项目再考虑其他
成本完全免费开源,本地运行无任何成本有服务器成本、云服务成本,部分有调用额度限制学习场景首选 faiss-cpu,零成本
适配性完全适配你之前生成的文本向量,和 Python 无缝衔接,代码极简有复杂的 API、权限配置,学习成本高零基础学习,faiss-cpu 是唯一首选

3. 核心误区澄清(90% 的零基础人都会搞错)

❌ 错误认知:faiss 是用来生成向量的
✅ 正确认知:faiss不生成向量,它是用来存储向量、快速检索向量的。向量生成是你之前用通义 / BGE 模型做的事,faiss 负责把生成好的向量存起来,然后快速找到最相似的向量。

二:安装faiss-cpu

方案 :零基础首选【conda 安装 faiss-cpu】(稳定性拉满,推荐 90% 的用户用)

步骤 1:安装 Miniconda(如果已经装了 Anaconda/Miniconda,直接跳过)
  1. 打开 Miniconda 官网:官网
  2. 下载对应你系统的安装包(Windows/Mac/Linux)
  3. 双击安装包,按默认步骤安装即可,全程点「下一步」,不用修改任何配置
  4. 安装完成后,打开「Anaconda Prompt」(Windows)或终端(Mac/Linux),执行conda --version,验证安装成功
  5. 打开后,你会看到默认的(base)前缀,说明已经进入 conda 的基础环境了。
    在这里插入图片描述
步骤 2:执行创建命令(核心,可直接复制)

在 Anaconda Prompt 里执行下面的命令,把路径替换成你自己的目标路径,即可在其他盘创建虚拟环境:

# 核心命令:-p 指定路径,python=3.10 指定Python版本,-y 自动确认安装
conda create -p D:\RAG-Learning-Project\env\rag-env python=3.10 -y

命令参数详解(零基础必看)

参数作用你的修改说明
-p核心参数:手动指定虚拟环境的安装路径,必须写,否则默认装在 C 盘替换成你自己的目标路径,比如 D 盘、E 盘、移动硬盘的路径
python=3.10指定虚拟环境的 Python 版本,RAG 项目推荐 3.9/3.10,兼容性最好不要用 3.12+,faiss、dashscope 等包的兼容性还不稳定
-y自动确认所有安装步骤,不用你手动输入y确认可选,不加的话需要手动按y确认安装
步骤3:等待安装完成

执行命令后,conda 会自动在你指定的路径里创建虚拟环境,下载对应的 Python 解释器、基础依赖包,等待 1-2 分钟即可完成。
安装完成后,你会看到提示:# To activate this environment, use,说明创建成功了。

步骤 4:激活你创建的其他盘虚拟环境

创建完成后,不能用默认的conda activate 环境名激活,必须用完整路径激活,命令如下:

# 激活你D盘的虚拟环境,替换成你自己的路径
conda activate D:\RAG-Learning-Project\env\rag-env

激活成功后,你会看到终端最前面的前缀,从(base)变成了(D:\RAG-Learning-Project\env\rag-env),说明已经成功进入其他盘的虚拟环境了。
在这里插入图片描述

步骤 5:验证创建成功

执行下面的命令,验证虚拟环境是否正常:
在这里插入图片描述

步骤6:一键安装 faiss-cpu(国内镜像加速,无网络超时)

执行下面的命令,用国内清华镜像安装 faiss-cpu,一键完成,自动处理所有依赖:

# 配置conda国内清华镜像,加速下载
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --set show_channel_urls yes

# 一键安装faiss-cpu,自动安装所有兼容的依赖
conda install faiss-cpu -y

执行完之后,conda 会自动下载、安装 faiss-cpu 和所有对应的依赖,全程不用你手动操作,等待安装完成即可。

6.1:基础安装验证

打开终端 / 命令提示符,激活虚拟环境,执行下面的命令,验证 faiss 是否能正常导入:

python -c "import faiss; print('faiss-cpu安装成功!版本号:', faiss.__version__)"
6.2:功能验证(基础向量操作测试)
# -*- coding: utf-8 -*-
"""
@Created on : 2026/6/15 17:12
@creator : er_nao
@File :day_92.py
@Description :
"""

import faiss
import numpy as np

# ====================== 测试1:创建faiss索引(向量库) ======================
# 向量维度,和你之前用通义模型生成的向量维度一致(1536维)
d = 1536
# 创建L2距离的索引,最常用、最适合零基础的索引类型
index = faiss.IndexFlatL2(d)
print(f"faiss索引创建成功,向量维度:{d}")

# ====================== 测试2:添加向量到索引(模拟你之前的文本向量) ======================
# 模拟生成10个1536维的向量,对应你之前的10个文本块的向量
# 实际使用时,这里替换成你Day91生成的真实向量
np.random.seed(42)  # 固定随机种子,保证结果可复现
xb = np.random.random((10,d)).astype('float32')
print(f"生成测试向量完成,一共{xb.shape[0]} 个向量,维度{xb.shape[1]}")

# 将向量添加到faiss索引中
index.add(xb)
print(f"向量添加到索引成功,索引中总向量数:{index.ntotal}")


# ====================== 测试3:向量相似度检索(核心功能,RAG检索的核心) ======================
# 生成1个查询向量,对应用户提问的问题向量
xq = np.random.random((1, d)).astype('float32')
print(f"生成查询向量完成,维度 {xq.shape[1]}")

# 执行相似度检索,找和查询向量最像的前3个向量
k =3
distances,indices = index.search(xq, k)

print("\n 相似度检索结果:")
print(f"最相似的前{k}个向量的索引:{indices[0]}")
print(f"对应的L2距离(距离越小,相似度越高):{distances[0]}")
print(" faiss核心功能验证完成,检索正常!")

在这里插入图片描述

三:问题记录

问题一:

在这里插入图片描述

第一步:先找到正确的conda.exe主程序路径

这是最关键的一步,你必须先找到你电脑里安装的 Anaconda/Miniconda 的根目录里的conda.exe,常见路径如下:

常见的正确路径示例:

  • Miniconda 默认安装路径:C:\Users\你的Windows用户名\miniconda3\conda.exe
  • Anaconda 默认安装路径:C:\ProgramData\Anaconda3\conda.exe
  • 如果你改了安装路径:找到你当初安装 Anaconda/Miniconda 的文件夹,根目录里一定有conda.exe

快速找到的方法:

  • 按Win键,搜索Anaconda Prompt,右键点击「打开文件所在位置」
  • 打开的文件夹里,你会看到conda.exe文件,复制它的完整路径即可
第二步:点击「Load Environment」,加载你创建的虚拟环境
  • 点击「Load Environment」按钮,PyCharm 会自动扫描你用 conda 创建的所有虚拟环境
  • 等待 1-2 秒,你会在下方的「Conda Environment」列表里,看到你创建的rag-env虚拟环境
  • 选中这个rag-env虚拟环境,PyCharm 会自动识别出对应的 Python 解释器路径
第三步:点击「确定」,完成配置,重启 PyCharm
  • 勾选「对所有项目可见」,然后点击「确定」按钮
  • 一定要重启 PyCharm 软件,清除缓存,让配置完全生效
  • 重启后,你会看到 PyCharm 右下角的解释器,变成了你的rag-env虚拟环境,配置完全成功!

兜底方法:如果还是不行,直接用这个方法 100% 成功

如果你还是找不到conda.exe,或者加载环境还是有问题,直接用这个兜底方法,完全避开 Conda Executable 的配置,直接用你的虚拟环境里的 Python 解释器:

  1. 回到「Add Python Interpreter」窗口,左侧不要选「Conda Environment」,直接选「System Interpreter」
  2. 点击「Interpreter」右侧的「…」按钮,浏览找到你虚拟环境里的python.exe,也就是你之前填的F:\RAG-Learning-Project\env\rag-env\python.exe
  3. 选中这个文件,点击「确定」,再点击「应用」「确定」
  4. 重启 PyCharm,配置直接生效,完全不用管 Conda Executable 的配置,就能正常使用你的虚拟环境了!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

HappyAcmen

非常感谢大佬的鼓励!感谢感谢!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值