一:认识faiss-cpu
1. faiss 到底是什么?
faiss 是Facebook AI 团队开源的、专门用于向量相似度检索的高性能向量数据库,你可以把它理解成「RAG 系统的智能向量储物柜 + 超快检索引擎」。
结合你之前的学习内容,一句话讲清它的核心作用:
之前 给每个文本块生成了对应的向量,现在需要把这些「文本 +向量」对存起来,当用户提问时,能在几毫秒内从成千上万的向量里,找到和用户问题向量最像的前几个文本块 ——faiss 就是专门干这个的,是 RAG 系统能实现精准、快速检索的核心底层引擎
2. 为什么要安装 faiss-cpu?和其他向量库有什么区别?
| 对比项 faiss-cpu | 其他向量库(milvus/pinecone 等) | 零基础选型建议 | 零基础选型建议 |
|---|---|---|---|
| 部署难度 | 极低,一行命令安装,本地直接运行,无需任何服务部署 | 高,需要搭建服务、配置环境、做集群管理,零基础很难上手 | ★★★★★ 首选 faiss-cpu,零基础直接用 |
| 性能 | 完全满足个人学习、小项目需求,单台电脑就能轻松处理 100 万 + 向量的检索 | 性能更强,支持分布式、大数据量,适合企业级生产环境 | 学习 / 小项目用 faiss-cpu 完全够用,企业级项目再考虑其他 |
| 成本 | 完全免费开源,本地运行无任何成本 | 有服务器成本、云服务成本,部分有调用额度限制 | 学习场景首选 faiss-cpu,零成本 |
| 适配性 | 完全适配你之前生成的文本向量,和 Python 无缝衔接,代码极简 | 有复杂的 API、权限配置,学习成本高 | 零基础学习,faiss-cpu 是唯一首选 |
3. 核心误区澄清(90% 的零基础人都会搞错)
❌ 错误认知:faiss 是用来生成向量的
✅ 正确认知:faiss不生成向量,它是用来存储向量、快速检索向量的。向量生成是你之前用通义 / BGE 模型做的事,faiss 负责把生成好的向量存起来,然后快速找到最相似的向量。
二:安装faiss-cpu
方案 :零基础首选【conda 安装 faiss-cpu】(稳定性拉满,推荐 90% 的用户用)
步骤 1:安装 Miniconda(如果已经装了 Anaconda/Miniconda,直接跳过)
- 打开 Miniconda 官网:官网
- 下载对应你系统的安装包(Windows/Mac/Linux)
- 双击安装包,按默认步骤安装即可,全程点「下一步」,不用修改任何配置
- 安装完成后,打开「Anaconda Prompt」(Windows)或终端(Mac/Linux),执行conda --version,验证安装成功
- 打开后,你会看到默认的(base)前缀,说明已经进入 conda 的基础环境了。

步骤 2:执行创建命令(核心,可直接复制)
在 Anaconda Prompt 里执行下面的命令,把路径替换成你自己的目标路径,即可在其他盘创建虚拟环境:
# 核心命令:-p 指定路径,python=3.10 指定Python版本,-y 自动确认安装
conda create -p D:\RAG-Learning-Project\env\rag-env python=3.10 -y
命令参数详解(零基础必看)
| 参数 | 作用 | 你的修改说明 |
|---|---|---|
| -p | 核心参数:手动指定虚拟环境的安装路径,必须写,否则默认装在 C 盘 | 替换成你自己的目标路径,比如 D 盘、E 盘、移动硬盘的路径 |
| python=3.10 | 指定虚拟环境的 Python 版本,RAG 项目推荐 3.9/3.10,兼容性最好 | 不要用 3.12+,faiss、dashscope 等包的兼容性还不稳定 |
| -y | 自动确认所有安装步骤,不用你手动输入y确认 | 可选,不加的话需要手动按y确认安装 |
步骤3:等待安装完成
执行命令后,conda 会自动在你指定的路径里创建虚拟环境,下载对应的 Python 解释器、基础依赖包,等待 1-2 分钟即可完成。
安装完成后,你会看到提示:# To activate this environment, use,说明创建成功了。
步骤 4:激活你创建的其他盘虚拟环境
创建完成后,不能用默认的conda activate 环境名激活,必须用完整路径激活,命令如下:
# 激活你D盘的虚拟环境,替换成你自己的路径
conda activate D:\RAG-Learning-Project\env\rag-env
激活成功后,你会看到终端最前面的前缀,从(base)变成了(D:\RAG-Learning-Project\env\rag-env),说明已经成功进入其他盘的虚拟环境了。

步骤 5:验证创建成功
执行下面的命令,验证虚拟环境是否正常:

步骤6:一键安装 faiss-cpu(国内镜像加速,无网络超时)
执行下面的命令,用国内清华镜像安装 faiss-cpu,一键完成,自动处理所有依赖:
# 配置conda国内清华镜像,加速下载
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --set show_channel_urls yes
# 一键安装faiss-cpu,自动安装所有兼容的依赖
conda install faiss-cpu -y
执行完之后,conda 会自动下载、安装 faiss-cpu 和所有对应的依赖,全程不用你手动操作,等待安装完成即可。
6.1:基础安装验证
打开终端 / 命令提示符,激活虚拟环境,执行下面的命令,验证 faiss 是否能正常导入:
python -c "import faiss; print('faiss-cpu安装成功!版本号:', faiss.__version__)"
6.2:功能验证(基础向量操作测试)
# -*- coding: utf-8 -*-
"""
@Created on : 2026/6/15 17:12
@creator : er_nao
@File :day_92.py
@Description :
"""
import faiss
import numpy as np
# ====================== 测试1:创建faiss索引(向量库) ======================
# 向量维度,和你之前用通义模型生成的向量维度一致(1536维)
d = 1536
# 创建L2距离的索引,最常用、最适合零基础的索引类型
index = faiss.IndexFlatL2(d)
print(f"faiss索引创建成功,向量维度:{d}")
# ====================== 测试2:添加向量到索引(模拟你之前的文本向量) ======================
# 模拟生成10个1536维的向量,对应你之前的10个文本块的向量
# 实际使用时,这里替换成你Day91生成的真实向量
np.random.seed(42) # 固定随机种子,保证结果可复现
xb = np.random.random((10,d)).astype('float32')
print(f"生成测试向量完成,一共{xb.shape[0]} 个向量,维度{xb.shape[1]}")
# 将向量添加到faiss索引中
index.add(xb)
print(f"向量添加到索引成功,索引中总向量数:{index.ntotal}")
# ====================== 测试3:向量相似度检索(核心功能,RAG检索的核心) ======================
# 生成1个查询向量,对应用户提问的问题向量
xq = np.random.random((1, d)).astype('float32')
print(f"生成查询向量完成,维度 {xq.shape[1]}")
# 执行相似度检索,找和查询向量最像的前3个向量
k =3
distances,indices = index.search(xq, k)
print("\n 相似度检索结果:")
print(f"最相似的前{k}个向量的索引:{indices[0]}")
print(f"对应的L2距离(距离越小,相似度越高):{distances[0]}")
print(" faiss核心功能验证完成,检索正常!")

三:问题记录
问题一:

第一步:先找到正确的conda.exe主程序路径
这是最关键的一步,你必须先找到你电脑里安装的 Anaconda/Miniconda 的根目录里的conda.exe,常见路径如下:
常见的正确路径示例:
- Miniconda 默认安装路径:C:\Users\你的Windows用户名\miniconda3\conda.exe
- Anaconda 默认安装路径:C:\ProgramData\Anaconda3\conda.exe
- 如果你改了安装路径:找到你当初安装 Anaconda/Miniconda 的文件夹,根目录里一定有conda.exe
快速找到的方法:
- 按Win键,搜索Anaconda Prompt,右键点击「打开文件所在位置」
- 打开的文件夹里,你会看到conda.exe文件,复制它的完整路径即可
第二步:点击「Load Environment」,加载你创建的虚拟环境
- 点击「Load Environment」按钮,PyCharm 会自动扫描你用 conda 创建的所有虚拟环境
- 等待 1-2 秒,你会在下方的「Conda Environment」列表里,看到你创建的rag-env虚拟环境
- 选中这个rag-env虚拟环境,PyCharm 会自动识别出对应的 Python 解释器路径
第三步:点击「确定」,完成配置,重启 PyCharm
- 勾选「对所有项目可见」,然后点击「确定」按钮
- 一定要重启 PyCharm 软件,清除缓存,让配置完全生效
- 重启后,你会看到 PyCharm 右下角的解释器,变成了你的rag-env虚拟环境,配置完全成功!
兜底方法:如果还是不行,直接用这个方法 100% 成功
如果你还是找不到conda.exe,或者加载环境还是有问题,直接用这个兜底方法,完全避开 Conda Executable 的配置,直接用你的虚拟环境里的 Python 解释器:
- 回到「Add Python Interpreter」窗口,左侧不要选「Conda Environment」,直接选「System Interpreter」
- 点击「Interpreter」右侧的「…」按钮,浏览找到你虚拟环境里的python.exe,也就是你之前填的F:\RAG-Learning-Project\env\rag-env\python.exe
- 选中这个文件,点击「确定」,再点击「应用」「确定」
- 重启 PyCharm,配置直接生效,完全不用管 Conda Executable 的配置,就能正常使用你的虚拟环境了!
1275

被折叠的 条评论
为什么被折叠?



