VoxCPM2 4-bit 便携包:把 2B 参数 TTS 塞进 8GB 显存,双击即用
本地离线、无需 Python 环境、无需配置 CUDA,Windows 上双击就能跑的中文语音合成神器。
这是什么?
VoxCPM2 是 OpenBMB 开源的 2B 参数 tokenizer-free TTS 模型,支持 30 种语言、Voice Design(用文字描述创造声音)、可控克隆、极致克隆,输出 48kHz 高质量音频。
这个便携包把它做成了 Windows 离线包:
- 嵌入式 Python 3.12 + CUDA 12.4
- Gradio Web UI
- 4-bit 量化,8GB 显存即可流畅运行
- 启动时间约 13-15 秒
- 稳态显存占用仅 ~2.1 GB
适合谁?
- 想要本地跑 TTS,不想配环境的用户
- 显卡 8GB(RTX 3060/4060/3070 等)的玩家
- 需要离线、保护隐私的语音合成场景
- 想体验 VoxCPM2 但不想装 Python/CUDA 的小白
怎么用?
- 下载解压到任意目录
- 双击
Start-VoxCPM-Web-Demo.bat - 等 15 秒左右,浏览器打开
http://127.0.0.1:8808 - 输入文字,上传参考音频,或直接描述声音,点击生成
用完双击 Stop-Service.bat 即可。
技术亮点
- 4-bit 量化持久化:模型文件从 4.3GB 压缩到 1.7GB
- GPU 一次性量化加载:CPU 建骨架 → CUDA 打包 → 加载 4-bit 权重,比 CPU 逐层量化快 4-5 倍
- 修复了 device mismatch:KV cache 等状态主动同步到 CUDA,推理不再报 “cpu and cuda:0”
- 纯离线:所有缓存重定向到包内
cache/目录,不污染系统盘
硬件要求
| 配置 | 能否运行 |
|---|---|
| NVIDIA 8GB VRAM | 流畅 |
| NVIDIA 6GB VRAM | 可能启动困难 |
| 纯 CPU | 不支持(bnb 4-bit kernel 依赖 CUDA) |
| 内存 | 推荐 16GB+ |
下载
夸克网盘:https://pan.quark.cn/s/fe30dc103dac
解压后约 9.5GB 可用空间。
开源信息
- VoxCPM2 官方仓库:https://github.com/OpenBMB/VoxCPM
- HuggingFace:https://huggingface.co/openbmb/VoxCPM2
- 协议:Apache-2.0,可商用
#VoxCPM #TTS #语音合成 #AI配音 #开源 #Windows便携包 #本地大模型

305

被折叠的 条评论
为什么被折叠?



