极致声音克隆VoxCPM2 4-bit量化版便携包:把 2B 参数 TTS 塞进 8GB 显存,双击即用

AI编程·六月创作之星博客挑战赛 10w+人浏览 1.5k人参与

VoxCPM2 4-bit 便携包:把 2B 参数 TTS 塞进 8GB 显存,双击即用

本地离线、无需 Python 环境、无需配置 CUDA,Windows 上双击就能跑的中文语音合成神器。
在这里插入图片描述

这是什么?

VoxCPM2 是 OpenBMB 开源的 2B 参数 tokenizer-free TTS 模型,支持 30 种语言、Voice Design(用文字描述创造声音)、可控克隆、极致克隆,输出 48kHz 高质量音频

这个便携包把它做成了 Windows 离线包

  • 嵌入式 Python 3.12 + CUDA 12.4
  • Gradio Web UI
  • 4-bit 量化,8GB 显存即可流畅运行
  • 启动时间约 13-15 秒
  • 稳态显存占用仅 ~2.1 GB

适合谁?

  • 想要本地跑 TTS,不想配环境的用户
  • 显卡 8GB(RTX 3060/4060/3070 等)的玩家
  • 需要离线、保护隐私的语音合成场景
  • 想体验 VoxCPM2 但不想装 Python/CUDA 的小白

怎么用?

  1. 下载解压到任意目录
  2. 双击 Start-VoxCPM-Web-Demo.bat
  3. 等 15 秒左右,浏览器打开 http://127.0.0.1:8808
  4. 输入文字,上传参考音频,或直接描述声音,点击生成

用完双击 Stop-Service.bat 即可。

技术亮点

  • 4-bit 量化持久化:模型文件从 4.3GB 压缩到 1.7GB
  • GPU 一次性量化加载:CPU 建骨架 → CUDA 打包 → 加载 4-bit 权重,比 CPU 逐层量化快 4-5 倍
  • 修复了 device mismatch:KV cache 等状态主动同步到 CUDA,推理不再报 “cpu and cuda:0”
  • 纯离线:所有缓存重定向到包内 cache/ 目录,不污染系统盘

硬件要求

配置能否运行
NVIDIA 8GB VRAM流畅
NVIDIA 6GB VRAM可能启动困难
纯 CPU不支持(bnb 4-bit kernel 依赖 CUDA)
内存推荐 16GB+

下载

夸克网盘:https://pan.quark.cn/s/fe30dc103dac

解压后约 9.5GB 可用空间。

开源信息

  • VoxCPM2 官方仓库:https://github.com/OpenBMB/VoxCPM
  • HuggingFace:https://huggingface.co/openbmb/VoxCPM2
  • 协议:Apache-2.0,可商用

#VoxCPM #TTS #语音合成 #AI配音 #开源 #Windows便携包 #本地大模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

云樱梦海

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值