最近在捣鼓AI大模型,看到哔哩哔哩网站推出了语言大模型IndexTTS 2.0,看着确实很不错的样子,对于创作者都很实用,开发的过程中需要语音播报也很实用。刚好最近有时间,查了大部分资料终于搞出来了,干净很不错。
本文实用笔记本电脑,win11系统、1060显卡、cuda、python3.7、魔当平台,本地部署IndexTTS2.0语言生成大模型,相关部署用时30分钟,就可以拥有一个自主可控的文字转语音工具。
下面介绍利用魔当系统部署本地IndexTTS2.0语音大模型:
1.魔当社区系统下载地址
https://seemts.com/zh/
2.miniconda下载地址
https://repo.anaconda.com/miniconda/
本例中使用的是Miniconda3-py310_25.5.1-1-Windows-x86_64.exe
4.CUDA 工具包安装部署,用于显卡计算
https://seemts.com/zh/install-cuda.html
3.IndexTTS 2.0部署文档网址
https://seemts.com/zh/lm-downloader-index-tts-v2.html
正式安装
1、安装魔当
这个没什么好说的,windows下就是下一步下一步,我这里使用的是lm-downloader-1.3.6-setup.exe
第一次打开后,打开魔当右上角的设置,建议设置一下数据存储位置(模型大概10G以上,最好预留20G),本例是在D盘创建了目录lmd_data,全路径不能有中文即可,剩下的不需要改动。
2、安装cuda
https://seemts.com/zh/install-cuda.html
3.安装IndexTTS 2.0
打开魔当后,搜索index2.0然后安装即可,在安装的时候可以看看日志,会显示是否退出安装,输入 N +回车。
安装完成截图,启动时c盘至少预留10G空间,否则启动会报错。

安装完后会自动打开网页,跳转到http://127.0.0.1:7860/

生成的文件在D:\modang\apps\index-tts2\outputs 目录下,wav格式
8425

被折叠的 条评论
为什么被折叠?



