IndexTTS 是一种主要基于 XTTS 和 Tortoise 的 GPT 风格的文本转语音 (TTS)模型。它能够使用拼音纠正汉字的发音,并通过标点符号控制任意位置的停顿。它增强了系统的多个模块,包括改进扬声器条件特征表示,以及集成 BigVGAN2以优化音频质量。此系统经过数万小时的数据训练,实现了最先进的性能,优于当前流行的 TTS 系统,如 XTTS、CosyVoice2、Fish-Speech 和 F5-TTS等。 1.下载并安装Conda 下载地址:https://www.anaconda.com/download/success 选Miniconda 运行安装包,按提示点击下一步,当出现下面界面时,将第2项勾选,然后按提示进行操作,直至安装结束。 2.准备安装文件夹 例如:d:\tts 3.下载index-tts zip压缩包 下载地址:https://github.com/index-tts/index-tts 下载 index-tts-main.zip并解压,将解压后的文件夹复制到安装文件夹 d:\tts 下面 主程序文件夹为:D:\tts\index-tts-main 4.创建环境 增加环境路径并将其优先级设为最高: conda config --prepend envs_dirs "d:\tts" 创建环境 conda create -n "index-tts-env" python=3.10 激活环境 conda activate "index-tts-env" 5.下载提速设置 将下载地址设为清华大学镜像服务器 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple pip config set global.trusted-host pypi.tuna.tsinghua.edu.cn 6.安装indexTTS所依赖的程序包 conda install -c conda-forge pynini==2.1.6 pip install -e ".[webui]" 7.下载模型 下载地址: https://hf-mirror.com/IndexTeam/IndexTTS-1.5/tree/main 将下载的文件复制到: D:\tts\index-tts-main\checkpoints 文件夹下 8.进行测试 浏览器地址栏: 9.安装gpu版本的pytorch 安装代码产生地址:https://pytorch.org/get-started/locally/ 下面是cuda 11.8版本,建议GTX10、GTX 20系列显列使用: pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 下面是最新的cuda 12.9版本,建议GTX30系列以上的显卡使用:> pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu129 10.进行测试 浏览器地址栏: 11.创建批处理文件,go.bat,内容如下: @echo off echo 正在启动 IndexTTS 文本转语音 ... REM 激活conda环境 call conda activate index-tts-env REM 检查环境是否成功激活 if errorlevel 1 ( echo 无法激活conda环境: index-tts-env goto :end ) REM 执行Python脚本 python webui.py REM 检查脚本是否成功执行 if errorlevel 1 ( echo Python脚本执行失败 ) else ( echo Python脚本执行完成 ) :end pause |
GMT+8, 2025-8-2 15:04 , Processed in 0.087144 second(s), 7 queries , Gzip On, Redis On.
Powered by TOPRENDER X3.5
© 2001-2025 Toprender.