IndexTTS-vLLM是基于vLLM库重新实现的开源文本转语音项目,专为加速IndexTTS推理过程而设计。这个强大的AI语音生成工具通过优化的并行计算架构,在保持原有语音质量的同时,将推理速度提升了惊人的3倍!🚀

【免费下载链接】index-tts-vllm Added vLLM support to IndexTTS for faster inference. 【免费下载链接】index-tts-vllm 项目地址: https://gitcode.com/gh_mirrors/in/index-tts-vllm

🔥 性能突破:速度与质量的完美平衡

IndexTTS-vLLM在单张RTX 4090显卡上实现了显著的速度提升:

  • 实时因子RTF优化:从约0.3降低到约0.1
  • GPT模型解码速度:从约90 tokens/s提升到约280 tokens/s
  • 高并发支持:仅需5GB显存即可支持16个并发请求

📥 快速安装:5分钟完成部署

环境配置步骤

  1. 克隆项目仓库
git clone https://gitcode.com/gh_mirrors/in/index-tts-vllm
cd index-tts-vllm
  1. 创建Python虚拟环境
conda create -n index-tts-vllm python=3.12
conda activate index-tts-vllm
  1. 安装PyTorch依赖 确保安装PyTorch 2.8.0版本,这是与vLLM 0.10.2兼容的关键。

  2. 一键安装所有依赖

pip install -r requirements.txt

🎯 模型下载:三种便捷方式

推荐方式:自动下载

# Index-TTS版本
modelscope download --model kusuriuri/Index-TTS-vLLM --local_dir ./checkpoints/Index-TTS-vLLM

# IndexTTS-1.5版本  
modelscope download --model kusuriuri/Index-TTS-1.5-vLLM --local_dir ./checkpoints/Index-TTS-1.5-vLLM

# IndexTTS-2版本
modelscope download --model kusuriuri/IndexTTS-2-vLLM --local_dir ./checkpoints/IndexTTS-2-vLLM

🖥️ 用户界面:直观的Web操作

IndexTTS-vLLM提供了友好的Web界面,让文本转语音变得异常简单:

  • Index-TTS 1.0python webui.py
  • IndexTTS-1.5python webui.py --version 1.5
  • IndexTTS-2python webui_v2.py

🔌 API集成:开发者福音

项目内置了完整的API服务,支持兼容接口:

API服务启动

# Index-TTS-1.0/1.5版本
python api_server.py

# IndexTTS-2版本
python api_server_v2.py

核心配置参数

  • --model_dir:模型权重路径(必填)
  • --host:服务IP地址,默认0.0.0.0
  • --port:服务端口,默认6006
  • --gpu_memory_utilization:vLLM显存占用率,默认0.25

✨ 特色功能:多角色语音混合

IndexTTS-vLLM v1/v1.5版本支持多角色音频混合功能,你可以输入多个参考音频,系统会智能合成这些声线的混合版本,创造出独特的语音效果!🎭

📊 性能对比:数据说话

seed-test基准测试中,IndexTTS-vLLM表现出色:

模型 中文WER 英文WER
Human 1.254 2.143
index-tts (num_beams=3) 1.005 1.943
index-tts-vllm 1.12 1.987

关键优势:在实现3倍加速的同时,基本保持了原项目的语音质量和识别准确率。

🚀 实战测试:验证并发性能

项目提供了完整的并发测试脚本simple_test.py,帮助开发者:

  • 评估系统的实际并发处理能力
  • 优化GPU资源利用率
  • 确保生产环境稳定性

💡 使用技巧:最大化利用效果

  1. 显存优化:将gpu_memory_utilization设置为0.25即可支持16并发
  2. 多版本兼容:支持Index-TTS、IndexTTS-1.5和IndexTTS-2三个主要版本
  3. 灵活部署:既支持本地Web界面,也提供完整的API服务

IndexTTS-vLLM通过vLLM的并行计算优化,重新定义了文本转语音的性能边界。无论你是需要快速生成语音内容的创作者,还是需要集成TTS功能的开发者,这个项目都能为你提供业界领先的语音生成体验!🎙️

【免费下载链接】index-tts-vllm Added vLLM support to IndexTTS for faster inference. 【免费下载链接】index-tts-vllm 项目地址: https://gitcode.com/gh_mirrors/in/index-tts-vllm

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐