小米最新开源!覆盖600+语种方言声音克隆TTS 只需3-10秒声音 可控一键合成声音 超40倍速OmniVoice
资源介绍
OmniVoice是一款最先进的大规模多语言零样本文本到语音(TTS)模型,支持超过600种语言。该模型基于一种新颖的扩散语言模型架构,能够以卓越的推理速度生成高质量语音,并支持语音克隆和声音设计。
超广语言覆盖:支持600+语言,零样本TTS中覆盖最广。
零样本语音克隆:仅需3–10秒参考音频,无需训练即可复刻音色,质量顶尖。
自由语音设计:用文本指令控制性别、年龄、音高、口音/方言、耳语等,无需参考音。
极速推理:RTF低至0.025,比实时快40倍,适合批量与实时场景。
精细发音控制:支持笑声/叹气等非语言标记,支持拼音/音标强制纠音。
架构简洁高效:扩散语言模型结构,兼顾音质、速度与扩展性。
易用部署:一键启动Web UI,已经制作好了离线整合包给大家使用,大家有需要的可以试试。
完全开源:GitHub开源,可本地部署(已经可以本地离线运行了)、二次开发与商用友好。
PS:支持如下方言:
陕西话、河南、四川话、贵州话、云南话、桂林话、济南话、石家庄话、甘肃话、宁夏话、青岛话、东北话
文件目录
📁 OmniVoice-小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice └── 📦 OmniVoice.zip
相关资源
AI编程全栈实战:ClaudeCode、谷歌工具,多类软件项目完整落地教学
百度
AI编程全栈实战:ClaudeCode、谷歌工具,多类软件项目完整落地教学
软件工具 人工智能百度网盘
2026-06-22
2026腾讯龙虾WorkBuddy自动化实战课:快速部署配置工具,数据PPT库存销售案例全实操
百度
2026腾讯龙虾WorkBuddy自动化实战课:快速部署配置工具,数据PPT库存销售案例全实操
软件工具 人工智能百度网盘
2026-06-21
AI工具零基础搭建:链式代理网络环境配置,多款主流AI软件操作教学
百度
AI工具零基础搭建:链式代理网络环境配置,多款主流AI软件操作教学
软件工具 人工智能百度网盘
2026-06-21
0基础普通人AI编程,不用手写一行代码,AI开发到上架全流程,普通人也能做出自己的软件
百度
0基础普通人AI编程,不用手写一行代码,AI开发到上架全流程,普通人也能做出自己的软件
软件工具 人工智能百度网盘
2026-06-20
CSDN-uniapp陪诊小程序
夸克
CSDN-uniapp陪诊小程序
软件工具 夸克网盘
2026-06-17
流量蜂《网络环境配置及各大AI软件的基础使用》
百度
流量蜂《网络环境配置及各大AI软件的基础使用》
软件工具 人工智能百度网盘
2026-06-16