Clone-voice:开源的声音克隆工具

kuaikan 2026-6-14 0

A sound cloning tool with a web interface, using your voice or any sound to record audio

一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频


https://github.com/jianchang512/clone-voice

这是一个声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。

使用非常简单,没有N卡GPU也可以使用,下载预编译版本,双击 app.exe 打开一个web界面,鼠标点点就能用。
支持 中、英、日、韩、法、德、意等16种语言,可在线从麦克风录制声音。

为保证合成效果,建议录制时长5秒到20秒,发音清晰准确,不要存在背景噪声。

英文效果很棒,中文效果还凑合。
点击此处打开Releases下载页面:https://github.com/jianchang512/clone-voice/releases

下载预编译版主文件(1.7G) 和 模型(3G)
下载后解压到某处,比如 E:/clone-voice 下
双击 app.exe ,等待自动打开web窗口,请仔细阅读cmd窗口的文字提示,如有错误,均会在此显示


模型下载后解压到软件目录下的 tts 文件夹内,解压后效果如图


转换操作步骤

选择【文字->声音】按钮,在文本框中输入文字、或点击导入srt字幕文件,然后点击“立即开始”。

选择【声音->声音】按钮,点击或拖拽要转换的音频文件(mp3/wav/flac),然后从“要使用的声音文件”下拉框中选择要克隆的音色,如果没有满意的,也可以点击“本地上传”按钮,选择已录制好的5-20s的wav/mp3/flac声音文件。或者点击“开始录制”按钮,在线录制你自己的声音5-20s,录制完成点击使用。然后点击“立即开始”按钮

如果机器拥有N卡GPU,并正确配置了CUDA环境,将自动使用CUDA加速

下载训练文件后,在软件根目录下解压,然后双击 runtrain.bat

【训练说明】 如果想训练,执行 python train.py, 训练参数在 param.json中调整,调整后重新执行训练脚本python train.py


签名:这个人很懒,什么也没有留下!
最新回复 (0)
返回