Mockingbird 是一种声音克隆软件,可以复制和编辑人类语音。这种软件通常用于语音模拟和生成新语音,但也可能用于欺骗和恶作剧。由于技术的进步,声音克隆软件越来越逼真,因此应谨慎使用。
目前网络上的版本有很多,教程也是各种五花八门,我尝试看了几个代码都跑不通,自己折腾了一天终于完成了数据集预处理、模型训练应用的过程,效果还算可以,想要真的完美的克隆声音还需要技术的进步才可以。
文章目录
- 准备工作
- 环境配置
-
- 创建虚拟环境
- 激活虚拟环境
- pip安装匹配版本
- 声音克隆
-
- 音频数据批量预处理
- 长音频截取功能
- 模型数据预处理
- 训练encoder模型 (可选)
- 训练合成器模型
- 查看训练模型
- GUI可视化操作
- 已知的bug和解决办法
-
- 文字目录没有配置好
- 数据目录没有配置好
- 其他的可以留言我会补充解决办法