CloneTTS 是一款运行在安卓系统本地的文字转语音(TTS)原生引擎,允许用户离线克隆所需的声音并直接使用该声音来朗读书籍或长文本。以下是配置和使用指南:

CloneTTS 音色克隆阅读 v0.5.0 克隆任何人的音色来阅读小说

配置必读:电池优化与后台保活

  • 电池优化策略:前往手机系统设置,将本应用的电池优化策略改为“无限制”或“允许完全后台行为”。
  • 多任务界面加锁:在手机的多任务(最*任务)界面,把本应用加锁固定以防止被系统强杀后台。

下载与初次体验

  • 首次启动:第一次打开App时,请耐心等待几秒钟以便系统在后台解压模型数据。

如何克隆并添加专属音色

  • 在“音色管理”页面点击右上角的“⋮ (更多选项)”选择“添加音色”。
  • 提供参考声音:通过录音室采音或外部选取上传本地音频(时长要求13秒,单句清晰的无背景音人声)。
  • 填写发音参考文本:确保填写的文字与录制或上传的声音完全匹配。
  • 算力精度(num_steps):推荐保留默认*4步;追求低发热可改为2步,但可能影响音质。
  • 保存并启用:点击底部“保存并启用”,之后可在“音色管理”列表激活所添加的音色。

自己录入1-3秒的语音,或者导入其他人的,注意不要太长,越长会越卡顿

要防止卡顿,需要开启转发服务

然后去到阅读的朗读引擎管理添加新的朗读引擎,http://127.0.0.1:8080/api/tts?text={{speakText}}