GPT-SoVITS – 小样本开源声音克隆项目-AI出海

GPT-SoVITS – 小样本开源声音克隆项目

图片[1]-GPT-SoVITS – 小样本开源声音克隆项目-AI出海

简介

GPT-SoVITS，是一个由RVC变声器创始人“花儿不哭”推出的免费开源项目。

它通过巧妙融合了GPT（Generative Pre-trained Transformer）模型与SoVITS（Speech-to-Video Voice Transformation System）变声器技术，使得用户仅需少量样本数据，即可实现高质量的语音克隆和文本到语音转换（TTS）。

访问链接

https://github.com/RVC-Boss/GPT-SoVITS

软件特征

GPT-SoVITS项目提供提供了零样本和少样本的TTS功能。

零样本TTS允许用户仅凭一个5秒的声音样本，即可实现即时的文本到语音转换。

而少样本TTS则通过1分钟的训练数据，对模型进行微调，以提升声音的相似度和真实感。

通过模型训练，该工具能够学习并复制特定说话人的声音特征，包括情感、音色和语速，从而生成与原声音极为相似的合成语音。

这个工具支持多种语言的语音合成，目前包括英语、日语和中文。

配置要求

Windows

支持 CUDA 的 nVIDIA 显卡，每张拥有至少 6G 以上显存
常见的不能使用的显卡：10系以前的所有卡、1060以下，1660以下，2060以下、3050 4G
Windows 10/11 系统

MAC

搭载Apple芯片（M系列芯片）或AMD GPU的Mac（如2019款Mac Pro）
macOS 12.3或更高版本
已通过运行xcode-select –install安装Xcode command-line tools

B站教程

© 版权声明

文章版权归原作者所有，未经允许请勿转载。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则，我站将依法保留追究相关法律责任的权利。

THE END

声音克隆
# 免费 # 开源项目 # AI视频

以上内容对你有用的话，打个赏、推荐一下呗

点赞453 赞赏

相关推荐

评论抢沙发

欢迎您留下宝贵的见解！

提交

暂无评论内容