Real-Time Voice Cloning
Clona uma voz a partir de poucos segundos de áudio e sintetiza fala em tempo real com ela. É uma implementação open-source do paper SV2TTS (Speaker Verification to Text-To-Speech), combinando três modelos — encoder, synthesizer e vocoder — num pipeline completo. Serve para pesquisadores, devs e entusiastas de áudio que querem explorar síntese de voz sem depender de APIs pagas. O diferencial é a capacidade de generalizar para vozes nunca vistas no treino, usando apenas um clipe curto como referência. Projeto open-source, gratuito, roda localmente.
Ferramentas Relacionadas
OpenVoice
OpenVoice é um sistema de clonagem de voz instantânea que replica o timbre de qu...
SyncVoice
Clonagem de voz por IA com apenas 10 segundos de áudio — gera fala realista em 8...
Applio
Um ecossistema completo para a criação e manipulação de vozes via RVC (Retrieval...
IndexTTS2
TTS com controle de duração preciso e expressividade emocional real — não é aque...