Fish Speech

●Free●Open Source

Fish Speech é um sistema de síntese de voz (TTS) de alta qualidade, open-source, que clona vozes com poucos segundos de áudio de referência. Serve pra desenvolvedores, pesquisadores e criadores que precisam de TTS realista sem depender de APIs pagas. O diferencial é a qualidade da clonagem zero-shot — você passa um sample curto e ele reproduz timbre, entonação e sotaque com fidelidade surpreendente. Suporta múltiplos idiomas incluindo português. Roda local, sem mandar seus dados pra nenhum servidor de terceiros. Open-source com licença permissiva.

text-to-speechclonagem de vozsíntese de vozTTSIA generativaopen-source

Acessar Ferramenta

Sobre

Fish Speech é um motor TTS open-source desenvolvido pelo time Fish Audio, focado em clonagem de voz zero-shot com qualidade de produção. Nasceu como alternativa real às soluções comerciais como ElevenLabs — mesma qualidade, sem custo por caractere e sem lock-in. Roda completamente local com GPU NVIDIA, o que torna viável para aplicações que exigem privacidade ou volume alto de geração.

Voltar ao catalogo