Supertonic : synthèse vocale ultrarapide et multilingue en local, ultraléger en 31 langues
https://github.com/supertone-inc/supertonic
📌 Supertonic est un outil qui transforme du texte en voix directement sur votre appareil, sans utiliser de cloud ni envoyer vos données sur Internet.
Supertonic permet de générer des voix naturelles à partir de texte tout en fonctionnant entièrement en local. L’application peut lire du contenu dans 31 langues différentes et fonctionne aussi bien sur ordinateur, mobile, navigateur ou même Raspberry Pi. L’objectif est de proposer une synthèse vocale rapide, légère et privée sans dépendre d’un service en ligne.
Parmi les fonctionnalités principales :
- 🔊 Génération de voix naturelles en local
- 🌍 Support de 31 langues
- ⚡ Fonctionnement rapide même sans GPU
- 🔒 Aucune donnée envoyée dans le cloud
- 📱 Compatible desktop, mobile et navigateur
- 🎭 Ajout d’émotions et d’expressions dans la voix
- 💻 Fonctionne aussi sur Raspberry Pi
- 🧩 SDK disponibles pour de nombreux langages
Le système peut transformer du texte en audio presque instantanément. Contrairement à beaucoup de solutions cloud, les données restent entièrement sur l’appareil utilisé. Cela permet de préserver la confidentialité tout en supprimant les coûts d’API ou d’abonnement liés à la synthèse vocale.
Supertonic prend en charge de nombreuses langues comme le français, l’anglais, l’espagnol, le japonais, le coréen ou encore l’allemand. Le système peut également gérer automatiquement certains textes multilingues sans configuration compliquée.
L’un des points intéressants concerne les tags d’expression. Il est possible d’ajouter des indications directement dans le texte afin de modifier le ton de la voix avec des effets comme rire, chuchotement, pause ou soupir. Cela permet de rendre la lecture plus naturelle et expressive.
L’outil fonctionne grâce à ONNX Runtime, une technologie légère capable de tourner sur des appareils modestes sans nécessiter de gros matériel. Le modèle reste compact tout en produisant une sortie audio de qualité élevée en 44.1kHz.
Supertonic peut aussi être intégré facilement dans des applications grâce à des SDK pour Python, Node.js, Swift, Rust, Flutter, Java ou encore C++. Un serveur local compatible avec certaines API OpenAI est également disponible pour simplifier les intégrations.
L’ensemble du projet est open source et pensé pour les usages où la confidentialité et la rapidité sont importantes. Supertonic peut ainsi servir à lire des articles, générer des voix pour des applications, améliorer l’accessibilité ou créer des contenus audio sans dépendre d’un service externe.
