TypeWhisper : dictée privée, plus rapide et plus fiable
https://www.typewhisper.com/en/
https://github.com/TypeWhisper/typewhisper-mac
📌 TypeWhisper permet de dicter et transcrire sur Mac sans envoyer votre voix sur un serveur, avec une approche “privé par défaut” et un vrai souci des workflows au quotidien.
TypeWhisper se présente comme une solution de speech-to-text locale pour macOS : vos données vocales restent sur la machine, sans télémétrie, sans abonnement, et sans dépendance cloud obligatoire. L’idée est simple : déclencher une dictée n’importe où (dans n’importe quelle application) via un raccourci global, parler, puis laisser le texte s’insérer rapidement avec un comportement configurable. Dans la pratique, c’est souvent là que les outils de dictée se jouent : latence, fiabilité de l’audio, et capacité à s’adapter à des contextes différents (mail, prise de notes, tickets, chat, rédaction longue). La version 1.2, annoncée comme la release stable pour macOS, met l’accent sur trois améliorations très concrètes : dictée plus rapide, consommation CPU au repos réduite, et comportement audio plus robuste.
Au-delà du “parler → texte”, TypeWhisper organise un ensemble de fonctions qui répondent aux usages réels. D’abord, la dictée système : un hotkey global permet de dicter dans n’importe quel champ, ce qui évite de changer d’app ou de passer par des étapes de copier-coller. Ensuite, la transcription de fichiers audio/vidéo : vous pouvez déposer des fichiers, lancer des transcriptions en lot, puis exporter des sous-titres avec timecodes, notamment en SRT ou WebVTT. C’est le genre de détail qui compte si vous transcrivez des interviews, des réunions, des podcasts, des démos produit, ou même des captures d’écran vidéo de cours.
TypeWhisper ajoute aussi un niveau “outil de production” autour du texte : prompts, profils, historique, dictionnaire et snippets. Les prompts et actions intégrées permettent de traiter le texte après dictée (réécriture, transformation, normalisation), et l’app ouvre des surfaces plus avancées via une API locale, une CLI et des plugins pour automatiser des flux. Les profils, eux, servent à adapter le comportement par application ou même par site web : vous n’écrivez pas un message Slack comme un compte-rendu, et vous ne dictez pas un ticket technique comme une note personnelle. Avec des réglages “app-aware”, l’outil vise à basculer automatiquement langue, moteur, et comportements selon le contexte. L’historique est pensé pour être consultable et recherchable, ce qui transforme la dictée en matière première réutilisable (retrouver une phrase, une référence, une commande, un nom propre). Le dictionnaire et les règles de correction permettent de dompter les termes métier, acronymes, prénoms, et orthographes spécifiques, tandis que les snippets facilitent l’insertion de formulations récurrentes.
Un point différenciant affiché par TypeWhisper est le choix du moteur de reconnaissance vocale. Plutôt que de vous imposer une seule solution, l’app met en avant “six moteurs” au total : trois intégrés, et d’autres disponibles via add-ons. Parmi les moteurs mis en avant dans la comparaison :
- WhisperKit (présenté comme des modèles Whisper optimisés Apple), orienté usage multilingue et aperçu en streaming, avec prise en charge annoncée de nombreuses langues (99+) et de la traduction en streaming (20 langues).
- Parakeet TDT v3 Fast (architecture NVIDIA), présenté comme extrêmement rapide et très précis sur les langues européennes, avec une accélération annoncée jusqu’à 5x et une traduction en streaming (20 langues).
- Apple SpeechAnalyzer Zero Setup, qui repose sur la reconnaissance vocale native d’Apple avec gestion des modèles par macOS (donc sans téléchargements manuels), mais avec une exigence indiquée : macOS 26+.
Ce trio illustre bien l’objectif : choisir entre rapidité, précision, couverture linguistique, ou simplicité “zéro réglage”. Pour des équipes ou des utilisateurs exigeants, cette flexibilité est un vrai argument : sur une même machine, vous pouvez privilégier la vitesse pour une dictée rapide, ou la précision pour de la transcription de long format, ou encore la compatibilité linguistique si vous jonglez entre plusieurs langues. TypeWhisper mentionne aussi des moteurs additionnels accessibles via add-ons, notamment Qwen3 ASR, Groq Whisper et OpenAI Whisper, ce qui laisse entendre une stratégie extensible : l’app sert d’interface et de workflow, et les moteurs deviennent des modules que l’on active selon ses contraintes.
Points clés
- Dictée “system-wide” sur macOS via hotkey global, insertion rapide et comportements configurables.
- Version 1.2 stable orientée vitesse de dictée, baisse du CPU au repos, et audio plus fiable.
- Fonctionnement privé par défaut : traitement local, sans télémétrie, sans abonnement, sans cloud obligatoire.
- Transcription de fichiers audio/vidéo, traitement en lot, export de sous-titres avec timestamps (SRT / WebVTT).
- Workflows avancés : prompts/actions, API locale, CLI et plugins pour automatiser.
- Profils par app/site, historique recherchable, dictionnaire de corrections et snippets.
- Choix de moteurs : WhisperKit, Parakeet TDT v3 Fast, Apple SpeechAnalyzer (macOS 26+), plus des add-ons (Qwen3 ASR, Groq Whisper, OpenAI Whisper).
Concrètement, à qui s’adresse TypeWhisper 1.2 sur Mac ? D’abord à celles et ceux qui veulent une dictée utilisable toute la journée, dans toutes les apps, sans friction. Si vous rédigez beaucoup (support, vente, produit, dev, management), la dictée system-wide permet de gagner du temps sur les messages, les notes de réunion, les to-do, ou les descriptions de tickets. Les profils par application deviennent alors un levier : vous pouvez imaginer un profil “email” avec un ton plus formel, un profil “chat” plus direct, un profil “docs” orienté phrases longues, ou un profil “IDE” davantage pensé pour les termes techniques et les acronymes.
Ensuite, TypeWhisper vise clairement les usages de transcription de contenu : créateurs, chercheurs, journalistes, coachs, podcasteurs, ou toute personne qui doit transformer de l’audio en texte exploitable. Le fait de pouvoir déposer des fichiers, lancer des batchs, et ressortir des sous-titres horodatés en formats standards (SRT/WebVTT) est un vrai gain de productivité, notamment pour publier rapidement, améliorer l’accessibilité, ou indexer des vidéos. L’historique et la recherche s’inscrivent dans la même logique : on ne transcrit pas juste pour “avoir du texte”, on transcrit pour retrouver, citer, découper, réutiliser.
La question implicite, que TypeWhisper pose lui-même, est : pourquoi ne pas utiliser la dictée intégrée ? La réponse proposée tient en plusieurs axes : profils par app, moteurs variés adaptés au besoin, gestion de fichiers audio/vidéo, export de sous-titres, et outillage d’historique/automatisation via API locale. Même si la dictée native est pratique, elle ne couvre pas toujours ces scénarios de bout en bout, et elle n’offre pas nécessairement la même granularité de réglages par contexte.
Enfin, il faut noter la stratégie de disponibilité : la voie “recommandée” est macOS 1.2 en stable, tandis que Windows est en bêta publique (Windows 10 et 11), et iOS en alpha via TestFlight, destinés à des tests précoces avec itérations rapides et polish en cours. Si vous travaillez en environnement mixte, c’est utile : vous pouvez adopter la solution stable sur Mac tout en gardant un œil sur l’écosystème Windows/iOS pour l’avenir, en acceptant que ces plateformes soient encore au stade preview.
Au final, TypeWhisper 1.2 sur macOS se positionne comme un outil “production-ready” pour la dictée privée et la transcription locale : un noyau de reconnaissance vocale, entouré de workflows (prompts, profils, historique, dictionnaire, snippets) et d’options moteurs pour adapter la performance, la précision et les langues. Si votre priorité est de garder la voix sur l’appareil, de réduire les frictions de dictée dans toutes vos apps, et de passer de l’audio au texte réutilisable (y compris en sous-titres), la proposition est particulièrement cohérente.
