Ouvrir le menu principal

MacGeneration

Recherche

Thoth, une nouvelle app de transcription axée sur les réunions et le temps réel


Depuis l’arrivée des modèles Whisper d’OpenAI, transcrire des paroles en texte sur son Mac est devenu un jeu d’enfants. De nombreuses applications basées sur cette technologie qui tourne en local ont vu le jour, des plus simples aux plus avancées. Thoth est une nouvelle option qui se distingue en particulier par sa transcription en temps réel.

Ingénieur R&D, Matthieu Veinhard a développé cette application avant tout pour consigner ses réunions techniques en visioconférence, tout en restant concentré sur ses échanges avec ses collègues. De fait, Thoth permet de capturer et de transcrire l’audio du Mac, qu’il vienne d’une application, du micro ou bien des deux à la fois. Cela fonctionne sans installer de pilote virtuel.

Une transcription dans Thoth. Image MacGeneration.

Une fois la réunion terminée, la transcription complète est disponible presque immédiatement, puisqu’elle a été générée en continu pendant l’échange. L’application peut ensuite identifier les différents intervenants grâce à un traitement supplémentaire assuré, toujours en local, par PyAnnote. Un moteur de recherche est intégré et il est possible d’exporter aussi bien le texte que l’audio dans les formats courants.

Pour l’heure, Thoth s’appuie uniquement sur des modèles Whisper. On a le choix du plus petit, moins fiable mais qui tire peu sur le processeur, au plus gros, plus précis mais plus gourmand. Comme tout est exécuté en local, il faut une machine suffisamment puissante, mais n’importe quel Mac Apple Silicon s’en sort avec les petits modèles — j’ai testé l’application sur un MacBook Air M1 avec 16 Go de RAM.

Réglages de Thoth. Image MacGeneration.

Il manque malheureusement les modèles Parakeet de Nvidia et SpeechAnalyzer d’Apple, qui sont beaucoup plus efficaces que ceux d’OpenAI — la transcription est beaucoup plus rapide tout en étant aussi précise. Le développeur m’a indiqué que Parakeet devrait être intégré dans les prochaines semaines.

macOS 26 concurrence Whisper avec un modèle de transcription local et très rapide

macOS 26 concurrence Whisper avec un modèle de transcription local et très rapide

Thoth permet de télécharger d’autres modèles d’IA (Gemma, Llama, Qwen…) afin d’interagir directement avec la transcription, notamment pour générer des résumés. Tout est ainsi intégré à l’application. Cela peut être considéré comme un avantage par rapport à MacWhisper, qui nécessite une application supplémentaire (LM Studio, Ollama…) pour faire appel à une IA en local.

Le principal atout de Thoth, selon moi, est sa fenêtre de transcription en direct, qui affiche les paroles converties en texte en quasi temps réel. Pour un journaliste qui suit une conférence audio (celle d’Apple par hasard) et qui doit publier un article dans la foulée, c’est particulièrement pratique. La rapidité et la fiabilité de la transcription dépendent évidemment du modèle utilisé et de la puissance de l’ordinateur. Un Mac M1 fournit déjà un résultat convenable, même si davantage de puissance améliore nettement le confort. MacWhisper propose lui aussi un mode temps réel, mais il se révèle moins adapté à cet usage.

Transcription en temps réel dans Thoth. Image MacGeneration.

La version gratuite de Thoth est limitée à cinq enregistrements et à une durée maximale de 30 minutes au micro ou 15 minutes pour l’audio système, juste de quoi tester l’application. La version complète est facturée 9,99 €/mois ou 99 € en licence perpétuelle. L’application n’est pas encore traduite en français, mais cela va venir, et elle demande macOS 26 au minimum. Thoth souffre globalement de la comparaison avec MacWhisper, qui est moins cher et qui reste la référence du marché avec ses nombreuses options et optimisations. L’application est néanmoins prometteuse et intéressante dès à présent dans l’optique de transcriptions en direct.

Êtes-vous déçu par l'absence de Siri AI sur iPhone et iPad en Europe ?

10:14

• 47


"Le meilleur moment pour changer de smartphone, c'était hier"

09:42

• 6


iOS 27 coupe le cordon pour de bon avec son propre mode de récupération

09:11

• 30


Sortie de veille : une WWDC 2026 brillante ? Notre débrief d’iOS 27, Siri AI…

08:00

• 6


Avec macOS 27, Apple prépare déjà la fin de Rosetta 2 prévue dans macOS 28

07:00

• 6


ChatGPT sur Mac : l’app cessera de fonctionner ce soir sans mise à jour

12/06/2026 à 22:15

• 4


SpaceX entre en bourse : de For All Mankind à l’Homme qui valait mille milliards

12/06/2026 à 21:15

• 93


macOS 27 permet d'empêcher le bouton PlayStation ou Xbox de lancer l'app Jeux

12/06/2026 à 18:15

• 5


iOS 27 : une douzaine d’applications supplémentaires adoptent l’orientation paysage

12/06/2026 à 18:07

• 23


RAMpocalypse : les nouveaux VPS d’OVHcloud perdent beaucoup d’attrait

12/06/2026 à 16:21

• 24


Bon plan : le pack MX Master 3S et MX Keys S pour Mac tombe à 150 € (-21 %)

12/06/2026 à 15:49

• 0


Prise en main de Siri AI sous macOS 27 : enfin un Siri à la hauteur ?

12/06/2026 à 15:19

• 12


OpenAI veut populariser Codex avec un système de parrainage et des réinitialisations de quotas

12/06/2026 à 12:27

• 9


Bouygues Telecom fait payer son app b.tv pour Apple TV, 5 €/mois

12/06/2026 à 12:21

• 70


Natation : quand les lunettes viennent combler les lacunes de l’Apple Watch

12/06/2026 à 12:21

• 33


Logitech Mobi Fold : la souris qui se plie pour mieux voyager

12/06/2026 à 10:44

• 20