Ouvrir le menu principal

MacGeneration

Recherche

Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Stéphane Moussie

mardi 28 novembre 2023 à 22:53 • 38

Logiciels

L'épatant Whisper, le modèle de reconnaissance de langage d’OpenAI qui transcrit fidèlement l'audio en texte, devient encore un peu plus épatant grâce à une optimisation technique significative. whisper.cpp, son populaire portage en C/C++, a depuis peu gagné une prise en charge complète du GPU sur l'architecture Apple Silicon. À la clé, une amélioration drastique des performances.

Le créateur de l'application MacWhisper, qui vient d'implémenter whisper.cpp 1.5, communique sur une durée de traitement divisée par deux ou trois. Nous avons fait un essai sur un MacBook Air M1 avec un épisode de notre podcast Sortie de veille d'une durée de 16 min 30 et le modèle Medium (lent mais avec une excellente reconnaissance) ainsi que la détection automatique de la langue.

Durée de traitement d'un podcast dans deux versions différentes de MacWhisper

Avec la version 5.7 de MacWhisper qui s'appuie sur le CPU (le logiciel s'accapare 400 % du CPU) et le Neural Engine, la transcription complète a demandé 7 min 47. La même opération avec la version 6.0 de MacWhisper qui tire parti du GPU (le CPU n'est quasiment plus utilisé) ne prend plus que 3 min 28. La durée d'analyse est bien divisée par plus de deux, une sacrée différence qui peut inciter à utiliser un modèle plus volumineux (plus efficace en matière de reconnaissance, mais plus lent à faire tourner) qu'on ne le faisait jusqu'à présent.

Au passage, l'effort d'intégration de MacWhisper à macOS se poursuit avec la possibilité d'utiliser son clavier pour contrôler l'audio et la présence de l'app dans le menu multimédia de la barre des menus.

Hello Transcribe, une autre application qui se démarque par sa compatibilité iPhone/iPad en plus du Mac, a elle aussi été mise à jour récemment avec whisper.cpp 1.5. Son développeur annonce une amélioration des performances de 400 % avec un modèle large sur un Mac M1 Max et de 100 % avec un modèle médium sur un iPhone 14 Pro.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

La communication d’Apple est stricte... mais à quel point ?

30/07/2025 à 21:30

• 9


Les contenus pour adultes bloqués en grande partie sur X à cause du Royaume-Uni

30/07/2025 à 19:20

• 11


Apple contre-attaque : “Nos choix sont au service des utilisateurs, pas contre la concurrence”

30/07/2025 à 18:15

• 31


Les sex-toys connectés de Lovense laissent fuiter l'adresse email des utilisateurs

30/07/2025 à 17:27

• 34


Vous adorez les tableurs ? Cette app en glisse gratuitement un dans la barre des menus de macOS

30/07/2025 à 17:11

• 14


Un disque dur externe de 20 To en promotion à 313 €

30/07/2025 à 14:55

• 10


Apple met en avant un smartphone pliable sur Weibo… mais ce n’est pas un iPhone [🆕 : l'erreur vient de Weibo]

30/07/2025 à 14:13

• 6


La Nintendo Switch 2 est à 440 € sur Amazon, en stock

30/07/2025 à 13:37

• 42


Un nouvel écran 5K chez Philips, avec du Thunderbolt 4 et un prix correct

30/07/2025 à 12:30

• 25


Photoshop permet enfin d’agrandir une image sans (trop) perdre en qualité, grâce à l’IA bien sûr

30/07/2025 à 12:08

• 14


Fuite de cerveaux chez Apple : un quatrième chercheur IA part chez Meta

30/07/2025 à 07:45

• 59


Une déclinaison spéciale MacGeneration pour l'iPhone 17 Pro ?

30/07/2025 à 06:52

• 52


Safari 26 bêta disponible pour macOS Sequoia et Sonoma

29/07/2025 à 23:15

• 8


Elgato lance une webcam 4K avec des filtres amovibles

29/07/2025 à 21:15

• 16


Vacances connectées : un climatiseur portable et autonome pour rafraîchir la tente

29/07/2025 à 20:39

• 48


Soirée mise à jour chez Apple : iOS 18.6, iPadOS 18.6, macOS 15.6, watchOS 11.6 et cie sont disponibles au téléchargement

29/07/2025 à 19:19

• 29