Ouvrir le menu principal

MacGeneration

Recherche

Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Stéphane Moussie

mardi 28 novembre 2023 à 22:53 • 38

Logiciels

L'épatant Whisper, le modèle de reconnaissance de langage d’OpenAI qui transcrit fidèlement l'audio en texte, devient encore un peu plus épatant grâce à une optimisation technique significative. whisper.cpp, son populaire portage en C/C++, a depuis peu gagné une prise en charge complète du GPU sur l'architecture Apple Silicon. À la clé, une amélioration drastique des performances.

Le créateur de l'application MacWhisper, qui vient d'implémenter whisper.cpp 1.5, communique sur une durée de traitement divisée par deux ou trois. Nous avons fait un essai sur un MacBook Air M1 avec un épisode de notre podcast Sortie de veille d'une durée de 16 min 30 et le modèle Medium (lent mais avec une excellente reconnaissance) ainsi que la détection automatique de la langue.

Durée de traitement d'un podcast dans deux versions différentes de MacWhisper

Avec la version 5.7 de MacWhisper qui s'appuie sur le CPU (le logiciel s'accapare 400 % du CPU) et le Neural Engine, la transcription complète a demandé 7 min 47. La même opération avec la version 6.0 de MacWhisper qui tire parti du GPU (le CPU n'est quasiment plus utilisé) ne prend plus que 3 min 28. La durée d'analyse est bien divisée par plus de deux, une sacrée différence qui peut inciter à utiliser un modèle plus volumineux (plus efficace en matière de reconnaissance, mais plus lent à faire tourner) qu'on ne le faisait jusqu'à présent.

Au passage, l'effort d'intégration de MacWhisper à macOS se poursuit avec la possibilité d'utiliser son clavier pour contrôler l'audio et la présence de l'app dans le menu multimédia de la barre des menus.

Hello Transcribe, une autre application qui se démarque par sa compatibilité iPhone/iPad en plus du Mac, a elle aussi été mise à jour récemment avec whisper.cpp 1.5. Son développeur annonce une amélioration des performances de 400 % avec un modèle large sur un Mac M1 Max et de 100 % avec un modèle médium sur un iPhone 14 Pro.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Elon Musk compte bien faire vivre un enfer juridique à OpenAI

13/02/2025 à 22:30

• 11


Google Maps bloque les commentaires et modifications sur le Golfe d’Amérique

13/02/2025 à 21:30

• 8


L'app France Identité est acceptée dans les TGV et Intercités pour le contrôle du billet

13/02/2025 à 20:16

• 31


Incogni : - 50 % sur l'abonnement annuel, c'est maintenant 📍

13/02/2025 à 18:43


Tim Cook annonce un nouveau produit pour le 19 février

13/02/2025 à 17:10

• 88


Porte dérobée d’iCloud : des législateurs américains vent debout contre la demande du gouvernement britannique

13/02/2025 à 16:30

• 8


SFR va bientôt abandonner son réseau câblé

13/02/2025 à 15:00

• 41


Frais de livraison des livres : une histoire sans fin entre Amazon et les libraires

13/02/2025 à 14:00

• 52


Civilization VII est désormais disponible sur Mac

13/02/2025 à 13:00

• 26


Les Mac M1 et M2 standard ne pourront pas faire tourner Assassin’s Creed Shadows

13/02/2025 à 11:45

• 70


Apple recommence à faire de la pub sur X

13/02/2025 à 10:31

• 90


Refurb : gros choix et fortes réductions pour les MacBook Pro M4 à M4 Max

13/02/2025 à 07:25

• 29


Chronopost se fait voler un gros fichier clients, contenant des signatures

12/02/2025 à 21:30

• 47


Apple lance sur Android son app TV avec Apple TV+

12/02/2025 à 21:21

• 23


Tesla en chute libre, la faute à Musk ?

12/02/2025 à 21:15

• 228


Le générateur de vidéos d’Adobe maintenant accessible à tous

12/02/2025 à 18:35

• 13