Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Stéphane Moussie

mardi 28 novembre 2023 à 22:53 • 38

L'épatant Whisper, le modèle de reconnaissance de langage d’OpenAI qui transcrit fidèlement l'audio en texte, devient encore un peu plus épatant grâce à une optimisation technique significative. whisper.cpp, son populaire portage en C/C++, a depuis peu gagné une prise en charge complète du GPU sur l'architecture Apple Silicon. À la clé, une amélioration drastique des performances.

Le créateur de l'application MacWhisper, qui vient d'implémenter whisper.cpp 1.5, communique sur une durée de traitement divisée par deux ou trois. Nous avons fait un essai sur un MacBook Air M1 avec un épisode de notre podcast Sortie de veille d'une durée de 16 min 30 et le modèle Medium (lent mais avec une excellente reconnaissance) ainsi que la détection automatique de la langue.

Durée de traitement d'un podcast dans deux versions différentes de MacWhisper

Avec la version 5.7 de MacWhisper qui s'appuie sur le CPU (le logiciel s'accapare 400 % du CPU) et le Neural Engine, la transcription complète a demandé 7 min 47. La même opération avec la version 6.0 de MacWhisper qui tire parti du GPU (le CPU n'est quasiment plus utilisé) ne prend plus que 3 min 28. La durée d'analyse est bien divisée par plus de deux, une sacrée différence qui peut inciter à utiliser un modèle plus volumineux (plus efficace en matière de reconnaissance, mais plus lent à faire tourner) qu'on ne le faisait jusqu'à présent.

Au passage, l'effort d'intégration de MacWhisper à macOS se poursuit avec la possibilité d'utiliser son clavier pour contrôler l'audio et la présence de l'app dans le menu multimédia de la barre des menus.

Hello Transcribe, une autre application qui se démarque par sa compatibilité iPhone/iPad en plus du Mac, a elle aussi été mise à jour récemment avec whisper.cpp 1.5. Son développeur annonce une amélioration des performances de 400 % avec un modèle large sur un Mac M1 Max et de 100 % avec un modèle médium sur un iPhone 14 Pro.

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Rejoignez le Club iGen

Actualités

La communication d’Apple est stricte... mais à quel point ?

Les contenus pour adultes bloqués en grande partie sur X à cause du Royaume-Uni

Apple contre-attaque : “Nos choix sont au service des utilisateurs, pas contre la concurrence”

Les sex-toys connectés de Lovense laissent fuiter l'adresse email des utilisateurs

Vous adorez les tableurs ? Cette app en glisse gratuitement un dans la barre des menus de macOS

Un disque dur externe de 20 To en promotion à 313 €

Apple met en avant un smartphone pliable sur Weibo… mais ce n’est pas un iPhone [🆕 : l'erreur vient de Weibo]

La Nintendo Switch 2 est à 440 € sur Amazon, en stock

Un nouvel écran 5K chez Philips, avec du Thunderbolt 4 et un prix correct

Photoshop permet enfin d’agrandir une image sans (trop) perdre en qualité, grâce à l’IA bien sûr

Fuite de cerveaux chez Apple : un quatrième chercheur IA part chez Meta

Une déclinaison spéciale MacGeneration pour l'iPhone 17 Pro ?

Safari 26 bêta disponible pour macOS Sequoia et Sonoma

Elgato lance une webcam 4K avec des filtres amovibles

Vacances connectées : un climatiseur portable et autonome pour rafraîchir la tente

Soirée mise à jour chez Apple : iOS 18.6, iPadOS 18.6, macOS 15.6, watchOS 11.6 et cie sont disponibles au téléchargement

Image du moment

Tests

Test du fauteuil Flexispot C7 Air : il n’y a que la maille qui m’aille

Test du Synology DS925+ : ça passe ou ça NAS

Test de la ScreenBar Halo 2 : une lampe d'écran à laquelle il ne manque que le Wi-Fi

Test du SSD externe Crucial X10, qui peut atteindre 8 To

Test de la BeeStation Plus : le NAS pour ceux qui ne veulent pas de NAS

Test du clavier Keychron V10 Max : Alice au pays de Corneille ?