Ouvrir le menu principal

MacGeneration

Recherche

macOS 26 concurrence Whisper avec un modèle de transcription local et très rapide

Nicolas Furno

mercredi 18 juin 2025 à 09:40 • 36

macOS

Apple a modernisé son API de transcription de l’audio en texte avec les mises à jour annuelles et SpeechAnalyser, c’est le nom de la nouvelle génération, peut désormais concurrencer Whisper, le modèle de transcription proposé par OpenAI. Un développeur a mis au point un utilitaire pour le terminal nommé Yap pour l’exploiter sous macOS Tahoe et les résultats sont impressionnants. Cette transcription réalisée entièrement en local sur les Mac équipés d’une puce Apple Silicon est non seulement bien plus rapide que celle de Whisper, elle propose une qualité à la hauteur de son illustre concurrent.

Transcription en cours avec Yap. Image MacGeneration.

Pour tester la nouveauté, j’ai utilisé un MacBook Pro M1 passé sous macOS 26. Yap doit être installé avec un gestionnaire de paquets comme Homebrew et il fonctionne ensuite directement, puisqu’il est basé sur un modèle fourni par Apple et intégré au système. En face, j’ai utilisé MacWhisper, une excellente app qui permet de télécharger le modèle Whisper pour réaliser une transcription locale. J’ai téléchargé le dernier épisode de Sortie de Veille, notre podcast hebdomadaire, soit un fichier audio d’un petit peu plus de 26 minutes.

Sur cet ordinateur, le moins puissant des Mac Apple Silicon, Yap a terminé sa tâche en environ 16 secondes. Avec le même fichier et MacWhisper, le temps d’exécution dépend des modèles, mais il est systématiquement supérieur. Avec le modèle « Base », le plus léger (150 Mo) et rapide, il a fallu une minute et dix secondes, tandis que le modèle « Large V3 Turbo » (1,6 Go) que j’utilise au quotidien a demandé 4 minutes et 23 secondes. Apple utilise un modèle compact, tout en offrant de très bons résultats, car il faut aussi comparer la qualité de la transcription.

Alors qu’il est extrêmement rapide, SpeechAnalyser a produit un fichier d’excellente qualité, comparable au modèle large de Whisper, mais ce dernier est seize fois plus lent ! En comparaison, le modèle de base fourni par OpenAI reste plus lent que celui d’Apple et ses résultats sont bien plus mauvais, à la limite de l’exploitable. La copie fournie par Yap n’est pas parfaite, on note notamment qu’elle a du mal sur les noms de produits (ce sont pourtant des produits Apple…) comme « Liquid Glass » ou encore « WWDC », elle reste toutefois bien supérieure, tout en étant obtenue bien plus rapidement.

La transcription fournie par le modèle « Base » de Whisper en arrière plan et celle du modèle d’Apple au premier plan. Image MacGeneration.

Whisper reprend à peine l’avantage si vous avez le temps, le grand modèle donne un résultat subjectivement un petit peu meilleur, même si la différence n’est pas aussi importante que je l’imaginais alors que le temps de traitement n’a rien à voir. Il faut aussi penser aux ressources nécessaires : si j’ai utilisé ici un petit fichier audio, il faut savoir que vous aurez besoin d’une quantité de RAM d’autant plus importante que la transcription est longue. Sur cet exemple facile, je note déjà une différence importante entre les deux : le modèle d’Apple n’utilise qu’environ 350 Mo de mémoire, contre 2,2 Go environ pour MacWhisper (avec le modèle large).

Si vous voulez tester ce nouveau concurrent à Whisper, vous devrez installer macOS Tahoe sur un Mac Apple Silicon, puis installer Yap :

brew install finnvoor/tools/yap

Vous pourrez ensuite l’utiliser avec une ligne de commande de ce type :

yap audio.mp3 -o texte.txt

La documentation liste quelques options disponibles, on peut notamment générer un fichier de sous-titres au format SRT et on peut pointer le service sur une vidéo en entrée. On peut même combiner l’outil à yt-dlp pour transcrire des vidéos en ligne sans les télécharger en local. On imagine que de nombreuses apps proposeront une interface graphique, plus conviviale, pour utiliser SpeechAnalyser d’ici la sortie de macOS 26.

Pour en savoir plus sur la nouvelle API, Apple propose aux développeurs une session technique qui détaille comment l’exploiter dans une app. Apple l’utilise elle-même dans plusieurs apps, dont Notes, Dictaphone, Journal ou encore Téléphone. iOS 26 permettra de transcrire l’anglais (britannique et américain), le français (uniquement en France), l’allemand, le portugais (Brésil) et l’espagnol (Espagne) et on peut sans doute compter sur la même liste de langages pour l’API sous-jacente.

Source :

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

Apple miserait sur Gemini pour relancer Siri

10:07

• 4


Grâce aux aides, la Model Y Standard tourne autour des 37 000 € en France et devient une excellente affaire

09:56

• 8


Pas de nouveaux Mac avant 2026 ?

08:11

• 5


Semaine chargée pour Apple : iOS 26.1 dès ce soir ? iOS 26.2 dans la foulée...

07:44

• 7


Un anniversaire très chargé, la bascule à l’OLED et Gemini sous le capot : la semaine Apple

02/11/2025 à 20:30

• 22


Le MacBook Air M1 tombe à moins de 430 € avec le code HALLOWEEN40

02/11/2025 à 12:37

• 0


Elon Musk annonce une démonstration d’ici la fin de l’année du Tesla Roadster... volant ?

02/11/2025 à 11:00

• 159


Les promos Apple s’emballent : iPhone et iPad (Pro) et Apple Watch Ultra 2 à prix cassés

02/11/2025 à 09:03

• 40


Fin de Windows 10 : notre nouvelle série sur le Club iGen pour surmonter cette épreuve

02/11/2025 à 08:05

• 33


Fin de Windows 10 : une transition vers Windows 11 qui vire au fiasco

02/11/2025 à 08:00

• 29


Tests, série, analyses… Les articles du Club iGen publiés en octobre

01/11/2025 à 15:00

• 4


Sortie de veille : comment Apple bat de nouveaux records financiers

01/11/2025 à 08:00

• 20


Sam Altman, frustré, annule sa commande de Tesla Roadster et se prend un mur

31/10/2025 à 21:00

• 140


Votre iPhone 18 Pro, vous le prendrez plutôt café, violet ou bordeaux ?

31/10/2025 à 17:13

• 59


Cette extension pour Chrome reprend une idée populaire d’Arc pour changer d’onglet

31/10/2025 à 15:20

• 7


Le gouvernement américain voudrait bannir TP-Link pour des raisons de sécurité nationale

31/10/2025 à 11:30

• 28