Ouvrir le menu principal

MacGeneration

Recherche

MacWhisper détecte qui parle dans la retranscription d'un enregistrement audio

Florian Innocente

vendredi 14 mars 2025 à 15:45 • 29

Logiciels

Retranscrire automatiquement en texte un contenu audio c'est bien, mais avoir une identification des personnes qui parlent est encore mieux. C'est moins de temps perdu lorsqu'on doit récupérer par écrit une interview, un podcast ou une conférence par exemple. On n'est plus obligé de réécouter certains passages lorsqu'on a un doute sur l'identité de leurs auteurs.

Un essai de détection automatique des intervenants. Image MacGeneration.

C'est cette possibilité d'identification automatique dont Whisper Transcription (ou MacWhisper) s'est doté. Le logiciel est une excellente trousse à outils pour la retranscription de contenus audio au moyen de modèles de langage. Un jour peut-être Apple intègrera de telles capacités dans son système, dans l'attente, ce sont de tels utilitaires qui font le travail.

Lors de notre test, MacWhisper s'en est globalement bien tiré avec un enregistrement audio de deux personnes (aux voix bien distinctes et dans un environnement sonore calme). Il y a bien eu quelques erreurs, obligeant à faire preuve d'attention, mais pas suffisamment pour que cela relègue cette fonction au rang de gadget. Pas besoin non plus d'avoir un Mac très récent, les générations M1 sont désormais utilisables (après une période de test qui les en avait écarté), ce sera plutôt une question de temps de traitement du fichier.

Cette fonction est réservée à la version Pro du logiciel. Celle-ci est proposée avec une licence perpétuelle de 59,99 € lorsqu'on a besoin fréquemment de cet outil. Pour des utilisations plus occasionnelles sur une durée limitée, le développeur a des formules d'abonnement à la semaine (5,99 €), au mois (8,99 €) ou à l'année (34,99 €).

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Apple a creusé l’idée de proposer des services de cloud computing aux développeurs pour concurrencer AWS

03/07/2025 à 21:45

• 14


Apple sort des fonds d’écran aux couleurs de son nouvel Apple Store à Osaka

03/07/2025 à 21:00

• 4


Test du ViewSonic ColorPro VP2788-5K : 27″, 5K et DCI-P3 pour le prix d’un demi-Studio Display

03/07/2025 à 20:30

• 8


Guerre commerciale : les produits fabriqués au Vietnam voient leur taxe multipliée par cinq

03/07/2025 à 20:20

• 12


Microsoft Office 2021 pour Mac à 49,99 € : une aubaine à ne pas rater pendant les soldes d’été 📍

03/07/2025 à 20:07

• 0


L’iPhone 17 Pro Max pourrait avoir une grosse batterie de 5 000 mAh

03/07/2025 à 19:50

• 30


Une extension Chrome et Firefox désactive le doublage par IA de YouTube

03/07/2025 à 17:14

• 17


Le générateur de vidéos Veo 3 est désormais disponible en France dans l’application Gemini

03/07/2025 à 16:00

• 1


Starlink pourrait amener un Wi-Fi plus rapide et plus fiable dans les TGV

03/07/2025 à 15:39

• 34


Les identifiants d’une quinzaine de futurs Mac en fuite

03/07/2025 à 15:15

• 19


L'utilitaire pour faire tourner des LLM en local Ollama devient une application native

03/07/2025 à 14:27

• 25


Apple rejoint discrètement Threads, le dernier réseau social de Meta

03/07/2025 à 13:30

• 5


NimDoor : des hackers nord-coréens ciblent des entreprises de crypto via le Mac

03/07/2025 à 11:57

• 7


Synology fait encore plus fort qu’Apple sur les prix des SSD

03/07/2025 à 10:46

• 60


Flitedeck : un CarPlay Ultra mais pour les vélos de route

03/07/2025 à 09:30

• 18


Promo : un switch Ethernet compact à moins de 15 €

03/07/2025 à 08:34

• 6