Ouvrir le menu principal

MacGeneration

Recherche

VLC pourrait intégrer Whisper pour des sous-titres automatisés

Pierre Dandumont

jeudi 21 décembre 2023 à 21:30 • 23

Logiciels

Nous vous parlons régulièrement de Whisper, un logiciel open source conçu par OpenAI pour transcrire fidèlement de l'audio en texte. Et bien ce programme pourrait être intégré à VLC pour proposer des fonctions de transcription plus évoluée.

Si vous lancez VLC cette semaine, vous pourrez profiter de cette icône.

Le projet en cours se base sur whisper.cpp, une implémentation en C/C++ qui a gagné récemment des optimisations pour les GPU Apple. Il y a évidemment quelques (grosses) étapes à franchir : Whisper se base sur des modèles qui peuvent être assez volumineux et a besoin d'une dizaine de secondes d'audio au minimum pour fonctionner, ce qui nécessite quelques ajustements dans le décodage des vidéos. Pour le moment, l'implémentation nécessite de fournir un modèle et pose quelques soucis à la compilation, pour une raison simple : Whisper nécessite macOS 13 au minimum et VLC est compilé pour des versions plus anciennes de macOS.

Les différents essais menés par Gabriel Lafond-Thenaille n'amèneront pas nécessairement une intégration dans VLC dans le futur, mais l'idée reste intéressante pour amener de nouvelles fonctions dans le logiciel libre.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

L'écran pour Mac qui coche toutes les cases : 32”, 4K, 144 Hz et Thunderbolt 4 !

09:00

• 0


Le 2 nm s’annonce salé : Apple pourrait payer (beaucoup) plus cher ses puces A20 pour l'iPhone 18 Pro

08:31

• 2


Sam Sung, l’employé d’Apple devenu célèbre malgré lui, raconte son histoire douze ans plus tard

07:27

• 1


DMA : Apple attaque la Commission européenne en justice

22/10/2025 à 22:15

• 87


GM va supprimer CarPlay de toutes ses voitures, y compris les véhicules thermiques

22/10/2025 à 21:30

• 64


YouTube renforce la traque aux deepfakes avec un outil de détection pour les créateurs de contenu

22/10/2025 à 21:00

• 7


Avec le MacBook Pro M5, Apple est passé au PCI-Express 5.0 pour le SSD, ce qui double les débits

22/10/2025 à 20:30

• 5


Apple pourrait lancer un tout nouvel iPhone chaque année pendant trois ans

22/10/2025 à 20:21

• 38


Une nouvelle bande-annonce pour Pluribus sur Apple TV+, parce que Vince Gilligan n'a pas eu le mémo sur l'abandon du +

22/10/2025 à 19:03

• 6


Moins de transparence dans Liquid Glass : chronique d'un rétropédalage annoncé

22/10/2025 à 17:29

• 94


ChatGPT connait des lenteurs actuellement

22/10/2025 à 17:07

• 7


Les chiffres se suivent et se ressemblent : l’iPhone Air ne trouve pas son public 🆕

22/10/2025 à 16:45

• 111


Quand le Mac (re)devient le laboratoire du logiciel moderne

22/10/2025 à 12:27

• 14


Samsung Galaxy XR : un Vision Pro à moitié prix avec l’écosystème de Google et Netflix en prime

22/10/2025 à 11:51

• 59


Menu Drop : un raccourci pratique pour AirDrop dans la barre des menus

22/10/2025 à 11:50

• 8


Apple Vision Pro M5 : un casque plus confortable, mais toujours trop cher et trop lourd

22/10/2025 à 06:34

• 35