Adobe Enhance Speech améliore le rendu des enregistrements audio

Mickaël Bazoge |

L'intelligence artificielle ne sert pas qu'à créer des images rigolotes ou bizarres à partir de quelques mots. Ces technologies se montrent aussi bien utiles pour modifier et améliorer toutes sortes de documents. Pixelmator, par exemple, exploite le CoreML d'Apple pour agrandir les images sans trop de perte de qualité.

Adobe a décidé de s'intéresser au son, avec l'outil Enhance Speech développé dans le cadre du projet Shasta, rebaptisé simplement Adobe Podcast. Le principe est simple : le service prend un fichier audio pas terrible, avec du bruit et de l'écho, qu'il transforme en fichier exploitable dans un podcast. Petit exemple :

L'enregistrement de base avec un iPhone porté à bout de bras et avec la machine à laver qui tourne en fond.
Le résultat produit par Adobe Podcast.

Pas si mal, même s'il y a un côté un peu mécanique peut-être dans le résultat (il faut dire que le fichier de base n'est pas formidable). Cet outil pourrait néanmoins être d'un grand secours pour tous ceux qui veulent se lancer dans le podcast sans nécessairement avoir les logiciels (ou le savoir-faire, il n'y a pas de mal à apprendre) qu'il faut pour nettoyer des enregistrements.

L'utilisation est gratuite, mais il faut tout de même créer un compte Adobe (gratuit). Enhance Speech prend en charge les fichiers MP3 ou WAV d'une heure maximum (ou de 1 Go). Il est possible de télécharger le résultat. Les plus bidouilleurs pourront se diriger vers la solution open-source Mayavoz disponible sur GitHub.

Source
ArsTechnica. Vignette : Yoel J Gonzalez, Unsplash
avatar max intosh | 

Pas mal du tout comme résultat. Beaucoup de YouTubeurs devraient s’y mettre tant le son est parfois catastrophique, surtout quand il n’est pas pris avec un micro cravate.

avatar Mickaël Bazoge | 
Je pense qu'effectivement une petite passe dans cet outil d'Adobe améliorerait beaucoup les choses (je pense au podcast de Nanarland aussi, que j'adore mais qui est une catastrophe niveau enregistrement !).
avatar macbook60 | 

@MickaelBazoge

Moi ce son me rappeler quand j envoie un message audio sur whatsapp avec les AirPods ça soûl

avatar Sindanarie | 

@macbook60

En français avec avec une phrase complétée des mots qui manquent et mis dans le bon ordre ?

avatar macbook60 | 

@Sindanárië

Quand j’envoie un message audio sur WhatsApp par exemple avec les AirPods , le son est nul comme dans le 1er enregistrement avant la correction.

avatar Sindanarie | 

@macbook60

C’est souvent le cas de beaucoup de casques il semble. Mais c’est vrai que vu le prix des AirPods ils pourraient faire un effort ^^

avatar macbook60 | 

@Sindanárië

Je ne sais pas si c’est possible mais au moins pouvoir utiliser le micro de l’iPhone en gardant les AirPods dans les oreilles

avatar Mike Mac | 

Pour l'Intelligence Artificielle et la gestion de l'audio, on peut aussi télécharger Davinci Resolve 18 et profiter d'un même traitement.

Je cite, parmi les nouveautés du couteau suisse de l'édition vidéo :

L'isolation vocale basée sur l’IA

"L’effet d'isolation vocale basée sur l'IA vous permet de supprimer les sons forts et indésirables présents dans les enregistrements vocaux. En isolant les dialogues des bruits de fond dans un enregistrement, vous pouvez éliminer tout le reste (bruit modéré, avions, explosions, etc.), ne conservant ainsi que la voix. L'isolation vocale est parfaite pour les interviews et les enregistrements de dialogues dans des endroits bruyants".

Par ailleurs, toujours au service du son, on trouve :

Le niveleur de dialogue intégré

"Dans l’inspecteur, l’effet de niveleur de dialogue traite et lisse les dialogues sans avoir besoin d'ajustements de niveau fastidieux sur le gain du clip ou les courbes d'automation. Les commandes comprennent l'affichage du défilement en temps réel de la forme d'onde, les préréglages de mise au point et trois options de traitement qui vous permettent d'obtenir facilement des résultats sonores naturels".

Pour le reste, l'ensemble des nouveautés sont listées ici :

DaVinci Resolve Studio 18

https://www.blackmagicdesign.com/fr/products/davinciresolve/whatsnew

On ne devrait pas tarder à voir débarquer la version allégée pout l'iPad, il me semble.

avatar Gregoryen | 

C’est super propre ! Très bon outil à garder en cas d’urgence.

avatar Pierry | 

Je comprends toujours pas pourquoi certain youtubeur s'obstinent à ne pas utiliser ce genre d'accessoire pour abri piscine : https://www.mrtravaux.net/abri-piscine/

avatar calotype | 

@Pierry

Ou pourquoi YouTube depuis toutes ces années n’a pas développé cette option….
Par contre, comme à la télé, et malgré que ce soit maintenant illégal, ils savent très bien balancer les pubs avec un niveau sonore toujours un cran plus haut que celui du contenu…

avatar cv21 | 

Si cela peut rendre service à celles et ceux qui réalisent des podcast, il existe depuis longtemps le traitement en ligne d'Auphonic (2 heures de sons traités gratuits par mois).

Plus récent et issu des traitements audio pour la radio, Audyllic d'Orban (1h/mois) malheureusement l'ancien stereo tool gratuit ne l'est plus. Après, il y a des tas de plug-in "audio denoiser" plus ou moins simples et surtout compatibles à long terme, reaper en propose un.

Sans oublier RX d'Izotope, Hindenburg, le traitement de Final Cut (vraiment pas mal) mais là on s'éloigne un peu du service en ligne.

Dans l'ensemble, le recours à l'IA pour cette fonction facilite leur usage. C'est un point de vue.

avatar Marius_K | 

C'est vraiment très bien.
Mais même sans ça on peut faire des enregistrements très propres avec du matériel de base.
C'est donc d'autant plus incompréhensible que tant de podcasts ou de vidéos ont un son absolument ignoble...

avatar occam | 

En plus des outils cités, il y en a un, moins connu, mais qui mériterait de l’être :
https://acondigital.com/products/extract-dialogue/

Extract:Dialogue, plugin universel VST3/AAX/AU (natif sur Apple Silicon) de chez Acon Digital, merveilleuse petite boîte norvégienne.
Exemples en bas du lien ; 30 jours à l’essai.

Acon l’offre parfois en bundle avec ses suites Mastering ou Restoration, comprenant son éditeur audio Acoustica.
https://acondigital.com/products/acoustica-audio-editor/

Attention toutefois, Acoustica et les plugins de Acon sont addictifs : simples, rapides, élégants, on ne s’en passe plus.
J’ai tout iZotope RX et Ozone (que j’aime), mais si je débutais aujourd’hui, c’est par une suite Acon Acoustica que je commencerais, et pas sûr d’avoir besoin de bien plus.

Extract:Dialogue fonctionne également en amont, à la prise de son (avis aux podcasteurs pressés, ou astreints au live). Prenez le cas cauchemar : interview/commentaire live dans un local de misère. Vous n’avez qu’un Wave:3 et Elgato Wave Link sur votre portable Mac/PC. Avec le plugin Extract:Dialogue inséré dans Wave Link, il y a des chances de sauver le direct et d’émettre quelque chose de compréhensible.

CONNEXION UTILISATEUR